Hasty Briefsbeta

双语

The Universal Weight Subspace Hypothesis

5 months ago
  • #neural-networks
  • #machine-learning
  • #spectral-analysis
  • 跨任务训练的深度神经网络展现出相似的低维参数子空间
  • 实证研究表明,无论初始化方式、任务或领域如何,神经网络都会收敛到共享的谱子空间
  • 对1100多个模型的模态谱分析发现:少数主方向上的通用子空间可捕获大部分方差
  • 谱分解技术揭示了跨任务和数据集持续被利用的稀疏联合子空间
  • 该发现为理解深度网络内部信息的内在组织方式及模型复用性、效率带来新启示
  • 有望通过训练和推理高效算法降低大规模神经网络的碳足迹