Hasty Briefsbeta

双语

Polar Factor Beyond Newton-Schulz – Fast Matrix Inverse Square Root

2 months ago
  • #matrix computation
  • #machine learning
  • #numerical methods
  • 文章讨论了高矩阵正交极因子的计算方法,重点探讨了牛顿-舒尔茨迭代之外的替代方案。
  • 关键技术包括极小极大多项式、雅可比预处理和数值稳定性的在线验证。
  • 重点介绍了μ优化器(与带动量的signSGD或Lion相似)在机器学习中的实证成功。
  • 目标是通过近似动量矩阵奇异值的符号函数来高效计算极因子。
  • 文章强调需要实现快速GPU计算、bf16格式的数值稳定性,以及对接近1的奇异值进行验证。
  • 提出两阶段方案:第一阶段包含安全缩放和全局极小极大步骤,第二阶段侧重采用对称环绕1步骤的激进局部优化。
  • 该方法涉及构建格拉姆矩阵、应用无偏预处理,并使用重启块保障bf16格式下的稳定性。
  • 建议通过预计算表格在线选择系数,以优化性能和稳定性。
  • 文章最后给出极因子计算的完整算法,包含验证步骤和可选优化环节。