Hasty Briefsbeta

双语

Neural Thermodynamic Laws for Large Language Model Training

a year ago
  • #Machine Learning
  • #Thermodynamics
  • #Large Language Models
  • 引入神经热力学定律(NTL)以理解大语言模型训练动态
  • 在河谷式损失景观假设下热力学量及原理涌现的理论证明
  • 从热力学视角推导学习率调度的实践指南
  • 提及arXivLabs框架——由社区驱动的arXiv功能开发体系