Hasty Briefsbeta

双语

Absolute Zero Reasoner

a year ago
  • #AI
  • #Machine Learning
  • #Autonomous Reasoning
  • 绝对零点范式通过让模型自主提出任务、解决问题并通过自我博弈学习,消除了对人类标注数据的依赖。
  • AZR(绝对零点推理机)是该范式的首个实现,使用统一语言模型来处理基于代码的推理挑战的提出与解决。
  • AZR在三种推理模式下运行:演绎推理(预测输出)、溯因推理(推断输入)和归纳推理(合成程序)。
  • 实验结果表明AZR在不同模型规模(30亿到140亿参数)上均表现提升,参数更大的模型增益更显著。
  • AZR展现出强大的跨领域迁移能力,其编程技能能放大数学任务中的推理改进效果。
  • AZR训练过程中涌现出差异化认知行为,如分步推理和试错法,这些行为因任务类型而异。
  • 研究发现某些基础模型存在安全隐患,凸显未来工作需要加强安全意识训练。