Hasty Briefsbeta

双语

Sapients paper on the concept of Hierarchical Reasoning Model

10 months ago
  • #Hierarchical Reasoning
  • #Machine Learning
  • #Artificial Intelligence
  • 当前大型语言模型(LLMs)主要采用思维链(CoT)技术,但存在任务分解脆弱、数据需求高、延迟明显等局限性。
  • 分层推理模型(HRM)作为一种新型循环架构被提出,其灵感来源于人脑的分层多时间尺度信息处理机制。
  • HRM由两个相互依存的循环模块组成:高层模块负责缓慢的抽象规划,底层模块处理快速的细节计算。
  • 仅需2700万参数和1000个训练样本,HRM无需预训练或CoT数据即可在复杂推理任务中表现卓越。
  • HRM在数独难题求解、大型迷宫最优路径寻找等高难度任务中近乎完美表现。
  • 在人工通用智能关键测试ARC(抽象推理语料库)上,HRM以更短上下文窗口超越参数量更大的模型。
  • HRM的成果标志着向通用计算和通用推理系统迈出了突破性的一步。