Hasty Briefsbeta

双语

Hierarchical Reasoning Model – 1k training samples SoTA reasoning v/s CoT

10 months ago

#AI
#Machine Learning
#Reasoning Models

层次推理模型(HRM)作为一种新型循环架构被引入，专门用于AI推理任务。
HRM通过两个相互依赖的模块运行：高层模块负责抽象规划，底层模块处理细节计算。
仅用2700万参数，HRM在极少量训练数据(1000个样本)下就能在复杂推理任务中取得卓越表现。
在衡量通用人工智能的基准测试ARC(抽象与推理语料库)中，HRM的表现超越了参数量更大的模型。
安装需要PyTorch、CUDA以及FlashAttention等额外软件包以确保GPU兼容性。
训练涉及数独、ARC和迷宫求解任务的数据集，针对不同GPU配置提供具体命令。
评估包括在Weights & Biases平台检查精确准确率，并使用提供的Jupyter笔记本进行详细分析。
该模型记录于关望等人2025年发表在arXiv的论文《层次推理模型》中。