- 新加坡人工智能初创公司Sapient Intelligence开发的层级推理模型(HRM)是一种新型AI架构,在复杂推理任务中表现优于大语言模型(LLM),同时具有更小规模和更高数据效率。
- HRM灵感源自人类大脑运用不同系统处理慢速缜密规划与快速直觉计算的机制,相比LLM能以更少数据和内存实现惊艳效果。
- 当前LLM依赖的思维链(CoT)提示法存在脆弱性、高数据需求等局限,常导致响应迟缓冗长。
- HRM采用'潜在推理'机制,无需显性语言生成即可内部推演,类似人类思维模式,有效规避梯度消失和早熟收敛等问题。
- HRM由两个耦合模块组成:负责抽象规划的高层(H)模块与执行快速计算的底层(L)模块,无需海量数据即可实现深度推理。
- 在ARC-AGI、极限数独和困难迷宫等基准测试中,HRM以极少训练数据实现近完美准确率,全面超越最先进的CoT模型。
- HRM的高效能显著降低成本并提升速度,特别适合机器人等延迟敏感领域及科研探索等数据稀缺场景。
- Sapient Intelligence正将HRM发展为通用推理模块,在医疗健康、气候预测和机器人等领域展现出广阔应用前景。