Hasty Briefsbeta

双语

Arc Prize 2025 Results and Analysis: Year of the Refinement Loop

5 months ago

#Benchmarking
#AI
#AGI

ARC Prize第二届大赛以大奖空缺告终，但公布了2025年ARC Prize评分奖与论文奖得主。
1,455支团队在Kaggle竞赛中提交了15,154份作品，最高得分模型在ARC-AGI-2基准上以每任务0.2美元成本达到24%准确率。
论文投稿量从去年的47篇增至90篇，奖项扩容增设5个亚军和8个荣誉提名。
所有获奖方案与论文均已开源。
商业前沿AI系统和定制模型优化方案取得进展，顶尖模型在ARC-AGI-2上达到54%准确率。
ARC-AGI现已被所有主流AI实验室（OpenAI、xAI、Anthropic、Google DeepMind）用作前沿AI推理能力基准。
迭代优化循环成为AGI发展的核心主题，实现了程序的渐进式优化。
Tiny Recursive Models（TRM）和CompressARC等突破性进展以极简参数量实现高精度。
Gemini 3 Pro和Claude Opus 4.5等商业AI推理系统展现出优化能力，显著提升任务可靠性。
ARC-AGI-3正在开发中，聚焦交互式推理与效率指标，计划2026年初发布。
ARC Prize强调开放AGI发展路径，将持续追踪可复现解决方案的进展。
基准测试面临新型'过拟合'挑战——AI系统逐渐适应任务格式。
ARC-AGI-3将通过需要新型AI能力的设计应对这些挑战。
ARC Prize团队向贡献者、赞助方及社区的支持与奉献致谢。