Poetiq shatters ARC-AGI 2 benchmark at half the cost
5 months ago
- #AI
- #Machine Learning
- #ARC-AGI
- Poetiq的系统已通过官方验证,在ARC-AGI-2半私有测试集上表现优于现有方法,创造了新的最先进水平。
- 该系统以每个问题30.57美元的成本实现了54%的成功率,超越了此前45%成功率(每个问题77.16美元)的最佳记录。
- Poetiq的元系统通过利用现有前沿模型来优化解决方案,无需构建或微调新模型。
- 该元系统能从每个解决的任务中学习,随时间不断改进,并可集成到更大的AI系统中。
- Poetiq正在探索通过增强知识提取机制(无需模型调优)来解决长期视野任务的潜力。
- 团队由6名来自Google DeepMind的经验丰富的研究人员和工程师组成,专注于AI推理和知识提取领域的挑战。