Hasty Briefsbeta

双语

Poetiq shatters ARC-AGI 2 benchmark at half the cost

5 months ago

#AI
#Machine Learning
#ARC-AGI

Poetiq的系统已通过官方验证，在ARC-AGI-2半私有测试集上表现优于现有方法，创造了新的最先进水平。
该系统以每个问题30.57美元的成本实现了54%的成功率，超越了此前45%成功率（每个问题77.16美元）的最佳记录。
Poetiq的元系统通过利用现有前沿模型来优化解决方案，无需构建或微调新模型。
该元系统能从每个解决的任务中学习，随时间不断改进，并可集成到更大的AI系统中。
Poetiq正在探索通过增强知识提取机制（无需模型调优）来解决长期视野任务的潜力。
团队由6名来自Google DeepMind的经验丰富的研究人员和工程师组成，专注于AI推理和知识提取领域的挑战。