Hasty Briefsbeta

双语

Poetiq shatters ARC-AGI 2 benchmark at half the cost

5 months ago
  • #AI
  • #Machine Learning
  • #ARC-AGI
  • Poetiq的系统已通过官方验证,在ARC-AGI-2半私有测试集上表现优于现有方法,创造了新的最先进水平。
  • 该系统以每个问题30.57美元的成本实现了54%的成功率,超越了此前45%成功率(每个问题77.16美元)的最佳记录。
  • Poetiq的元系统通过利用现有前沿模型来优化解决方案,无需构建或微调新模型。
  • 该元系统能从每个解决的任务中学习,随时间不断改进,并可集成到更大的AI系统中。
  • Poetiq正在探索通过增强知识提取机制(无需模型调优)来解决长期视野任务的潜力。
  • 团队由6名来自Google DeepMind的经验丰富的研究人员和工程师组成,专注于AI推理和知识提取领域的挑战。