Hasty Briefsbeta

双语

The latest AI scaling graph – and why it hardly makes sense

a year ago
  • #AI
  • #Critique
  • #Scaling
  • METR发布了一项关于AI在软件相关任务中表现的研究,其数据图表在网络上迅速走红
  • 该图表纵轴采用人类解决问题耗时来衡量AI性能,被批评为存在主观随意性和方法论缺陷
  • METR的技术报告表述严谨,但社交媒体传播夸大了研究结论,超出了原始研究范围
  • 软件任务数据集构建完善,但可能无法推广到其他认知领域
  • 从该图表外推AI能力被认为存在误导性,指数级增长的假设并不可靠
  • 在AI领域,投资者比实际开发者更容易出现确认偏误和炒作现象