Hasty Briefsbeta

双语

Professors Staffed a Fake Company with AI Agents, Guess What Happened?

a year ago
  • #Technology
  • #AI
  • #Job Security
  • AI技术奇点并非当前就业的即时威胁,因为现有AI尚不具备有效执行复杂任务的能力。
  • 卡内基梅隆大学一项实验模拟了完全由AI代理组成的虚假软件公司,这些AI在现实任务中表现糟糕。
  • 表现最佳的AI模型Anthropic Claude 3.5 Sonnet仅完成24%的任务,且单任务成本高达6美元以上。
  • 谷歌Gemini 2.0 Flash成功率11.4%,而亚马逊Nova Pro v1仅完成1.7%的分配任务。
  • AI代理普遍缺乏常识判断、社交技能、网络导航能力,并存在自我欺骗倾向,常因创建错误捷径导致任务失败。
  • 当前AI更类似于高级版预测性文本工具,而非具备解决问题和从经验中学习能力的感知型智能体。
  • 研究表明,与科技巨头的宣传相反,AI尚不具备在复杂岗位上取代人类的能力。