Professors Staffed a Fake Company with AI Agents, Guess What Happened?
a year ago
- #Technology
- #AI
- #Job Security
- AI技术奇点并非当前就业的即时威胁,因为现有AI尚不具备有效执行复杂任务的能力。
- 卡内基梅隆大学一项实验模拟了完全由AI代理组成的虚假软件公司,这些AI在现实任务中表现糟糕。
- 表现最佳的AI模型Anthropic Claude 3.5 Sonnet仅完成24%的任务,且单任务成本高达6美元以上。
- 谷歌Gemini 2.0 Flash成功率11.4%,而亚马逊Nova Pro v1仅完成1.7%的分配任务。
- AI代理普遍缺乏常识判断、社交技能、网络导航能力,并存在自我欺骗倾向,常因创建错误捷径导致任务失败。
- 当前AI更类似于高级版预测性文本工具,而非具备解决问题和从经验中学习能力的感知型智能体。
- 研究表明,与科技巨头的宣传相反,AI尚不具备在复杂岗位上取代人类的能力。