Hasty Briefsbeta

双语

Professors Staffed a Fake Company with AI Agents, Guess What Happened?

a year ago

#Technology
#AI
#Job Security

AI技术奇点并非当前就业的即时威胁，因为现有AI尚不具备有效执行复杂任务的能力。
卡内基梅隆大学一项实验模拟了完全由AI代理组成的虚假软件公司，这些AI在现实任务中表现糟糕。
表现最佳的AI模型Anthropic Claude 3.5 Sonnet仅完成24%的任务，且单任务成本高达6美元以上。
谷歌Gemini 2.0 Flash成功率11.4%，而亚马逊Nova Pro v1仅完成1.7%的分配任务。
AI代理普遍缺乏常识判断、社交技能、网络导航能力，并存在自我欺骗倾向，常因创建错误捷径导致任务失败。
当前AI更类似于高级版预测性文本工具，而非具备解决问题和从经验中学习能力的感知型智能体。
研究表明，与科技巨头的宣传相反，AI尚不具备在复杂岗位上取代人类的能力。