Codex, Opus, Gemini Try to Build Counter Strike
6 months ago
- #AI Models
- #Multiplayer
- #Game Development
- 测试了三大AI模型更新:Gemini 3 Pro、Codex Max 5.1和Claude Opus 4.5
- 挑战任务是构建《反恐精英》基础版多人3D用户界面
- Claude Opus 4.5在前端任务中表现突出,设计了视觉效果出色的地图、角色和枪械
- Gemini 3 Pro在后台任务中表现最佳,处理多人联机和数据持久化时错误更少
- Codex Max 5.1表现均衡,在前端和后台任务中都有不错发挥
- 每个模型连续接收7组提示,任务分为前端(游戏机制)和后台(多人联机功能)
- Claude的设计更具视觉吸引力,而Gemini的逻辑改动更稳健
- Codex初期存在一些漏洞但修复迅速,不过视觉效果稍逊
- 所有模型都成功构建出零手写代码的多人FPS游戏,展示了迭代能力
- 实验暴露出需要改进的领域,例如更好地处理React hooks、降低非程序员用户的学习曲线