Hasty Briefsbeta

双语

Codex, Opus, Gemini Try to Build Counter Strike

6 months ago

#AI Models
#Multiplayer
#Game Development

测试了三大AI模型更新：Gemini 3 Pro、Codex Max 5.1和Claude Opus 4.5
挑战任务是构建《反恐精英》基础版多人3D用户界面
Claude Opus 4.5在前端任务中表现突出，设计了视觉效果出色的地图、角色和枪械
Gemini 3 Pro在后台任务中表现最佳，处理多人联机和数据持久化时错误更少
Codex Max 5.1表现均衡，在前端和后台任务中都有不错发挥
每个模型连续接收7组提示，任务分为前端（游戏机制）和后台（多人联机功能）
Claude的设计更具视觉吸引力，而Gemini的逻辑改动更稳健
Codex初期存在一些漏洞但修复迅速，不过视觉效果稍逊
所有模型都成功构建出零手写代码的多人FPS游戏，展示了迭代能力
实验暴露出需要改进的领域，例如更好地处理React hooks、降低非程序员用户的学习曲线