Letting Claude Play Text Adventures
4 months ago
- #CognitiveArchitectures
- #AI
- #TextAdventures
- 参加了一场专注于机械解释的AI黑客马拉松,但由于PyTorch知识有限,最终在API层面进行开发。
- 探索了认知架构(Soar、ACT-R)及其为LLMs提供支架以提升性能的潜力。
- 选择文字冒险游戏作为评估任务,因其具有结构化、长视野特性,并以《Anchorhead》作为测试案例。
- 开发了一个Python封装器来与dfrotz文字冒险游戏解释器交互。
- 实现了一个简单的LLM智能体(SimplePlayer),通过聊天历史与游戏互动,但面临高昂的token成本问题。
- 尝试用记忆约束机制降低token消耗,但观察到任务完成性能下降。
- 创建了更小型的自定义游戏来测试智能体表现,但发现其效果不如《Anchorhead》等复杂游戏。
- 提出未来改进方向,如领域特定记忆、自动/手动地理追踪和情景记忆模块。