Hasty Briefsbeta

双语

Letting Claude Play Text Adventures

4 months ago

#CognitiveArchitectures
#AI
#TextAdventures

参加了一场专注于机械解释的AI黑客马拉松，但由于PyTorch知识有限，最终在API层面进行开发。
探索了认知架构（Soar、ACT-R）及其为LLMs提供支架以提升性能的潜力。
选择文字冒险游戏作为评估任务，因其具有结构化、长视野特性，并以《Anchorhead》作为测试案例。
开发了一个Python封装器来与dfrotz文字冒险游戏解释器交互。
实现了一个简单的LLM智能体（SimplePlayer），通过聊天历史与游戏互动，但面临高昂的token成本问题。
尝试用记忆约束机制降低token消耗，但观察到任务完成性能下降。
创建了更小型的自定义游戏来测试智能体表现，但发现其效果不如《Anchorhead》等复杂游戏。
提出未来改进方向，如领域特定记忆、自动/手动地理追踪和情景记忆模块。