Hasty Briefsbeta

双语

Chess Llama – Training a tiny Llama model to play chess

10 months ago
  • #AI
  • #Chess
  • #Machine Learning
  • Chess Llama是一个受Chess GPT启发而开发的微型Llama模型,专为国际象棋对弈设计。
  • 该模型基于Llama 3架构,使用Lichess精英数据库(2019-2023年)的300万局棋谱进行训练。
  • 采用UCI坐标记谱法表示棋局,这与Chess GPT使用的PGN记谱法不同。
  • 模型词汇表包含1974个标记,每个标记对应UCI记谱法中的一个棋步。
  • 训练细节:5个训练周期,批量大小16,在Google Cloud Vertex AI平台的Nvidia L4 GPU上耗时18小时。
  • 性能表现:Elo评分1350-1400分区间,合法走子率达99.1%。
  • 棋力表现优于Stockfish 0级别,但不及更高配置的Stockfish版本。
  • 可通过Transformers.js交互演示,支持通过采样调整控制难度级别。
  • 未来研究方向包括分析模型如何追踪棋盘状态演变。