Hasty Briefsbeta

双语

Sutton and Barto Book Implementation

a year ago
  • #algorithms
  • #python
  • #reinforcement-learning
  • 代码库实现了Sutton著作中的强化学习算法
  • 按模块组织,涵盖多臂老虎机、策略评估、时序差分等主题
  • 包含仅需状态、动作和转移函数的无模型求解器
  • 提供示例:单状态无限方差示例5.5
  • 蒙特卡洛树搜索(MCTS)通过迷宫求解进行演示
  • 代码基础未优化,欢迎改进
  • 适合从零开始学习强化学习