Sutton and Barto Book Implementationa year ago#algorithms#python#reinforcement-learninghttps://github.com/ivanbelenky/RLCopy Link代码库实现了Sutton著作中的强化学习算法按模块组织,涵盖多臂老虎机、策略评估、时序差分等主题包含仅需状态、动作和转移函数的无模型求解器提供示例:单状态无限方差示例5.5蒙特卡洛树搜索(MCTS)通过迷宫求解进行演示代码基础未优化,欢迎改进适合从零开始学习强化学习