Hasty Briefsbeta

双语

Sutton and Barto Book Implementation

a year ago

#algorithms
#python
#reinforcement-learning

代码库实现了Sutton著作中的强化学习算法
按模块组织，涵盖多臂老虎机、策略评估、时序差分等主题
包含仅需状态、动作和转移函数的无模型求解器
提供示例：单状态无限方差示例5.5
蒙特卡洛树搜索(MCTS)通过迷宫求解进行演示
代码基础未优化，欢迎改进
适合从零开始学习强化学习