Show HN: ART – a new open-source RL framework for training agents
a year ago
- #LLM
- #reinforcement-learning
- #open-source
- ART是一个开源的强化训练库,旨在提升LLM在智能体工作流中的性能表现
- 它采用GRPO强化学习算法,让模型基于自身经验进行训练
- 与大多数RL库不同,ART允许在现有代码库中直接执行,同时在后端处理复杂的RL训练逻辑
- ART采用客户端(兼容OpenAI)-服务器(GPU机器运行)的架构设计
- 客户端与您的代码库对接,服务器则负责处理推理和训练的技术复杂性
- 训练循环包含推理阶段(轨迹生成、消息存储、奖励分配)和训练阶段(GRPO算法、LoRA参数更新)
- 当前支持大多数兼容vLLM/HuggingFace-transformers的模型,暂不支持Gemma 3
- 作为Alpha版本,ART诚邀开发者通过Discord或GitHub提交贡献与反馈
- 特别鸣谢开源RL社区及合作伙伴的测试支持与技术贡献