Hasty Briefsbeta

双语

Show HN: ART – a new open-source RL framework for training agents

a year ago

#LLM
#reinforcement-learning
#open-source

ART是一个开源的强化训练库，旨在提升LLM在智能体工作流中的性能表现
它采用GRPO强化学习算法，让模型基于自身经验进行训练
与大多数RL库不同，ART允许在现有代码库中直接执行，同时在后端处理复杂的RL训练逻辑
ART采用客户端(兼容OpenAI)-服务器(GPU机器运行)的架构设计
客户端与您的代码库对接，服务器则负责处理推理和训练的技术复杂性
训练循环包含推理阶段(轨迹生成、消息存储、奖励分配)和训练阶段(GRPO算法、LoRA参数更新)
当前支持大多数兼容vLLM/HuggingFace-transformers的模型，暂不支持Gemma 3
作为Alpha版本，ART诚邀开发者通过Discord或GitHub提交贡献与反馈
特别鸣谢开源RL社区及合作伙伴的测试支持与技术贡献