Hasty Briefsbeta

双语

Show HN: ART – a new open-source RL framework for training agents

a year ago
  • #LLM
  • #reinforcement-learning
  • #open-source
  • ART是一个开源的强化训练库,旨在提升LLM在智能体工作流中的性能表现
  • 它采用GRPO强化学习算法,让模型基于自身经验进行训练
  • 与大多数RL库不同,ART允许在现有代码库中直接执行,同时在后端处理复杂的RL训练逻辑
  • ART采用客户端(兼容OpenAI)-服务器(GPU机器运行)的架构设计
  • 客户端与您的代码库对接,服务器则负责处理推理和训练的技术复杂性
  • 训练循环包含推理阶段(轨迹生成、消息存储、奖励分配)和训练阶段(GRPO算法、LoRA参数更新)
  • 当前支持大多数兼容vLLM/HuggingFace-transformers的模型,暂不支持Gemma 3
  • 作为Alpha版本,ART诚邀开发者通过Discord或GitHub提交贡献与反馈
  • 特别鸣谢开源RL社区及合作伙伴的测试支持与技术贡献