Hasty Briefsbeta

双语

Tongyi DeepResearch: A New Era of Open-Source AI Researchers

8 months ago
  • #AI Agents
  • #OpenSource
  • #DeepResearch
  • 通义深度研究(Tongyi DeepResearch)是首个全开源的Web智能体,在多项基准测试中达到与OpenAI DeepResearch相当的性能水平。
  • 实现突破性指标:HLE得分32.9、BrowseComp 43.4、中文版BrowseComp-ZH 46.7、xbench-DeepSearch 75分。
  • 完整公开高级智能体方法论,涵盖创新数据合成、Agentic CPT、监督微调(SFT)和强化学习(RL)全阶段。
  • 推出AgentFounder框架实现可扩展数据合成,构建实体锚定的开放世界知识记忆系统。
  • 通过自动化流水线生成高质量合成QA数据对,显著提升AI智能体性能。
  • 采用ReAct和IterResearch框架实现监督微调冷启动,完成智能体能力初始构建。
  • 支持双模式部署:原生ReAct模式与Heavy Mode(迭代研究范式)。
  • 提出Research-Synthesis框架,实现并行化研究智能体探索与知识合成。
  • 建立端到端智能体训练管线:Agentic CPT → Agentic SFT → Agentic RL。
  • 创新采用基于策略的组相对策略优化(GRPO)进行RL训练,确保稳定高效的训练过程。
  • 开发合成训练环境与稳定工具沙箱,为智能体训练提供可靠基础设施。
  • 已赋能高德Mate(导航智能体)、通义法睿(法律研究智能体)等实际应用。
  • 当前局限:128k上下文长度限制、大模型扩展性及RL效率有待提升。
  • 属于深度研究智能体技术体系,已发布多份技术报告。
  • 开源Tongyi DeepResearch-30B-A3B模型,并规划下一代智能体模型研发。