Tongyi DeepResearch: A New Era of Open-Source AI Researchers
8 months ago
- #AI Agents
- #OpenSource
- #DeepResearch
- 通义深度研究(Tongyi DeepResearch)是首个全开源的Web智能体,在多项基准测试中达到与OpenAI DeepResearch相当的性能水平。
- 实现突破性指标:HLE得分32.9、BrowseComp 43.4、中文版BrowseComp-ZH 46.7、xbench-DeepSearch 75分。
- 完整公开高级智能体方法论,涵盖创新数据合成、Agentic CPT、监督微调(SFT)和强化学习(RL)全阶段。
- 推出AgentFounder框架实现可扩展数据合成,构建实体锚定的开放世界知识记忆系统。
- 通过自动化流水线生成高质量合成QA数据对,显著提升AI智能体性能。
- 采用ReAct和IterResearch框架实现监督微调冷启动,完成智能体能力初始构建。
- 支持双模式部署:原生ReAct模式与Heavy Mode(迭代研究范式)。
- 提出Research-Synthesis框架,实现并行化研究智能体探索与知识合成。
- 建立端到端智能体训练管线:Agentic CPT → Agentic SFT → Agentic RL。
- 创新采用基于策略的组相对策略优化(GRPO)进行RL训练,确保稳定高效的训练过程。
- 开发合成训练环境与稳定工具沙箱,为智能体训练提供可靠基础设施。
- 已赋能高德Mate(导航智能体)、通义法睿(法律研究智能体)等实际应用。
- 当前局限:128k上下文长度限制、大模型扩展性及RL效率有待提升。
- 属于深度研究智能体技术体系,已发布多份技术报告。
- 开源Tongyi DeepResearch-30B-A3B模型,并规划下一代智能体模型研发。