Tongyi DeepResearch: A New Era of Open-Source AI Researchers

8 months ago

#AI Agents
#OpenSource
#DeepResearch

通义深度研究（Tongyi DeepResearch）是首个全开源的Web智能体，在多项基准测试中达到与OpenAI DeepResearch相当的性能水平。
实现突破性指标：HLE得分32.9、BrowseComp 43.4、中文版BrowseComp-ZH 46.7、xbench-DeepSearch 75分。
完整公开高级智能体方法论，涵盖创新数据合成、Agentic CPT、监督微调（SFT）和强化学习（RL）全阶段。
推出AgentFounder框架实现可扩展数据合成，构建实体锚定的开放世界知识记忆系统。
通过自动化流水线生成高质量合成QA数据对，显著提升AI智能体性能。
采用ReAct和IterResearch框架实现监督微调冷启动，完成智能体能力初始构建。
支持双模式部署：原生ReAct模式与Heavy Mode（迭代研究范式）。
提出Research-Synthesis框架，实现并行化研究智能体探索与知识合成。
建立端到端智能体训练管线：Agentic CPT → Agentic SFT → Agentic RL。
创新采用基于策略的组相对策略优化（GRPO）进行RL训练，确保稳定高效的训练过程。
开发合成训练环境与稳定工具沙箱，为智能体训练提供可靠基础设施。
已赋能高德Mate（导航智能体）、通义法睿（法律研究智能体）等实际应用。
当前局限：128k上下文长度限制、大模型扩展性及RL效率有待提升。
属于深度研究智能体技术体系，已发布多份技术报告。
开源Tongyi DeepResearch-30B-A3B模型，并规划下一代智能体模型研发。

Hasty Briefsbeta

Tongyi DeepResearch: A New Era of Open-Source AI Researchers