Qwen3-Coder: Agentic Coding in the World
10 months ago
- #AI
- #Machine Learning
- #Coding
- 宣布推出Qwen3-Coder-480B-A35B-Instruct模型,这是一个拥有4800亿参数、350亿活跃参数的混合专家模型。
- 原生支持256K tokens的上下文长度,通过外推方法可扩展至100万tokens。
- 在代理编程、代理浏览器使用和代理工具使用方面创造了新的最先进成果。
- 开源Qwen Code命令行工具(基于Gemini Code适配),用于代理编程。
- 预训练阶段的突破包括:扩展训练token量(7.5万亿token,其中70%为代码)、上下文长度及合成数据。
- 后训练阶段专注于代码强化学习和长周期强化学习,以应对现实编程任务和多轮交互。
- 提供Qwen Code和Claude Code的安装使用说明。
- 通过阿里云Model Studio的API接入方式(附Python示例)。
- 未来计划包括:提升编程代理性能、发布更多参数规模的模型、探索自我改进机制。