Hasty Briefsbeta

双语

Qwen3-Coder-30B-A3B-Instruct

10 months ago
  • #AI
  • #Qwen3
  • #Coding
  • Qwen3-Coder-30B-A3B-Instruct模型在代理编程和浏览器任务中展现出卓越性能
  • 具备256K tokens原生长文本处理能力,通过Yarn技术可扩展至1M tokens
  • 模型参数总量30.5B,激活参数3.3B,包含48层网络结构和32个注意力头
  • 支持非思考模式运行,不生成<think></think>逻辑块
  • 提供transformers库的快速入门指南,包含内容生成的代码示例
  • 通过工具调用示例展示代理编程能力
  • 推荐采样参数:temperature=0.7, top_p=0.8, top_k=20, repetition_penalty=1.05以获得最佳效果
  • 可引用Qwen3技术报告作为文献参考