Claude Sonnet 4.6
3 months ago
- #AI
- #Claude Sonnet
- #Machine Learning
- Claude Sonnet 4.6是迄今为止最强大的Sonnet模型,在编码、计算机操作、长上下文推理等方面均有升级
- 该模型测试版具备100万token上下文窗口,现已成为claude.ai和Claude Cowork平台免费版及专业版的默认模型
- 定价与Sonnet 4.5保持一致,每百万token起价3/15美元
- 改进的编码能力、一致性和指令遵循性使开发者更青睐Sonnet 4.6,某些场景下甚至优于Claude Opus 4.5
- 计算机操作能力显著提升,在复杂电子表格导航、多步骤网页表单填写等任务中达到人类水平
- 在安全评估中,Sonnet 4.6对提示注入攻击表现出与Opus 4.6相当的强大抵抗力
- 各项基准测试性能提升,以更实用价格接近Opus级别的智能水平
- 早期测试显示,在Claude Code中70%用户更倾向Sonnet 4.6,因其更好的上下文阅读和逻辑整合能力
- 100万token上下文窗口支持跨整个代码库、长篇合同或数十篇研究论文的有效推理
- 在前端代码、财务分析、视觉输出和设计感方面提升显著,减少生产级成果所需的迭代次数
- 在OfficeQA测试中达到Opus 4.6水平,大幅提升文档理解工作负载能力
- 擅长复杂代码修复、错误检测和大规模代理编码,具有高解决率和一致性
- 首个以更小体积、更具成本效益形式提供前沿推理能力的Sonnet模型
- 答案检索能力显著改进,在金融服务基准测试中特定工作流召回率更高
- 在Box评估的重度推理QA中表现优于Sonnet 4.5达15个百分点
- 保险基准测试94%通过率,成为关键任务工作流中计算机操作性能最佳模型
- 在复杂应用构建和错误修复方面达到前沿水平,成为深度代码库工作的首选
- 为Rakuten AI生成的iOS代码测试表现最佳,规范符合性、架构和现代工具使用更优
- 在分支多步骤任务(如合同路由、条件模板选择、CRM协调)中表现强劲
- 构建前端页面和数据报告时展现完美设计品味,减少人工干预需求
- 对指令响应极其精准,能提供精确数据、结构化对比并生成实用创意
- 在Claude开发者平台测试版中支持适应性思维、扩展思维和上下文压缩
- API更新包含自动代码执行功能以过滤搜索结果,提升响应质量和token效率
- Opus 4.6仍是需要深度推理任务(如代码库重构、多代理协调)的最佳选择
- Excel版Claude现支持MCP连接器,可整合S&P Global、LSEG、FactSet等工具
- 该模型适用于所有Claude套餐、Claude Cowork、Claude Code、API及主要云平台,免费层默认升级至Sonnet 4.6