Claude Sonnet 4.6

3 months ago

#AI
#Claude Sonnet
#Machine Learning

Claude Sonnet 4.6是迄今为止最强大的Sonnet模型，在编码、计算机操作、长上下文推理等方面均有升级
该模型测试版具备100万token上下文窗口，现已成为claude.ai和Claude Cowork平台免费版及专业版的默认模型
定价与Sonnet 4.5保持一致，每百万token起价3/15美元
改进的编码能力、一致性和指令遵循性使开发者更青睐Sonnet 4.6，某些场景下甚至优于Claude Opus 4.5
计算机操作能力显著提升，在复杂电子表格导航、多步骤网页表单填写等任务中达到人类水平
在安全评估中，Sonnet 4.6对提示注入攻击表现出与Opus 4.6相当的强大抵抗力
各项基准测试性能提升，以更实用价格接近Opus级别的智能水平
早期测试显示，在Claude Code中70%用户更倾向Sonnet 4.6，因其更好的上下文阅读和逻辑整合能力
100万token上下文窗口支持跨整个代码库、长篇合同或数十篇研究论文的有效推理
在前端代码、财务分析、视觉输出和设计感方面提升显著，减少生产级成果所需的迭代次数
在OfficeQA测试中达到Opus 4.6水平，大幅提升文档理解工作负载能力
擅长复杂代码修复、错误检测和大规模代理编码，具有高解决率和一致性
首个以更小体积、更具成本效益形式提供前沿推理能力的Sonnet模型
答案检索能力显著改进，在金融服务基准测试中特定工作流召回率更高
在Box评估的重度推理QA中表现优于Sonnet 4.5达15个百分点
保险基准测试94%通过率，成为关键任务工作流中计算机操作性能最佳模型
在复杂应用构建和错误修复方面达到前沿水平，成为深度代码库工作的首选
为Rakuten AI生成的iOS代码测试表现最佳，规范符合性、架构和现代工具使用更优
在分支多步骤任务（如合同路由、条件模板选择、CRM协调）中表现强劲
构建前端页面和数据报告时展现完美设计品味，减少人工干预需求
对指令响应极其精准，能提供精确数据、结构化对比并生成实用创意
在Claude开发者平台测试版中支持适应性思维、扩展思维和上下文压缩
API更新包含自动代码执行功能以过滤搜索结果，提升响应质量和token效率
Opus 4.6仍是需要深度推理任务（如代码库重构、多代理协调）的最佳选择
Excel版Claude现支持MCP连接器，可整合S&P Global、LSEG、FactSet等工具
该模型适用于所有Claude套餐、Claude Cowork、Claude Code、API及主要云平台，免费层默认升级至Sonnet 4.6

Hasty Briefsbeta

Claude Sonnet 4.6