DeepSeek-v3.1 Release
9 months ago
- #DeepSeek
- #AI
- #MachineLearning
- DeepSeek-V3.1 引入混合推理模式,包含 Think(思考)与 Non-Think(非思考)两种模式。
- 相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 模式能提供更快速的回答。
- 增强的智能体能力,包括改进的工具使用和多步骤任务处理。
- API 更新:区分非思考模式(deepseek-chat)与思考模式(deepseek-reasoner)。
- 支持 128K 上下文长度及 Anthropic API 格式兼容。
- Beta API 现已支持严格的函数调用功能。
- 在 SWE / Terminal-Bench 基准测试和多步骤推理任务中表现提升。
- V3.1 Base 模型通过 8400 亿 token 的持续预训练扩展上下文能力。
- 更新分词器与对话模板,开源模型权重已发布。
- 新定价将于 2025 年 9 月 5 日生效,此前维持现有价格不变。