DeepSeek-v3.2
6 months ago
- #AI
- #Machine Learning
- #DeepSeek-V3.2
- DeepSeek-V3.2 引入了三项关键技术突破:DeepSeek 稀疏注意力机制(DSA)、可扩展强化学习框架和大规模代理任务合成流程。
- DeepSeek-V3.2-Speciale 变体在推理能力上超越 GPT-5,与 Gemini-3.0-Pro 持平。
- 在 2025 年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)中取得金牌级表现。
- 新版对话模板更新了工具调用功能,并新增「工具辅助思考」能力。
- 包含兼容 OpenAI 格式的 Python 脚本,用于消息编码与解析。
- 本地部署推荐参数:temperature = 1.0,top_p = 0.95。
- DeepSeek-V3.2-Speciale 专为深度推理任务优化,暂不支持工具调用功能。
- 采用 MIT 开源协议授权。