Hasty Briefsbeta

双语

DeepSeek-v3.2

6 months ago
  • #AI
  • #Machine Learning
  • #DeepSeek-V3.2
  • DeepSeek-V3.2 引入了三项关键技术突破:DeepSeek 稀疏注意力机制(DSA)、可扩展强化学习框架和大规模代理任务合成流程。
  • DeepSeek-V3.2-Speciale 变体在推理能力上超越 GPT-5,与 Gemini-3.0-Pro 持平。
  • 在 2025 年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)中取得金牌级表现。
  • 新版对话模板更新了工具调用功能,并新增「工具辅助思考」能力。
  • 包含兼容 OpenAI 格式的 Python 脚本,用于消息编码与解析。
  • 本地部署推荐参数:temperature = 1.0,top_p = 0.95。
  • DeepSeek-V3.2-Speciale 专为深度推理任务优化,暂不支持工具调用功能。
  • 采用 MIT 开源协议授权。