Skywork-OR1: new SOTA 32B thinking model with open weight
a year ago
- #AI Models
- #Open Source
- #Machine Learning
- 天工OR1系列模型发布,包含Skywork-OR1-Math-7B、Skywork-OR1-32B-Preview和Skywork-OR1-7B-Preview三款模型
- 开源模型权重、训练数据(即将发布)及代码
- 发布Notion技术博客,详述训练方案、实验结果与洞见
- Skywork-OR1-Math-7B专攻数学推理,在AIME24获69.8分/AIME25获52.3分
- Skywork-OR1-32B-Preview在数学与代码任务上媲美Deepseek-R1
- Skywork-OR1-7B-Preview在同等规模模型中数学与代码表现领先
- 正式版将于两周内发布
- 评估体系包含AIME24、AIME25及采用Avg@K提升可靠性的LiveCodeBench
- 提供多模型详细性能对比表
- 附Docker与Conda环境配置指南
- 训练脚本将于1-2日内发布
- 提供AIME24/AIME25/LiveCodeBench复现脚本
- 技术报告即将发布
- 模型基于DeepSeek-R1-Distill-Qwen-7B/32B训练
- 附天工开放推理器系列引用规范