Skywork-OR1: new SOTA 32B thinking model with open weight

a year ago

天工OR1系列模型发布，包含Skywork-OR1-Math-7B、Skywork-OR1-32B-Preview和Skywork-OR1-7B-Preview三款模型
开源模型权重、训练数据（即将发布）及代码
发布Notion技术博客，详述训练方案、实验结果与洞见
Skywork-OR1-Math-7B专攻数学推理，在AIME24获69.8分/AIME25获52.3分
Skywork-OR1-32B-Preview在数学与代码任务上媲美Deepseek-R1
Skywork-OR1-7B-Preview在同等规模模型中数学与代码表现领先
正式版将于两周内发布
评估体系包含AIME24、AIME25及采用Avg@K提升可靠性的LiveCodeBench
提供多模型详细性能对比表
附Docker与Conda环境配置指南
训练脚本将于1-2日内发布
提供AIME24/AIME25/LiveCodeBench复现脚本
技术报告即将发布
模型基于DeepSeek-R1-Distill-Qwen-7B/32B训练
附天工开放推理器系列引用规范

Hasty Briefsbeta