Hasty Briefsbeta

双语

Skywork-OR1: new SOTA 32B thinking model with open weight

a year ago
  • #AI Models
  • #Open Source
  • #Machine Learning
  • 天工OR1系列模型发布,包含Skywork-OR1-Math-7B、Skywork-OR1-32B-Preview和Skywork-OR1-7B-Preview三款模型
  • 开源模型权重、训练数据(即将发布)及代码
  • 发布Notion技术博客,详述训练方案、实验结果与洞见
  • Skywork-OR1-Math-7B专攻数学推理,在AIME24获69.8分/AIME25获52.3分
  • Skywork-OR1-32B-Preview在数学与代码任务上媲美Deepseek-R1
  • Skywork-OR1-7B-Preview在同等规模模型中数学与代码表现领先
  • 正式版将于两周内发布
  • 评估体系包含AIME24、AIME25及采用Avg@K提升可靠性的LiveCodeBench
  • 提供多模型详细性能对比表
  • 附Docker与Conda环境配置指南
  • 训练脚本将于1-2日内发布
  • 提供AIME24/AIME25/LiveCodeBench复现脚本
  • 技术报告即将发布
  • 模型基于DeepSeek-R1-Distill-Qwen-7B/32B训练
  • 附天工开放推理器系列引用规范