Olmo 3: Charting a path through the model flow to lead open-source AI

6 months ago

Olmo 3推出了完全开放的模型流程，包含数据集、代码和权重，以增强AI开发的透明度和可定制性
Olmo 3系列包含多款模型：基础版Olmo 3-Base（7B/32B）、推理专用Olmo 3-Think（7B/32B）、指令微调版Olmo 3-Instruct（7B）以及强化学习版Olmo 3-RL Zero（7B），分别针对推理、指令跟随等任务优化
Olmo 3-Base（32B）被强调为当前最强的全开放基础模型，在编程、阅读理解和数学解题方面表现突出
Olmo 3-Think（32B）是顶尖的开放推理模型，在数学、编程和通用推理任务中可与主流模型竞争
本次发布包含完整训练数据（Dolma 3和Dolci）及工具链（OlmoTrace/Olmo-core/Open Instruct），支持研究复现与深度开发
Olmo 3强调透明度设计，用户可追溯模型输出至训练数据，并能在任意阶段修改开发流程
该系列模型注重效率优化，通过训练吞吐量提升和训后流程改进，适配多种硬件配置

Hasty Briefsbeta