Hasty Briefsbeta

双语

OpenAI's new open weight (Apache 2) models are good

9 months ago

#AI
#Machine Learning
#OpenAI

OpenAI在Apache 2.0许可证下发布了新的开源权重模型：gpt-oss-120b和gpt-oss-20b
gpt-oss-120b在推理基准测试中接近专有模型o4-mini的水平，可在80GB GPU上运行
gpt-oss-20b性能匹配o3-mini，适用于内存16GB的边缘设备
两个模型均采用混合专家架构，每token分别激活51亿和36亿参数
模型在博士级科学问题（GPQA Diamond基准）上表现优异
gpt-oss-20b在32GB内存的Mac上高效运行，推理时占用约12GB内存
模型支持可调节的推理级别（低/中/高），影响速度与准确性
推出新型提示模板格式OpenAI Harmony，包含系统/开发者/用户/助手/工具五种角色
模型基于数万亿token训练，侧重STEM/编程/通识领域，内置安全过滤器
训练成本估算：gpt-oss-120b约420-2310万美元，gpt-oss-20b约42-230万美元
支持工具调用功能，包括网页浏览/Python执行/开发者自定义函数
性能媲美近期中国开源模型（Qwen/Moonshot/Z.ai），部分指标可能更优