Cerebras now supports OpenAI GPT-OSS-120B at 3k Tokens Per SEC
9 months ago
- #Cerebras
- #AI
- #OpenAI
- Cerebras Systems宣布支持OpenAI的gpt-oss-120B模型推理,实现每秒3000个token的破纪录速度
- gpt-oss-120B模型性能媲美Gemini 2.5 Flash和Claude Opus 4等顶级专有模型,兼具速度优势、成本效益和开源特性
- Cerebras晶圆级AI基础设施消除了GPU瓶颈,能以空前速度实现全模型推理
- 开发者无需重构即可无缝切换至Cerebras驱动的gpt-oss-120B,即时获得高性能AI能力
- OpenAI的Apache 2.0许可证允许用户自由微调模型、本地部署或跨云迁移
- Cerebras云平台提供gpt-oss-120B免费API接口,支持实时编程助手、文档问答和快速研究链开发