Hasty Briefsbeta

双语

GPT-OSS 120B Runs at 3000 tokens/sec on Cerebras

6 months ago
  • #AI
  • #Machine Learning
  • #OpenAI
  • OpenAI的GPT OSS 120B模型现已在Cerebras平台上线,提供高精度的开放权重推理能力。
  • 该模型在Cerebras推理云上运行速度高达每秒3,000个token,显著快于GPU方案。
  • GPT OSS 120B在思维链任务、代码生成、数学推理和健康咨询领域表现卓越。
  • Cerebras提供首发日支持,速度比主流GPU云快15倍且保持低延迟。
  • 该模型具备高性价比,以不足两倍的成本提供中位数GPU云16倍的推理速度。
  • GPT OSS 120B是当前美国训练的最强开放权重推理模型。
  • 可通过Cerebras云及HuggingFace、OpenRouter、Vercel等合作伙伴平台获取。