Hasty Briefsbeta

双语

Cerebras Launches Qwen3-235B, Achieving 1,500 Tokens per Second

10 months ago

#AI
#Code Generation
#Machine Learning

Cerebras Systems发布了Qwen3-235B，这是全球最快的尖端AI模型，完整支持131K上下文长度
Qwen3-235B以30倍的速度和1/10的成本提供生产级代码生成能力，优于闭源替代方案
该模型利用Cerebras的晶圆级引擎技术，实现了每秒1,500个token的前所未有的处理速度
Qwen3-235B支持131K上下文长度，可高效处理大型代码库和复杂文档
Cerebras与Cline合作将Qwen系列模型集成至微软VS Code，提供更快的代码生成速度
该模型定价为每百万输入token 0.6美元，每百万输出token 1.2美元，远低于竞争对手
Cerebras的解决方案避免了分布式计算的复杂性，使大型AI模型部署更便捷