Hasty Briefsbeta

双语

Modular 25.4: One Container, AMD and Nvidia GPUs, No Lock-In

a year ago
  • #AI
  • #GPU
  • #Modular
  • Modular Platform 25.4版本正式支持AMD GPU(包括MI300X和MI325X),实现无缝移植与性能优化
  • 性能提升方面:在AMD MI300X上,BF16工作负载的前填充阶段吞吐量较vLLM提升最高达53%,解码密集型BF16工作负载吞吐量提升最高达32%
  • 扩展的模型支持涵盖GGUF量化版Llama、Qwen3、OLMo2和Gemma3模型,显著增强平台的多功能性
  • 通过统一导航系统和新Python-Mojo绑定工具优化文档体系与开发者体验,实现更便捷的集成
  • 开源超过45万行Mojo内核及服务代码,诚邀社区为MAX AI内核库贡献力量
  • 社区活动包括Modular黑客周末和漫画《GPU驯兽师》发布,旨在活跃开发者生态