Hasty Briefsbeta

双语

Alibaba Cloud claims to reduce Nvidia GPU use by 82%

7 months ago
  • #AI
  • #GPU Optimization
  • #Cloud Computing
  • 阿里云新系统Aegaeon将英伟达GPU使用量降低82%
  • Aegaeon在阿里云模型市场测试中,所需GPU从1192个缩减至213个
  • 该系统可更高效服务数十个大语言模型(LLM)
  • 研究人员指出并发LLM工作负载存在过高成本问题
  • 多数GPU利用率不足,17.7%的GPU仅处理1.35%的请求
  • 全球正通过集中GPU算力池提升效率