Hasty Briefsbeta

双语

DeepSeek releases 'sparse attention' model that cuts API costs in half

8 months ago
  • #DeepSeek
  • #AI
  • #InferenceCosts
  • DeepSeek发布了一款名为V3.2-exp的实验性新模型,可降低长文本推理成本
  • 该模型采用DeepSeek稀疏注意力技术,通过'闪电索引器'和'细粒度token选择系统'优化服务器负载
  • 初步测试表明在长文本场景下API调用成本最高可降低50%
  • 该模型为开源权重模型,已登陆Hugging Face平台供第三方验证
  • DeepSeek致力于改进Transformer架构效率以降低推理成本
  • 这家中国公司曾因R1模型引发关注,后逐渐淡出公众视野
  • 新型稀疏注意力技术或有助于美国供应商降低推理成本