Hasty Briefsbeta

双语

IBM Granite 4.0

8 months ago
  • #AI
  • #Enterprise LLMs
  • #IBM Granite
  • Granite 4.0推出IBM新一代高效能企业级大语言模型(LLM)系列
  • 该系列模型专注于智能体工作流,在降低成本和延迟的同时保持竞争力
  • 包含多种规格型号(Micro/Tiny/Small),适配不同硬件条件
  • 基准测试显示即便体积更小,性能仍超越前代产品
  • 采用混合架构(90% Mamba-2层+10% Transformer模块)提升效率
  • 针对长上下文和多会话任务,内存占用较传统LLM降低70%以上
  • 通过ISO 42001认证,确保AI管理的安全性、可靠性与透明度
  • 支持AMD Instinct MI-300X GPU和高通Hexagon NPU芯片的端侧部署
  • 在指令跟随、函数调用及检索增强生成(RAG)方面表现优异
  • 提供模型检查点加密签名及最高10万美元漏洞赏金计划
  • 未来将发布专注推理的'Thinking'变体及Nano/Medium等新规格
  • 已登陆Hugging Face、IBM watsonx.ai、NVIDIA NIM及Docker Hub平台