Hasty Briefsbeta

双语

Intelligence per Watt: Measuring Intelligence Efficiency of Local AI

6 months ago
  • #Local Inference
  • #Energy Efficiency
  • #Artificial Intelligence
  • 本地AI模型(≤200亿参数)现已在多项任务性能上媲美前沿大模型
  • 本地加速器(如苹果M4 Max)已可实现小型语言模型的交互级延迟
  • 提出新指标:能效智商(IPW)=任务准确率/功耗单位,用于评估本地AI效率
  • 研究涵盖20+本地模型、8款加速器和100万条真实查询,测量准确率、能耗、延迟和功耗
  • 研究发现:本地模型对单轮对话和推理查询的准确回答率达88.7%
  • 2023-2025年间IPW提升5.3倍;本地查询覆盖率从23.2%增至71.3%
  • 相同模型下,本地加速器的IPW比云端加速器至少低1.4倍
  • 已发布IPW分析工具包,用于系统化评估智能能效