Hasty Briefsbeta

双语

Intelligence per Watt: Measuring Intelligence Efficiency of Local AI

6 months ago

#Local Inference
#Energy Efficiency
#Artificial Intelligence

本地AI模型（≤200亿参数）现已在多项任务性能上媲美前沿大模型
本地加速器（如苹果M4 Max）已可实现小型语言模型的交互级延迟
提出新指标：能效智商（IPW）=任务准确率/功耗单位，用于评估本地AI效率
研究涵盖20+本地模型、8款加速器和100万条真实查询，测量准确率、能耗、延迟和功耗
研究发现：本地模型对单轮对话和推理查询的准确回答率达88.7%
2023-2025年间IPW提升5.3倍；本地查询覆盖率从23.2%增至71.3%
相同模型下，本地加速器的IPW比云端加速器至少低1.4倍
已发布IPW分析工具包，用于系统化评估智能能效