Hasty Briefsbeta

双语

What even is a small language model now?

a year ago
  • #AI
  • #Machine Learning
  • #Small Models
  • '小模型'的定义已从2018年的数百万参数发展到如今的300亿-700亿参数规模,如今能在单块GPU上运行的模型都被视为'小模型'
  • 小模型分为两类:一类针对移动/边缘设备优化,另一类仅需单块GPU即可运行
  • 小模型通常功能专一,针对特定任务优化,具有成本低、推理速度快、隐私性更好等优势
  • '小模型'的界定标准持续变化,量化和工程优化已能让700亿参数模型在消费级GPU上运行
  • 某些经典小模型(如谷歌翻译、AWS文本识别)虽非前沿技术,但仍在广泛使用
  • 小模型正因其高效性、成本优势及在基准测试中媲美GPT-3.5等大模型的能力而日益重要