Hasty Briefsbeta

双语

GPU-rich labs have won: What's left for the rest of us is distillation

9 months ago

#Distillation
#AI
#LLM

OpenAI每日在大型语言模型训练上花费超过5000万美元，使得没有雄厚资源的竞争者难以立足。
2024年企业AI支出出现严重浪费，其模型很快被各大实验室的新版本淘汰。
开源模型通过蒸馏大型专有模型不断逼近，深度求索(Deepseek)就是典型例证。
由于GPU资源鸿沟，开源模型与专有模型之间的差距正在扩大。
2025年焦点转向智能体和应用层，企业开始采用更小型的任务专用语言模型。
蒸馏技术可利用大模型输出训练小模型，在保持性能的同时大幅降低成本。
产品市场匹配后，蒸馏成为降低延迟和成本的关键技术。
Inference.net为专注应用层的创业者提供端到端的蒸馏与推理解决方案。