Hasty Briefsbeta

双语

Fine-Tuning LLMs Is a Waste of Time

a year ago

#AI
#LLMs
#Fine-Tuning

微调大语言模型进行知识注入效果不佳，且可能覆盖已有知识
训练好的大语言模型中神经元高度互联，更新参数可能导致重要信息丢失
检索增强生成(RAG)、适配器和提示工程等模块化方法是更安全的选择
对先进大语言模型进行微调可能引发意外的负面连锁反应
RAG和LoRA等技术无需改动核心模型即可实现知识植入
文章强调必须维护模型基础知识的完整性