Hasty Briefsbeta

双语

Teaching large language models how to absorb new knowledge

6 months ago
  • #Machine Learning
  • #Self-Adapting Models
  • #Artificial Intelligence
  • 麻省理工学院研究人员开发了一种名为SEAL(自适应性大语言模型)的方法,使大语言模型能够永久更新其内部知识。
  • SEAL允许大语言模型从用户输入生成合成数据(自我编辑),类似于学生制作学习笔记,然后确定从这些数据中学习的最佳方式。
  • 该模型使用强化学习来测试和选择最有效的自我编辑,提高了问答和模式识别等任务的准确性。
  • SEAL在基准测试中表现优异,在问答任务中准确率提升近15%,在某些技能学习任务中提升超过50%。
  • 一个局限性是存在灾难性遗忘现象,即模型在适应新信息时,对早期任务的性能会下降。
  • 未来工作包括减轻灾难性遗忘,并将SEAL应用于多智能体场景,让大语言模型相互训练。
  • 该研究旨在通过使大语言模型在动态环境中持续自我改进,使其更具类人性。