Hasty Briefsbeta

双语

Researchers Found a Better Way to Teach Large Language Models New Skills

10 months ago
  • #AI
  • #Machine Learning
  • #Natural Language Processing
  • 研究人员开发了WeGeFT技术,可在不增加算力的情况下提升大语言模型性能。
  • WeGeFT在常识推理、算术推理和代码生成等任务中显著增强模型表现。
  • 该技术基于2022年提出的LoRA方法,通过引入数学工具识别并优先学习新型参数。
  • 概念验证测试表明,WeGeFT在多项任务中均达到或超越LoRA及其变体方法的性能。
  • 未来研究将探索利用WeGeFT识别有害输出,以提升AI对齐性和安全性。
  • 该成果将于2024年7月在国际机器学习大会上进行展示。