Llama-Factory: Unified, Efficient Fine-Tuning for 100 Open LLMs

8 months ago

#AI
#LLM
#Fine-Tuning

LLaMA Factory 提供了一个全面的框架，用于通过多种特性和优化对大语言模型（LLMs）进行微调。
支持广泛的模型，包括LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、DeepSeek、Yi、Gemma、ChatGLM、Phi等。
提供多种训练方法，如预训练、监督微调、奖励建模、PPO、DPO、KTO、ORPO等。
包含可扩展的资源，如16位全微调、冻结微调、LoRA和通过AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ实现的QLoRA。
支持高级算法：GaLore、BAdam、APOLLO、Adam-mini、Muon、OFT、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ、PiSSA。
提供实用技巧，如FlashAttention-2、Unsloth、Liger Kernel、RoPE缩放、NEFTune和rsLoRA。
支持广泛的任务，包括多轮对话、工具使用、图像理解、视觉定位、视频识别、音频理解等。
实验监控工具包括LlamaBoard、TensorBoard、Wandb、MLflow、SwanLab等。
更快的推理选项：OpenAI风格API、Gradio UI和带有vLLM worker或SGLang worker的CLI。
提供详尽的文档、Colab笔记本、本地机器设置、PAI-DSW、Alaya NeW和官方入门课程。
包含更新日志，记录支持的模型和特性，如Qwen3、GLM-4.1V、InternLM 3等。
提供用于预训练、监督微调和偏好学习的数据集，并支持自定义数据集选项。
详细说明不同平台的系统要求和安装指南，包括Windows、Ascend NPU和AMD ROCm。
使用LLaMA Factory的项目包括StarWhisper、DISC-LawLLM、Sunsimiao、CareGPT等，展示了其多功能性。
采用Apache-2.0许可证，使用相应权重需遵守模型特定的许可证要求。

Hasty Briefsbeta

Llama-Factory: Unified, Efficient Fine-Tuning for 100 Open LLMs