Llama-Factory: Unified, Efficient Fine-Tuning for 100 Open LLMs
8 months ago
- #AI
- #LLM
- #Fine-Tuning
- LLaMA Factory 提供了一个全面的框架,用于通过多种特性和优化对大语言模型(LLMs)进行微调。
- 支持广泛的模型,包括LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、DeepSeek、Yi、Gemma、ChatGLM、Phi等。
- 提供多种训练方法,如预训练、监督微调、奖励建模、PPO、DPO、KTO、ORPO等。
- 包含可扩展的资源,如16位全微调、冻结微调、LoRA和通过AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ实现的QLoRA。
- 支持高级算法:GaLore、BAdam、APOLLO、Adam-mini、Muon、OFT、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ、PiSSA。
- 提供实用技巧,如FlashAttention-2、Unsloth、Liger Kernel、RoPE缩放、NEFTune和rsLoRA。
- 支持广泛的任务,包括多轮对话、工具使用、图像理解、视觉定位、视频识别、音频理解等。
- 实验监控工具包括LlamaBoard、TensorBoard、Wandb、MLflow、SwanLab等。
- 更快的推理选项:OpenAI风格API、Gradio UI和带有vLLM worker或SGLang worker的CLI。
- 提供详尽的文档、Colab笔记本、本地机器设置、PAI-DSW、Alaya NeW和官方入门课程。
- 包含更新日志,记录支持的模型和特性,如Qwen3、GLM-4.1V、InternLM 3等。
- 提供用于预训练、监督微调和偏好学习的数据集,并支持自定义数据集选项。
- 详细说明不同平台的系统要求和安装指南,包括Windows、Ascend NPU和AMD ROCm。
- 使用LLaMA Factory的项目包括StarWhisper、DISC-LawLLM、Sunsimiao、CareGPT等,展示了其多功能性。
- 采用Apache-2.0许可证,使用相应权重需遵守模型特定的许可证要求。