Hasty Briefsbeta

双语

Llama-Factory: Unified, Efficient Fine-Tuning for 100 Open LLMs

8 months ago
  • #AI
  • #LLM
  • #Fine-Tuning
  • LLaMA Factory 提供了一个全面的框架,用于通过多种特性和优化对大语言模型(LLMs)进行微调。
  • 支持广泛的模型,包括LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、DeepSeek、Yi、Gemma、ChatGLM、Phi等。
  • 提供多种训练方法,如预训练、监督微调、奖励建模、PPO、DPO、KTO、ORPO等。
  • 包含可扩展的资源,如16位全微调、冻结微调、LoRA和通过AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ实现的QLoRA。
  • 支持高级算法:GaLore、BAdam、APOLLO、Adam-mini、Muon、OFT、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ、PiSSA。
  • 提供实用技巧,如FlashAttention-2、Unsloth、Liger Kernel、RoPE缩放、NEFTune和rsLoRA。
  • 支持广泛的任务,包括多轮对话、工具使用、图像理解、视觉定位、视频识别、音频理解等。
  • 实验监控工具包括LlamaBoard、TensorBoard、Wandb、MLflow、SwanLab等。
  • 更快的推理选项:OpenAI风格API、Gradio UI和带有vLLM worker或SGLang worker的CLI。
  • 提供详尽的文档、Colab笔记本、本地机器设置、PAI-DSW、Alaya NeW和官方入门课程。
  • 包含更新日志,记录支持的模型和特性,如Qwen3、GLM-4.1V、InternLM 3等。
  • 提供用于预训练、监督微调和偏好学习的数据集,并支持自定义数据集选项。
  • 详细说明不同平台的系统要求和安装指南,包括Windows、Ascend NPU和AMD ROCm。
  • 使用LLaMA Factory的项目包括StarWhisper、DISC-LawLLM、Sunsimiao、CareGPT等,展示了其多功能性。
  • 采用Apache-2.0许可证,使用相应权重需遵守模型特定的许可证要求。