Hasty Briefsbeta

双语

Unsloth Dynamic 2.0 GGUFs

10 months ago

#AI-models
#machine-learning
#quantization

Unsloth推出Dynamic v2.0量化技术，重大升级显著提升量化大语言模型的精度与效率
Dynamic v2.0具备革新性层级选择机制、模型专属量化方案及Q4_NL/Q5.1等新格式，在Apple Silicon和ARM设备上表现更优
该方法包含超过150万token的高质量校准数据集，可增强对话式聊天性能
Unsloth与Meta、Google、微软等顶尖AI团队合作修复关键漏洞，提升模型准确率
Dynamic v2.0现已支持所有模型架构（包括MoE与非MoE），突破前代仅限MoE架构的限制
基准测试引入融合磁盘体积与MMLU评分的新效率指标，Dynamic 2.0展现卓越性能
采用KL散度作为量化精度的核心评估标准，致力于最小化模型答案的波动性
通过使用维基百科之外的多样化数据集，Unsloth有效解决校准数据过拟合问题
因细微实现差异导致MMLU五样本测试复现困难，团队最终开发定制化基准测试方案
Gemma 3量化感知训练基准成绩亮眼，Dynamic 2.0版本兼具更小体积与更高精度
Llama 4的修复包含RoPE缩放调整和QK Norm epsilon校正，使MMLU分数显著提升
附llama.cpp运行Llama 4 Scout的详细指南，展示Unsloth Dynamic 2.0量化成果