Hasty Briefsbeta

双语

Introducing Gemma 3n

a year ago

#Gemma 3n
#AI
#on-device AI

Gemma 3n现已全面发布，基于Gemma生态系统的成功，下载量已超过1.6亿次。
Gemma 3n采用移动优先架构，支持Hugging Face Transformers、llama.cpp和Google AI Edge等工具。
该模型引入MatFormer架构，通过嵌套变压器组件实现弹性推理。
开发者可使用预提取模型（E4B或E2B），或通过Mix-n-Match创建自定义尺寸模型。
分层嵌入（PLE）技术在不增加高速内存占用的前提下提升模型质量。
KV缓存共享技术将长输入处理速度提升2倍，显著优化预填充性能。
Gemma 3n集成基于通用语音模型（USM）的先进音频编码器，实现细粒度音频表征。
全新视觉编码器MobileNet-V5-300M为边缘设备多模态任务提供顶尖性能。
Gemma 3n拥有由AMD、Hugging Face和NVIDIA等厂商构建的广泛工具与平台生态支持。
Gemma 3n影响力挑战赛邀请开发者构建创新产品，奖金池达15万美元。