Hasty Briefsbeta

双语

Kitten TTS: 25MB CPU-Only, Open-Source Voice Model

9 months ago

#AI
#Text-to-Speech
#Open-Source

Kitten TTS 是一款革命性的超轻量级文本转语音模型，仅含1500万参数，体积不足25MB。
它能在CPU上高效运行而无需GPU支持，使树莓派和智能手机等低功耗设备也能轻松使用。
该模型内置8种富有表现力的音色（4种女声和4种男声），开箱即用，满足多样化应用场景需求。
专为实时语音合成优化，特别适合需要快速响应的聊天机器人、语音助手和无障碍工具。
采用Apache 2.0开源协议，个人和商业项目均可免费使用。
当前仅支持英语，但未来版本计划扩展多语言支持。
与Piper TTS、Kokoro TTS等轻量级模型相比，Kitten TTS在体积与音质平衡上更具优势。
潜在应用领域包括边缘AI、注重隐私的物联网设备、无障碍工具和独立开发项目。
目前仍处于开发者预览阶段，存在少量音质问题，后续更新将着重提升性能并扩展功能。