Kitten TTS: 25MB CPU-Only, Open-Source Voice Model
9 months ago
- #AI
- #Text-to-Speech
- #Open-Source
- Kitten TTS 是一款革命性的超轻量级文本转语音模型,仅含1500万参数,体积不足25MB。
- 它能在CPU上高效运行而无需GPU支持,使树莓派和智能手机等低功耗设备也能轻松使用。
- 该模型内置8种富有表现力的音色(4种女声和4种男声),开箱即用,满足多样化应用场景需求。
- 专为实时语音合成优化,特别适合需要快速响应的聊天机器人、语音助手和无障碍工具。
- 采用Apache 2.0开源协议,个人和商业项目均可免费使用。
- 当前仅支持英语,但未来版本计划扩展多语言支持。
- 与Piper TTS、Kokoro TTS等轻量级模型相比,Kitten TTS在体积与音质平衡上更具优势。
- 潜在应用领域包括边缘AI、注重隐私的物联网设备、无障碍工具和独立开发项目。
- 目前仍处于开发者预览阶段,存在少量音质问题,后续更新将着重提升性能并扩展功能。