Hasty Briefsbeta

双语

Kitten TTS: 25MB CPU-Only, Open-Source Voice Model

9 months ago
  • #AI
  • #Text-to-Speech
  • #Open-Source
  • Kitten TTS 是一款革命性的超轻量级文本转语音模型,仅含1500万参数,体积不足25MB。
  • 它能在CPU上高效运行而无需GPU支持,使树莓派和智能手机等低功耗设备也能轻松使用。
  • 该模型内置8种富有表现力的音色(4种女声和4种男声),开箱即用,满足多样化应用场景需求。
  • 专为实时语音合成优化,特别适合需要快速响应的聊天机器人、语音助手和无障碍工具。
  • 采用Apache 2.0开源协议,个人和商业项目均可免费使用。
  • 当前仅支持英语,但未来版本计划扩展多语言支持。
  • 与Piper TTS、Kokoro TTS等轻量级模型相比,Kitten TTS在体积与音质平衡上更具优势。
  • 潜在应用领域包括边缘AI、注重隐私的物联网设备、无障碍工具和独立开发项目。
  • 目前仍处于开发者预览阶段,存在少量音质问题,后续更新将着重提升性能并扩展功能。