Hasty Briefsbeta

双语

Chatterbox, Resemble AI's production-grade open source TTS model

a year ago
  • #TTS
  • #Open Source
  • #AI
  • Resemble AI推出Chatterbox,这是其首个采用MIT许可证的生产级开源TTS模型。
  • 在对比评测中,Chatterbox表现优于ElevenLabs等闭源系统。
  • 支持情感夸张控制功能,这是开源TTS模型中罕见的特性。
  • 通过Hugging Face的Gradio应用,可用于制作表情包、视频、游戏及AI助手。
  • 提供具有价格竞争力的TTS服务,支持扩展或微调,且延迟极低(<200毫秒)。
  • 核心特性包括:零样本TTS技术、0.5B参数的Llama主干网络、带水印的输出。
  • 内置简易音色转换脚本和基于对齐信息的推理机制,确保稳定性。
  • 基于50万小时清洗数据训练而成。
  • 提供常规场景与富有表现力/戏剧化场景的语音生成技巧。
  • 附Python代码示例,可选用不同音色提示生成语音。
  • 所有生成音频均包含不可感知的神经水印以保障安全。
  • 通过Discord鼓励社区参与,同时强调伦理使用规范。