Hasty Briefsbeta

双语

Neutts-air – open-source, on device TTS

5 months ago
  • #TTS
  • #VoiceCloning
  • #OnDeviceAI
  • NeuTTS Air是全球首个超拟真、设备端即时语音克隆的TTS语音语言模型
  • 基于0.5B参数的LLM主干网络,提供自然语音合成、实时性能及内置安全保障
  • 核心特性包含:业界领先的拟真度、设备端部署优化、仅需3秒音频即可实现即时语音克隆
  • 支持英语语言,采用神经音频编解码器(NeuCodec)实现低码率下的高保真音频
  • 提供GGML格式实现高效设备端推理,中端设备即可实时生成语音
  • 安装需配置espeak和Python依赖,可选支持GGUF模型与ONNX解码器
  • 使用需提供参考音频样本和文本字符串,可合成与参考音频风格一致的语音
  • 优化技巧包括:采用GGUF模型主干、预编码参考音频、使用ONNX编解码器
  • 生成音频内置感知水印技术,保障安全合规使用