Hasty Briefsbeta

双语

Show HN: KVoiceWalk – Voice cloning for Kokoro TTS using random walk algorithms

a year ago
  • #voice-cloning
  • #audio-processing
  • #machine-learning
  • KVoiceWalk采用随机游走算法和混合评分机制来克隆目标声音。
  • 该项目基于Kokoro和Resemblyzer框架,通过进化新声纹张量实现声音克隆。
  • 目标音频要求为20-30秒、24000Hz采样率的单说话人WAV文件。
  • 处理流程包括寻找最接近匹配、随机游走和保存最优声纹。
  • 插值搜索算法优化了随机游走的初始种群质量。
  • 评分系统综合Resemblyzer相似度、自相似度及特征提取结果。
  • 调和平均分的运用确保各项指标均衡优化。
  • 未来可能引入遗传算法或预测模型进行改进。
  • 根据硬件配置可并行运行多个处理实例。