Show HN: KVoiceWalk – Voice cloning for Kokoro TTS using random walk algorithms
a year ago
- #voice-cloning
- #audio-processing
- #machine-learning
- KVoiceWalk采用随机游走算法和混合评分机制来克隆目标声音。
- 该项目基于Kokoro和Resemblyzer框架,通过进化新声纹张量实现声音克隆。
- 目标音频要求为20-30秒、24000Hz采样率的单说话人WAV文件。
- 处理流程包括寻找最接近匹配、随机游走和保存最优声纹。
- 插值搜索算法优化了随机游走的初始种群质量。
- 评分系统综合Resemblyzer相似度、自相似度及特征提取结果。
- 调和平均分的运用确保各项指标均衡优化。
- 未来可能引入遗传算法或预测模型进行改进。
- 根据硬件配置可并行运行多个处理实例。