Hasty Briefsbeta

双语

Show HN: KVoiceWalk – Voice cloning for Kokoro TTS using random walk algorithms

a year ago

#voice-cloning
#audio-processing
#machine-learning

KVoiceWalk采用随机游走算法和混合评分机制来克隆目标声音。
该项目基于Kokoro和Resemblyzer框架，通过进化新声纹张量实现声音克隆。
目标音频要求为20-30秒、24000Hz采样率的单说话人WAV文件。
处理流程包括寻找最接近匹配、随机游走和保存最优声纹。
插值搜索算法优化了随机游走的初始种群质量。
评分系统综合Resemblyzer相似度、自相似度及特征提取结果。
调和平均分的运用确保各项指标均衡优化。
未来可能引入遗传算法或预测模型进行改进。
根据硬件配置可并行运行多个处理实例。