下载
链接:https://pan.baidu.com/s/1cb24WW2dihtRpMz4giMxyw
提取码:k3xu
解压密码:领航员未鸟
项目源码:https://github.com/Plachtaa/VITS-fast-fine-tuning/tree/main
使用
解压后来到,该目录下,把准备好的语音放入一下文件夹,必须是wav格式,时长一般是一个小时
说说我是怎么弄的吧,我直接用剪映wav格式导出,然后用一个切分工具进行切分
链接:https://pan.baidu.com/s/1ArPPTDmZpq75eHZsyaEnjA
提取码:08zf
解压密码:cuijiahua.com
来到音频切分目录,点击运行脚本
来到界面,输入音频文件路径,和切分后的输出路径,其他不用动,点击start开始就行!
然后把切分的数据放入之前说的位置
点击预处理,
[]
按照指示输入即可,y同意,ge人名,0不使用辅助数据
之后就等待处理完毕了,处理完了会显示按任意键继续,直接x掉终端,点击开始训练,输入训练轮数即可,可以先输入200,如果效果不好可以继续训练,千万不要点开始训练,会清空权重文件,继续训练输入300,就是在原来200基础上在训练100epoch
点击开始推理,输入中文,点击生成,觉得可以就下载
基本完毕:
参考:领航员未鸟