一、训练自己的音色模型步骤
1、准备好要训练的数据,放在Data文件夹中,按照文件模板中的结构进行存放数据
2、双击打开go-webui.bat文件,等待页面跳转
3、页面打开后,开始训练自己的模型
(1)、人声伴奏分离。
点击打开人声伴奏分离批量处理界面(如果没有伴奏背景可以省略这一步)
(2)、音频切割。
(3)、识别语音中的文本。
(4)、文本语音校对。
(5)、提取训练前所需信息
(6)、开始训练模型
(7)、测试自己的模型
二、API调用
1、创建一个conda虚拟环境,安装requirements.txt所需要的库
如果需要使用gpu,安装的cuda和torch版本推荐:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118