目标是将每一段声音通过GPT-SoVITS的API的API进行克隆,因为拼在一起的整个片段处理会造成内存或者缓存溢出。
将目录下的音频文件生成到指定目录下,然后再进行拼接。
通过AI工具箱生成的数据文件是这样的结构,temp
目录下是没个片段生成的部分,connect_
是正常拼接的音频文件,silent_
是剪切无声片段的音频文件,
这里克隆后会拼接生成一个 clone
的音频文件。
然后移动到指定的目录下。
实现的完整代码如下:
# env 日常使用目录/py
# -*- coding: UTF-8 -*-
'''
@Project :日常使用目录
@File :inerefance.py
@IDE :PyCharm
@Author