整个流程是这样的 。你说话的 语音-->语音转为文字 -->chatgpt --> 文字转为语音-->驱动虚拟主播。
前面的流程都是非常多的参考代码。下面代码就是教你如果做到这一步。这个虚拟主播是可用wav格式音频驱动虚拟主播的。代码是一个http接口,上传wav文件后就能开始驱动。
上面流畅最后一部 ,python代码非常简单。
import sys
import threading
import urllib
import ssl
from urllib.parse import urlparse
from scripts import watcher, webdriver
from config.helper import config
import requests
def sendFile(filename, filepath):
url = "http://192.168.3.131:8080/cgi/savewav"
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'}
files = {'file': open(filepath, 'rb') }
files1 = {
'file':(filename,open(filepath, 'rb'), 'audio/wav')
}
data = {
'file':filename,
'objectName': filename,
'fileDownloadName': filename,
}
upload_res = requests.post(url,
data=data,
files=files1)
if __name__ == '__main__':
print('1')
sendFile('rec.wav','rec.wav')