上期文章,我们介绍了如何使用Azure来创建一个语音服务API,哪里,我们得到了API的key,以及语音服务的基本信息,包含地区等,这些都是本期代码需要的参数
听了那么多AI合成的语音,Azure机器学习的文本转语音最接近人声https://blog.csdn.net/weixin_44782294/article/details/126683230?spm=1001.2014.3001.5502
下图是Azure官方的一个语音合成流程图,大致包含如下步骤
- 准备需要合成语音的text文件或者SSML文件
- 向API发送请求
- API服务提供文本转语音功能(本步骤直接在Azure服务器上执行)<