个人开发的网站,已经维护快一年了,接口稳定,基于微软官方接口,可在线生成,手机电脑平板通用。每天提供一定额度(时而5000时而2000时而500,根据服务器压力调整)的免费字数供大家使用。
使用教程👇👇👇
首先我们用浏览器打开网站 www.text-to-speech.cn ,电脑用户推荐Edge浏览器,手机用户推荐使用QQ浏览器。
打开后我们可以在左侧的文本框内写入我们需要生成音频的文本,可以用一件清理删除当前文本框中的内容,写入文本后选择右侧要使用的语言语音等选项,质量越高生成的音频比特率越高,但是会影响生成速度。
选择好以后我们可以点击试听去看当前设置的声音是否符合要求,注意试听只会生成并播放第一个句号前的内容。
然后我们可以点击生成按钮,等待几秒钟后会有生成成功的音效和文字提示,此时我们就可以下载音频了。
电脑用户可以点击下载按钮,手机用户因为浏览器权限原因可能有部分浏览器无法直接下载,我们使用QQ浏览器生成,生成后可以用资源嗅探功能下载。
生成前需要注意文本字数太多或者包含不是中文编码的文字就会生成失败,生成失败时可以先使用一键整理再去生成。
生成按钮旁边的ssml生成是需要对应ssml格式的文本才能生成,具体生成规则可以去微软官方查看。
多音字和停顿按钮,点击后会自动复制对应格式的代码,粘贴到需要配置多音字或者停顿的地方,然后修改参数即可完成多音字和停顿的转换。
多音字修改ph后的参数,前面的参数代表拼音,后面的参数代表声调,5代表轻声。停顿修改time后的参数即可最多设置5000ms(5秒)。
模型功能目前只有授权用户可以使用,首选选择好右侧语言声音等配置项,然后点击模型,输入名称并保存,就可以将当前的配置保存下来,再次点击模型,就可以看到历史保存的模型,点击对应的模型就可以将右侧的配置修改为模型对应的内容。
多语言切换功能同样需要用到模型功能,多语言切换默认使用句号和换号进行切分,用户也可以自己设置切分符号。
切分后每句话右侧可以选择对应的模型,配置好后就可以实现多语言生成功能了。
目前就是这些功能了,大家有任何建议或者使用中有疑惑的地方都可以在下方评论,只要有时间就会根据大家的建议优化网站。