语音合成TTS
-
序列猴子TTS,每个发音人付费标准不同,通过序列猴子开放平台使用。
-
微软TTS,采用信用卡后付费模式。Speech Studio,付费模式采用统一付费的形式,音效有一款女声效果逼真。
-
女声:晓晓,多语言版,针对中文发音时,某些数字如条目里的数字项,会进行英语发音,需要加语言限制zh-CN。能正常发音。流式语音切分时,SSE模式,“1.顺”要切分成“1,顺”才能正常阅读,否则读的效果很差。
-
女声:晓颜,效果不错。
-
男声:MasaruMultilingual,找到中文发音,效果也不错。
-
火山引擎TTS,部分音效不错。如梓梓或燃燃两个,不过费用也是比较贵。
-
科大讯飞TTS,声音略为僵硬,参考链接:https://www.xfyun.cn/solutions/train,发音人不能自由选择,费用较贵,2万/年。
语音克隆Clone
- 序列猴子,声音克隆收费2000(初版)-8000元(高级版)不等,付费费用专用,不能挪作其它项目使用。
- 微软Azure,语音克隆效果可以,仅供体验。对签合同的合作伙伴有限开放,且简版与高级版使用过程较为复杂,需要用户按相应的话术录音用于确认授权。
- 火山引擎,声音克隆效果不错,复刻过程很简单,只需要15-30s的干净录音即可,不支持复刻后更新。https://www.volcengine.com/docs/6561/1167803
- 科大讯飞,克隆收费2万元/个。
开源TTS产品
特别拟人的目前还没看到,Seed-TTS是个良好的选择,目前尚未完全可用,可保持关注。