MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)

news2024/9/23 3:28:28

声明

  • 本工具是个免费工具,遇到问题,还请自行解决,下面有文字教程,B站有视频教程(链接在文章末尾);

  • 其次,微软接口卡顿,连接超时等问题下方有详细说明,请仔细看一下;

  • 再次,强制升级是为了统一版本方便问题的收集与解决,如果你能理解最好,不能理解的话,那建议你还是不要用了,强扭的瓜不可能甜!

前言

微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具;

目前,MS-TTS工具经过N个版本更新,该实现的功能都已经一点点肝出来了,称它为全网最强免费TTS文本语音合成工具应该不为过,所以,接下来可能在很长一段时间内,除去发现重大bug外,应该都不会再进行大的更新了,当然,有什么好的意见建议可以继续留言告知(提示:少数人需要的特殊功能不在此范围,真有需要可联系定制)。

当前版本:v1.9.6.3

Bug反馈

遇到问题请先更新到最新版本试试!如果还是解决不了,请在公众号回复:加群,添加Q群后,提供触发Bug的具体场景,以便跟踪修复,感谢有你!


使用说明(以下内容请仔细阅读)

1、下载的压缩包记得先解压缩,再使用!!!

2、解压后运行主程序 MS-TTS.exe(注意:软件有加密保护,会被部分杀毒软件和电脑管家勿报及限制操作权限,建议将杀毒软件及电脑管家关闭后使用,当然,如果不放心,可以不要使用)

3、软件界面

3.1 接口设置

左侧最上方为TTS接口选项,当前软件支持 微软Edge 两大接口,优缺点如下:

微软Edge
角色个性化设置支持不支持
稳定性不稳定较稳定
合成速度一般
WAV格式支持不支持

接口下方代理选项专为微软接口设置,原因就是因为微软TTS服务器网络非常不稳定,如果一定要使用微软接口,有条件的话就可以使用http代理,如果没条件且又一定要使用微软接口的话,建议在01:00-11:00时间段使用,连接稳定性及合成速度相对会好一些!

3.2 选项

合成音频保存质量选项,微软接口mp3、wav两种格式都支持,Edge只支持保存mp3格式;

3.3 角色

语言:TTS文本转语音中的文本内容所属语言(一定要和合成内容的语言相对应)

语音:根据所先语言不同,对应的语音角色也不相同,要自行根据实际情况选择

风格:角色的说话语气风格

角色:这个角色一般是指角色的年龄段(实际使用效果不明显,且只有少部分角色支持)

语速:语音合成时的说话速度,0是正常水平,>0加快,<0减慢

音调:语音合成时的说话音调,0是正常水平,>0音调升高,<0音调降低

添加角色:可将设置好的角色添加到下方的角色列表,用于文本转语音时实现多角色配音的效果(不添加角色时,所有语音合成直接使用上方角色及各项设置)

3.4 简单模式-中小文本

主要用于合成文本内容不多的情况,可以更为方便快捷的对文本内容进行各种自定义

在编辑区域点击鼠标右键,会弹出右键菜单

  • 粘贴:将复制好的文本内容粘贴到编辑区域

  • 清空:清空编辑区域所有内容

  • 插入间隔:在光标所以位置插入间隔标记,后面在进行语音合成时,将会在指定位置按照设置好的间隔时间进行停顿

  • 设置角色:使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。

3.5 简单模式-超长文本

在表格区域点击鼠标右键,会弹出右键菜单:

  • 导入:导入需要进行tts合成的txt文本文件

    • 导入的txt文本大小不能超过5MB(超过5MB文本文件无法导入)

    • 导入的txt文本文件编码格式必须为UTF-8,非UTF8编码文件在导入后,在状态栏会显示“编码错误”,在进行tts语音合成时,会直接跳过

  • 清空:清空列表

  • 也可以直接选中多个txt文本文件,拖动到软件界面完成导入

3.6 SSML

SSML:是一种基于XML的语音合成标记语言,此功能一般只用于需要深度自定义的场景,使用SSML一定要按照其规定的语法及命令,否则将无法合成(命令语法错一个字母都不行),具体可点击右上方绿色文字,跳转到官方SSML文档进行学习。

SSML:主体内容不能超过2500字符(微软官方有限制)

3.7 软件设置

  • 保存目录:可自定义合成音频保存目录(打开:快速打开保存目录,选择文件夹:选择保存目标文件夹)

  • 合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_tts”进行命名

  • 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)

  • 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时间会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)

  • 合成结束删除1级音频片段:1级音频片段就是最多的,4位数字开头的音频片段文件

  • 合成结束删除2级音频片段:2级音频片段就是按照上面指定分段音频合并数量对1级音频片段进行合并后生成的3位数字开头音频文件

  • 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。

  • 路径检测显示YES表示路径正常,可正常进行音频合并

  • 保存配置:将各项设置内容保存至配置文件(./Nconfig.ini)

注:删除音频片段时,将遵循保护性逻辑,即:在只存在1级音频片段时,即使勾选合成结束删除1级音频片段也不会执行删除,在同时存在1级音频片段与2级音频片段时,勾选删除1级音频片段生效,而2级音频片段即使勾选删除将不会执行,同理,在同时存在1级、2级音频片段,且进行了最终完整合并的前提下,勾先删除1级、2级音频片段才会生效执行。

4、多音字

MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,

将需要自动替换的内容按照: 原始内容,替换内容 的格式一行一条,写入“dict.txt”词典文件保存即可,如下:

5、试听合成

5.1 试听

提供最长不超过150字符内容的角色声音试听,多角色只试听第一段内容

5.2 合成

按照设置好的角色对指定内容进行TTS语音合成

5.3 停止

停止正在进行的任务

软件报病毒

软件有加密保护,会被部分杀软误报,所以,如果你在使用过程中遇到这样或那样的问题,请尝试关闭各类杀毒软件或电脑管家后再试一下,当然:如果不放心请勿使用,谢谢!!!

视频教程

视频为1.9.3版本视频,多数操作相同

https://www.bilibili.com/video/BV1wg411k7SH/

下载地址

前往下载

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/986624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

视频怎么制作动图?分享简单的视频制作gif方法

现在的人们常用视频来记录自己的生活&#xff0c;但是视频的体积都会比较大&#xff0c;保存传输非常的不方便。我们可以将视频制作成gif动图来使用&#xff0c;而且gif动图也能将自己的心情想表达的想法通过这种个性的方式展示给对方。接下来&#xff0c;就给大家分享一款视频…

雅思 四处刷题的记录(一)

目录 阅读 九分达人7 test2 p2 听力 剑18 test1 section 1 剑18 test1 section 2 《九分达人》6 test3 section 1 and section 2 阅读 《九分达人》7 test2 passage1 词汇 Travelling的含义 town跟介词在一起的搭配 什么情况下使用on 大作文写作思路 当我们要使…

Python自动化测试(超详细~)

1. 概述 1.1 python自动化 什么是python自动化&#xff1f;我理解的Python自动化测试就是把以前人为测试转化为机器测试的一种过程。自动化测试是一种比手工测试更快获得故障反馈的方法。 自动化测试是一种质量保障的方式&#xff0c;最重要的还是以做好一款高质量产品为前提…

商用柴油车J1939油耗管理及北斗TBOX在物流运输中的应用

随着电商的兴起&#xff0c;网上购物的用户越来越多&#xff0c;网购、直播带货、精品电商等&#xff0c;促进了大量的物品流动&#xff0c;原本在一定程度上&#xff0c;物流管理上还有一些小混乱&#xff0c;但是随着监管和政策调整&#xff0c;物流互联数字平台对于货物流动…

deepstream6.2部署yolov5详细教程与代码解读

文章目录 引言一.环境安装1、yolov5环境安装2、deepstream环境安装 二、源码文件说明三.wts与cfg生成1、获得wts与cfg2、修改wts 四.libnvdsinfer_custom_impl_Yolo.so库生成五.修改配置文件六.运行demo 引言 DeepStream 是使用开源 GStreamer 框架构建的优化图形架构&#xf…

SAP FI之批量修改财务凭证的BAPI

文章目录 前言一、pandas是什么&#xff1f;二、使用步骤 1.引入库2.读入数据总结 前言 一般涉及修改财务凭证&#xff0c;或者其它凭证&#xff0c;不应直接更新数据库&#xff0c;而是使用系统提供的function module,或者BAPI&#xff0c;或者使用BDC。 一、 示例&#xf…

《Effective STL》读书笔记(四):迭代器

iterator 优先于 const_iterator, reverse_iterator, const_reverse_iterator STL中所有标准容器都提供了标题提到的四种迭代器类型。对于容器container<T>而言&#xff0c;iterator类型相当于T*&#xff0c;const_iterator类型相当于const T*&#xff0c;剩下两个是反向…

XP小皮面板中的Mysql启动就停止,本地Mysql无法启动解决方法

前言&#xff1a; XP小皮面板中的mysql启动就停止&#xff0c;尝试查看很多方法无效&#xff0c;任务管理器mysql也尝试了先终止后启动&#xff0c;没反应... 解决方法 打开CMD&#xff0c;输入命令行 sc delete Mysql 这个命令是删除本地Mysql服务 然后再点开小皮的…

数学计算式转为表达式树

数据结构“栈”的一个用途就是&#xff1a;平衡符号&#xff0c;比如这样一个代数式&#xff1a;&#xff08;a(bc)*a(e*fa*(cd))&#xff09;,你能一眼看出这个式子的括号是否正确吗&#xff1f; 更何况还可以加入中括号&#xff08;[]&#xff09;,大括号&#xff08;{}&…

harmony应用签名

1. 随便搞个halloworld程序 2.生成私匙与证书请求文件 我就是key store file选择了一个文件夹&#xff0c;又不给任何提示&#xff0c;等我输入密码时才提示 填写图中内容即可&#xff0c;图中未填项可不填 点击完成即可

CPSE深圳充换电展开幕,飞凌嵌入式引领智能充储技术新潮流

9月6日&#xff0c;2023第六届深圳国际充电桩及换电站展览会&#xff08;简称&#xff1a;CPSE深圳充换电展&#xff09;在深圳会展中心&#xff08;福田&#xff09;开幕&#xff0c;飞凌嵌入式如期亮相&#xff0c;与来自全国的客户朋友及合作伙伴一同交流分享企业在智能充电…

WebDAV之π-Disk派盘 + 天悦日记

天悦日记是一款清爽简约的日记记录工具,通过天悦日记app随时随地快速写日记,更有智能数据统计分析报表,多端同步多种备份,本地备份和基于WebDAV协议的云端备份。跨平台使用,支持多设备、多平台无差别使用。天悦日记将每一天经历都清晰记录在手机,一目了然知道曾经的经历,…

StarRocks数据库FE——Catalog层

​仓外挂湖是指以 MPP 数据库为基础&#xff0c;使用可插拔架构&#xff0c;通过开放接口对接外部存储实现统一存储&#xff0c;在存储底层共享一份数据&#xff0c;计算、存储完全分离&#xff0c;实现从强管理到兼容开放存储和多引擎。实现方向为增加存储能力&#xff0c;提升…

Blender之锁定摄像机到视图方位

文章目录 当你在blender 中时&#xff0c;想要让你的摄像机跟随你的视图方位&#xff0c;以方便你的后期的制作&#xff0c;那应该怎么半&#xff1f; 先点击摄像机的图标&#xff0c;进入摄像机视图 然后按一下键盘的N 键&#xff0c;进入编辑模式&#xff0c;选择视图 最后…

【笔试强训选择题】Day34.习题(错题)解析

作者简介&#xff1a;大家好&#xff0c;我是未央&#xff1b; 博客首页&#xff1a;未央.303 系列专栏&#xff1a;笔试强训选择题 每日一句&#xff1a;人的一生&#xff0c;可以有所作为的时机只有一次&#xff0c;那就是现在&#xff01;&#xff01;&#xff01;&#xff…

蓝天转债,双良转债上市价格预测

蓝天转债111017 基本信息 转债名称&#xff1a;蓝天转债&#xff0c;评级&#xff1a;AA&#xff0c;发行规模&#xff1a;8.7亿元。 正股名称&#xff1a;蓝天燃气&#xff0c;今日收盘价&#xff1a;9.74元&#xff0c;转股价格&#xff1a;10.13元。 当前转股价值 转债面值…

阿里巴巴API接口解析,实现获得商品详情

要解析阿里巴巴API接口并实现获取商品详情&#xff0c;你需要按照以下步骤进行操作&#xff1a; 了解阿里巴巴开放平台&#xff1a;访问阿里巴巴开放平台&#xff0c;并了解相关的API文档、开发者指南和规定。注册开发者账号&#xff1a;在阿里巴巴开放平台上注册一个开发者账…

【Unity编辑器扩展】| Inspector监视器面板扩展

前言【Unity编辑器扩展】| Inspector监视器面板扩展一、ContextMenu和ContextMenuItem二、Custom Editors 自定义编辑器三、Property Drawer 属性绘制器总结前言 前面我们介绍了Unity中编辑器扩展的一些基本概念及基础知识,还有编辑器扩展中用到的相关特性Attribute介绍。后面…

C高级文件相关指令

使用cut截取出Ubuntu用户的家目录&#xff0c;要求:不能使用“&#xff1a;”作为分隔 XMind

嵌入式Linux驱动开发(LCD屏幕专题)(三)

1. 硬件相关的操作 LCD驱动程序的核心就是&#xff1a; 分配fb_info设置fb_info注册fb_info硬件相关的设置 硬件相关的设置又可以分为3部分&#xff1a; 引脚设置时钟设置LCD控制器设置 2. 在设备树里指定LCD参数 framebuffer-mylcd {compatible "100ask,lcd_drv&qu…