ChatTTS增强版V3【已开源】，长文本修复，中英混读，导入音色，批量SRT、TXT

ChatTTS增强版V3【已开源】，长文本修复，中英混读，导入音色，批量SRT、TXT

news2025/4/8 3:21:14

ChatTTS增强版V3来啦！本次更新增加支持导入SRT、导入音色等功能。结合上次大家反馈的问题，修复了长文本、中英混读等问题。

项目已开源(https://github.com/CCmahua/ChatTTS-Enhanced)

项目介绍

V3

ChatTTS增强版V3，长文本修复，中英混读，导入音色，批量SRT、TXT，代码开源_哔哩哔哩_bilibili

V2

ChatTTS增强版V2，批量导出srt，语速控制，情感控制，支持朗读数字，问题修复_哔哩哔哩_bilibili

V1

ChatTTS增强版整合包,增强音质、批量处理、固定音色、支持长文本(WIN、MAC)_哔哩哔哩_bilibili

更新内容

批量SRT、TXT

批量功能新增支持多个TXT文本或SRT批量导入,会针对每文件进行处理。并支持导出对应SRT。

TXT文本内容格式不用严格按照换行的来。

你可以按照之前换行的格式来。

也可以直接所有内容文本粘进去，会自动根据标点符号进行切分。

长文本

不少朋友反馈上个版本长文本的问题很多，这个版本进行调整。文本内容会自动按照标点符号进行断句。

(音频效果)

英文效果

(音频效果)

中英混读

(效果)

文本选项

删除了之前数字转换选项、合成整个音频的选项。

数字转换已经内置进去，无需手动勾选。合成整个音频默认自动合成。

导出的完整的音频路径为：output_audio/你的txt名/合并/

导出的音频切片路径为：output_audio/你的txt名/切片/

导出的增强音频切片路径为：output_audio/你的txt名/增强切片/

音色选项

新增上传音色功能。

支持导入ChatTTS_Speaker项目的.pt音色文件。

项目地址：

https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker

在该项目上试听音色，下载.pt文件

音色这里把.pt文件上传。

点击生成即可。

配置管理

之前的配置文件格式是.json。这个版本统一保存为.pt格式。

📢注意

当你使用ChatTTS_Speaker的音色pt文件时，也可以保存配置文件。

下次使用时，只需要选择配置文件即可，无需再上传音色。配置文件包含音色文件信息。

配置要求

以下是整合包运行所需配置

WIN

Windwos10/11操作系统
支持CPU/GPU

MAC

Apple Silicon M系列芯片、Intel 芯片
MacOS 10.13以上版本

云端版本

适用于机器配置低的朋友，云端镜像一键部署。

https://www.xiangongyun.com/image/detail/f086c8d6-a802-4a94-b3b5-f4e2f0e2d631?r=2UKFZQ

云端部署教程

关于显存，最低4G显存(不开启音频增强的情况下)

关于MAC显卡：官方更新了MPS相关代码，但我测下来还有些问题，后面再增加支持，所以现在还是先用CPU。

整合包获取

👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻

关注公众号,发送【ChatTTSV3】关键字获取整合包。

如果发了关键词没回复你！记得看下复制的时候是不是把空格给粘贴进去了！

写在最后

最近有点忙，拖了2周左右。看到后台有很多朋友的想法和建议，很不错，但是精力有限，实在不能保证把大家的想法都更上去，后面抽时间慢慢更。

把项目代码开源了，希望对大家有帮助，有能力的也可以自行修改。

本项目开源地址：https://github.com/CCmahua/ChatTTS-Enhanced

最后感谢以下项目:

ChatTTS:https://github.com/2noise/ChatTTS

Resemble Enhance:https://github.com/resemble-ai/resemble-enhance

ChatTTS_colab:https://github.com/6drf21e/ChatTTS_colab

PaddleSpeech:https://github.com/PaddlePaddle/PaddleSpeech

ChatTTS_Speaker:https://github.com/6drf21e/ChatTTS_Speaker

WeTextProcessing:https://github.com/wenet-e2e/WeTextProcessing

制作不易，如果本文对您有帮助，还请点个免费的赞或在看！感谢您的阅读！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1849350.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

拔河【码蹄杯】/二分

拔河【码蹄杯】/二分

拔河二分思路：二分平均力量值，并在check中利用前缀和判断。 #include<bits/stdc.h> using namespace std; typedef long long ll; ll a[100005]; double sum[100005]; ll f,n; bool check(double x) {double dx;double mn0;for(int i1;i<n;…

阅读更多...

【MySQL进阶之路 | 高级篇】InnoDB存储结构

【MySQL进阶之路 | 高级篇】InnoDB存储结构

1. 数据库的存储结构 : 页索引结构给我们提供了高效的索引方式，不过索引信息以及数据记录都是保存在文件上的.确切说是存储在页结构中.另一方面，索引是在存储引擎中实现的，MySQL服务器上的存储引擎负责对表中数据的读取和写入操作.不同的存…

阅读更多...

助力数据跨境，最新政策解读与应用实践分享

助力数据跨境，最新政策解读与应用实践分享

6月13日，VERYCLOUD睿鸿股份联合深数所企业数据合规服务南山工作站、亚马逊云科技，在深圳南山区共同主办了一场关于《数据出境合规之路——法规解析与实践探索》研讨会。 VERYCLOUD睿鸿股份是南山大数据产业协会的副会长单位。南山大数据产业协会作为深圳…

阅读更多...

Python二级考试试题

Python二级考试试题

1. 关于数据的存储结构，以下选项描述正确的是 A 数据所占的存储空间量 B 数据在计算机中的顺序存储方式 C 数据的逻辑结构在计算机中的表示 D 存储在外存中的数据正确答案： C 2. 关于线性链表的描述，以下选项中正确的是 A 存储空…

阅读更多...

CSDN低质量分文章自动化获取

CSDN低质量分文章自动化获取

1. 背景最近粉丝终于达到了5K，可是仍然无法通过优质作者申请，原来是平均质量分较低，优化了一些文章后分数提高仍然较慢，所以需要批量获取低质量文章，重点优化 2. 目标效果 3. 核心代码其中的Cookie可以根据浏览器…

阅读更多...

Ubuntu系统通过GRUB引导菜单进入恢复模式修改账户密码

Ubuntu系统通过GRUB引导菜单进入恢复模式修改账户密码

当在Ubuntu系统中忘记了账户密码时，有几种方法可以破解或重置密码。本指引文档方法：通过GRUB引导菜单进入恢复模式实践环境为：20.04.6 LTS (Focal Fossa) 1. 重启Ubuntu系统：首先，你需要重启你的Ubuntu系统。 2. …

阅读更多...

【PyTorch】【机器学习】图片张量、通道分解合成和裁剪

【PyTorch】【机器学习】图片张量、通道分解合成和裁剪

一、导入所需库 from PIL import Image import torch import numpy as np import matplotlib.pyplot as plt二、读取图片 pic np.array(Image.open(venice-boat.jpg))上述代码解释：先用Image.open()方法读取jpg格式图片，再用np.array()方法将图片转成…

阅读更多...

图解Transformer

图解Transformer

图解Transformer Transformer模型是在论文《Attention is All You Need》中提出的。它的TensorFlow实现作为Tensor2Tensor包的一部分是可用的。哈佛大学的自然语言处理小组创建了一个指南，用PyTorch实现对论文进行了注释。在这篇文章中，我们将尝试简化一…

阅读更多...

基于CST的连续域束缚态（BIC）设计与机制研究

基于CST的连续域束缚态（BIC）设计与机制研究

关键词：太赫兹，超表面，连续域束缚态，CST，高Q 束缚态的概念最先出现于量子力学中，当粒子被势场约束在特定的区域内运动，即在无限远处波函数等于零的态叫束缚态，例如势阱中的粒子就处…

阅读更多...

MySQL操作语句练习【经典20题】

MySQL操作语句练习【经典20题】

emp 表视图 dept 表视图题目 1.请从表EMP中查找工种是职员CLERK或经理MANAGER的雇员姓名、工资。 2.请在EMP表中查找部门号在10－30之间的雇员的姓名、部门号、工资、工作。 3.请从表EMP中查找姓名以J开头所有雇员的姓名、工资、职位。 4.请从表EMP中查找工资低…

阅读更多...

EM算法数学推导

EM算法数学推导

EM算法可以看李航老师的《机器学习方法》、机器学习白板推导、EM算法及其推广进行学习。下文的数学推导出自“南瓜书”，记录在此只为方便查阅。

阅读更多...

qt 简单实验读取json格式的配置文件

qt 简单实验读取json格式的配置文件

1.概要 2.代码 //#include "mainwindow.h"#include <QApplication> #include <QFile> #include <QJsonDocument> #include <QJsonObject> #include <QDebug> //读取json数据的配置文件QJsonObject readJsonConfigFile(const QString …

阅读更多...

python-邮票组合问题

python-邮票组合问题

[题目描述] 某人有四张3分的邮票和三张5分的邮票，用这些邮票中的一张或若干张可以得到多少种不同的邮资？输入格式： 此题无输入。输出格式： 输出可以得到不同邮资的数量。样例输入无样例输出 19数据范围： 对于100%的…

阅读更多...

Stable Diffusion 3 文本生成图像在线体验原理分析

Stable Diffusion 3 文本生成图像在线体验原理分析

前言本文分享使用Stable Diffusion 3实现文本生成图像，可以通过在线网页中免费使用的，也有API等方式访问。同时结合论文和开源代码进行分析，理解其原理。 Stable Diffusion 3是Stability AI开发的最新、最先进的文本生成图像模型&#x…

阅读更多...

Linux常用命令（16）—awk命令（有相关截图）

Linux常用命令（16）—awk命令（有相关截图）

写在前面： 最近在学习Linux命令，记录一下学习Linux常用命令的过程，方便以后复习。仅供参考，若有不当的地方，恳请指正。如果对你有帮助，欢迎点赞，关注，收藏，评论&#xf…

阅读更多...

秋招突击——6/21——新作{两两交换链表中的节点,K个一组反转链表}

秋招突击——6/21——新作{两两交换链表中的节点,K个一组反转链表}

文章目录引言新做删除有序数组中的重复项个人实现 K 个一组翻转链表个人实现参考代码总结引言上午完全去听讲座了，听了三场，拿了三个讲座单，从九点一直到十二点。笔记本电脑插电才能用，就没带，所以没有进行复习。…

阅读更多...

GIT回滚

GIT回滚

1. 使用 git revert git revert 命令会创建一个新的提交，这个提交会撤销指定提交的更改。这通常用于公共分支（如 main 或 master），因为它不会重写历史。 git revert HEAD # 撤销最近的提交 # 或者指定一个特定的提交哈希值 …

阅读更多...

一句话、10秒，我用Claude 3.5 Sonnet生成了完整的俄罗斯方块！

一句话、10秒，我用Claude 3.5 Sonnet生成了完整的俄罗斯方块！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识…

阅读更多...

大模型项目落地时，该如何估算模型所需GPU算力资源

大模型项目落地时，该如何估算模型所需GPU算力资源

近期公司有大模型项目落地。在前期沟通时，对于算力估算和采购方案许多小伙伴不太了解，在此对相关的算力估算和选择进行一些总结。不喜欢过程的可以直接跳到HF上提供的模型计算器要估算大模型的所需的显卡算力，首先要了解大模型的参数基础知识。大模型的规模、参数的理解…

阅读更多...

没等来百度惊艳的All in AI，却等来了国产之光的盘古大模型 5.0

没等来百度惊艳的All in AI，却等来了国产之光的盘古大模型 5.0

6月21日，华为开发者大会（HDC 2024）在广东东莞正式开幕。盘古大模型5.0的更新，也是此次HDC2024的另一项重头戏。在过去的一年中，盘古大模型正在疯狂向各行各业渗透。此次，华为方面展示了他们在具身智能、医…

阅读更多...

推荐文章

最新文章