【真人语音】讯飞星火个人声音训练及导出工具V0.2.exe

news2024/10/6 14:25:53

【项目背景】

小编一直在尝试着短视频技术,在读文案的时候经常会读错;所以,只能用微软或者剪映的文本转语音软件。

很早之前在Github上也看到过真人人声训练的开源代码,尝试过一番之后,也是以失败告终;就在前几个月歌手语音的训练、个人真人声音的训练又火了一波,新的开源代码小编手上也有,但是无奈自己的N卡太弱,跑pytorch心有余而力不足。

这不,随着国内擅长声音处理的讯飞大模型融合了真人声音训练,小编借此机会对其做了一个小小的封装。

【项目实现】

https://xinghuo.xfyun.cn/desk

首先,需要用讯飞的大模型训练自己的声音,右上角点击创建发音人,这个时候需要录制10段个人语音,云端训练大概需要5~10分钟,训练好之后的界面同上图,可以选择发音人(真人人声)。

然后,就可以将自己的文本投喂给大模型,可以是问题,也可以是自己已经写好的文本,具体例子:

用户:请润色下面文本,并拟定1个吸睛的标题。
文本:
土木工程现在房地产大环境下不是太热门,其实大学的专业作为对于每个人来讲(个人观点),本身就是将来对于自己的一个谋生的手段,这个专业大家最多的印象最多的就是提桶跑路吧,但是每个专业都有每个专业的好处与坏处,这个专业门槛低,就业前期工作收入比较高,就业方向比较多,造价,施工、设计,监理等,适合善于交际的人。坏处大家都应该知道,环境相对别的专业较差,有时候面对的班组劳务的教育水平不是很高,人际关系不好后期发展受限等。

星火大模型回答的文本,就出出现一个语音按钮,点击该按钮就可以听到你的真人发音。但是,该大模型已经禁止浏览使用开发模式,生成的TTS音频无法通过插件工具实现音频导出。

解决方案:通过声卡复制类软件,实现在朗读语音时,对声卡数据进行复制,进而实现音频导出。

请重新输出以下文本:土木工程现在房地产大环境下不是太热门,其实大学的专业作为对于每个人来讲(个人观点),本身就是将来对于自己的一个谋生的手段,这个专业大家最多的印象最多的就是提桶跑路吧,但是每个专业都有每个专业的好处与坏处,这个专业门槛低,就业前期工作收入比较高,就业方向比较多,造价,施工、设计,监理等,适合善于交际的人。

作为一个准程序员,这种方案可以解决问题,但总是差强人意。

于是,在想,能不能通过fiddler分析转换接口,形成API或者封装成一个工具?说干就干,刚好西安周末下雨,宅在家里,对其进行分析,最终封装成一个exe。

使用该工具,需要下载fiddler,获取ID和cookies。

上图,点击①链接,在②处复制header即可获取到cookie,在③处可以获取到ID(tts)。

接下来就可以用剪映工具制作视频(真人原声),从此告别千篇一律的机器声。

【工具下载】

https://intumu.com/article/202

【应用拓展】

真人人声+MD数字人?可以衍生出很多Ideas,感兴趣的小伙伴也可以加小编微信探讨。

学Python并不难,会敲键盘就能学!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/910438.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

若依项目的运行详细步骤

目录 一、项目的解读与获取 二、项目的运行 后端步骤(ruoyi-admin) (一)导入若依的2个SQL文件 版本建议 (二)Redis的配置 (三)启动后端 前端步骤(ruoyi-ui) 版本建议 (一)…

深入了解Git:介绍及常用命令指南

当今软件开发领域中,版本控制是一个至关重要的概念,而Git作为最流行的分布式版本控制系统,发挥着不可替代的作用。本文将介绍Git的基本概念以及常用命令,帮助你更好地理解和使用这一强大的工具。 Git简介 Git是一种分布式版本管…

结构化知识管理-20张思维导图为例子

思维导图,是结构化思考最高效的工具。 以中心主题为核心,通过各级主题的组合来呈现信息。 思维导图的可视化图形表达,让我们可以更加便于理解和记忆。各主题间相互连接的形式,展现了信息间的相关性。促进我们综合性的思考。思维导…

飞机打方块(三)特殊按钮制作

一、特殊按钮容器 1.新建PropController脚本,并绑定新建的特殊按钮容器节点 GameController.ts property({ type: cc.Node, displayName: "特殊按钮节点", tooltip: "特殊按钮节点,分别为全消无敌和菜单" })special_btn: cc.Node …

三种生成树(STP,RSTP,MSTP)的基本配置(自我理解)

目录 一、为什么要使用生成树(STP): 二、由于设备冗余而导致的问题: 广播风暴: 三、802.1D生成树基本配置 四、802.1D生成树实验 实验拓扑: 实验配置: 配置完成后,在SW8上观察现象&…

[Docker] Windows 下基于WSL2 安装

Docker 必须部署在 Linux 内核的系统上。如果其他系统想部署 Docker 就必须安装一个虚拟 Linux 环境。 1. 开启虚拟化 进入系统BIOS(AMD 为 SVM;Intel 为 Intel-vt)改为启用(enable) 2. 开启WSL 系统设置->应用->程序和功能->…

前端 -- 基础 HTML基本语法 结构标签介绍

HTML 语法规范 基本语法概述 : HTML 标签是由尖括号包围的关键词&#xff0c;示例 &#xff1a; <html> HTML 标签通常是成对出现的&#xff0c;例如 <html > 和 < /html > &#xff0c; 我们称为双标签。 标签对中的第一个标签是 开始标签&#xff0c;…

docker搭建私有镜像harbor

docker安装搭建私有仓库 Harbor harbor用于存储和分布docker镜像企业级registry服务器的harbor使用的是官方的docker registry(v2命名是distribution)服务去完成。 安装harhor 启动harbor 6.

【算法日志】动态规划刷题:整数拆分,n节点的BST数量(day35)

代码随想录刷题60Day 目录 前言 整数拆分 N个数节点的二叉搜索树数量 前言 今天问题的难点在于从问题中抽象出dp数组和状态转移方程。 整数拆分 int integerBreak1(int n) {vector<int> dp(n 1, 0);dp[1] 1;for (int i 2; i < n; i)for (int j 1; j < i; j…

工厂模式并不难理解

文章目录 工厂模式简单工厂模式简单工厂模式使用的场景 工厂方法模式工厂方法模式使用场景 抽象工厂模式抽象工厂模式使用场景 工厂模式 功能&#xff1a;将对象的创建交给工厂&#xff0c;我们只需要告诉工厂我们要什么对象就可以得到该对象。 目的&#xff1a;实现创建对象…

流媒体服务器SRS的搭建及QT下RTMP推流客户端的编写

一、前言 目前市面上有很多开源的流媒体服务器解决方案&#xff0c;常见的有SRS、EasyDarwin、ZLMediaKit和Monibuca。这几种的对比如下&#xff1a; &#xff08;本图来源&#xff1a;https://www.ngui.cc/zz/1781086.html?actiononClick&#xff09; 二、SRS的介绍 SRS&am…

SSRF 服务器端请求伪造

文章目录 SSRF(curl)网址访问通过file协议访问本地文件dict协议扫描内网主机开放端口 SSRF(file_get_content)网站访问http协议请求内网资源通过file协议访问本地文件 SSRF(Server-Side Request Forgery:服务器端请求伪造) 其形成的原因大都是由于服务端提供了从其他服务器应用…

FastJson在Java后端方面解析使用(二)

​ JSON现在常用来做前后端数据交互&#xff0c;两个蝴蝶飞只是简单的对JSON做一下讲解和简单使用。关于JSON,我还了解的远远不够。由于本人经验有限&#xff0c;嘴皮子不溜&#xff0c;所以学术性&#xff0c;概念性&#xff0c;底层性的知识点暂时不做介绍。文章中有错误之处…

教育行业选择CRM系统需具备的四大功能

教育行业的发展一波三折&#xff0c;要想在激烈的赛道脱颖而出&#xff0c;就需要有一套有效的CRM系统&#xff0c;来帮助教育机构提升招生效率、增加学员留存、提高教学质量。那么&#xff0c;教育行业的CRM系统要具备哪些功能&#xff1f; 招生管理&#xff1a; 教育机构的…

STM32入门——SPI通讯

江科大STM32学习记录 SPI通信 SPI&#xff08;Serial Peripheral Interface&#xff09;是由Motorola公司开发的一种通用数据总线四根通信线&#xff1a;SCK&#xff08;Serial Clock&#xff09;、MOSI&#xff08;Master Output Slave Input&#xff09;、MISO&#xff08;…

log4j2配置文件的加载顺序

文章目录 如果同时存在 log4j2-test.xml 和 log4j2.xml 文件 那么默认先加载 log4j2-test.xml&#xff0c;而不是log4j2.xml 官方文档介绍&#xff1a;https://logging.apache.org/log4j/2.x/manual/configuration.html 以下内容来自官方文档翻译&#xff1a; Log4j 2 的配置…

淘宝商品详情采集接口item_get-获得淘宝商品详情(可高并发线程)

获得淘宝商品详情页面数据采集如下&#xff1a; taobao.item_get 公共参数 名称类型必须描述keyString是调用key&#xff08;必须以GET方式拼接在URL中&#xff09;注册key账号接入secretString是调用密钥api_nameString是API接口名称&#xff08;包括在请求地址中&#xff0…

动手学深度学习—深度卷积神经网络AlexNet(代码详解)

AlexNet 1. 学习表征1.1 缺少的成分&#xff1a;数据1.2 缺少的成分&#xff1a;硬件 2. AlexNet2.1 模型设计2.2 激活函数2.3 容量控制和预处理 3. 读取数据集4. 训练AlexNet ImageNet classification with deep convolutional neural networks 原文链接&#xff1a;https://d…

尚品汇项目(Day1)

项目结构介绍 vue-cli 脚手架初始化项目 node webpack 淘宝镜像 node_modules文件夹&#xff1a;项目依赖文件夹 public文件夹&#xff1a;一般放置静态资源&#xff08;图片&#xff09;&#xff0c;需要注意&#xff1a;放在public文件夹中的静态资源&#xff0c;webpac…