【真人语音】讯飞星火个人声音训练及导出下载工具V0.2.exe

news2025/1/20 12:08:35

【项目背景】

小编一直在尝试着短视频技术,在读文案的时候经常会读错;所以,只能用微软或者剪映的文本转语音软件。

很早之前在Github上也看到过真人人声训练的开源代码,尝试过一番之后,也是以失败告终;就在前几个月歌手语音的训练、个人真人声音的训练又火了一波,新的开源代码小编手上也有,但是无奈自己的N卡太弱,跑pytorch心有余而力不足。

这不,随着国内擅长声音处理的讯飞大模型融合了真人声音训练,小编借此机会对其做了一个小小的封装。可以导出下载自己的声音。

【项目实现】

https://xinghuo.xfyun.cn/desk

首先,需要用讯飞的大模型训练自己的声音,右上角点击创建发音人,这个时候需要录制10段个人语音,云端训练大概需要5~10分钟,训练好之后的界面同上图,可以选择发音人(真人人声)。

然后,就可以将自己的文本投喂给大模型,可以是问题,也可以是自己已经写好的文本,具体例子:

用户:请润色下面文本,并拟定1个吸睛的标题。
文本:
土木工程现在房地产大环境下不是太热门,其实大学的专业作为对于每个人来讲(个人观点),本身就是将来对于自己的一个谋生的手段,这个专业大家最多的印象最多的就是提桶跑路吧,但是每个专业都有每个专业的好处与坏处,这个专业门槛低,就业前期工作收入比较高,就业方向比较多,造价,施工、设计,监理等,适合善于交际的人。坏处大家都应该知道,环境相对别的专业较差,有时候面对的班组劳务的教育水平不是很高,人际关系不好后期发展受限等。

星火大模型回答的文本,就出出现一个语音按钮,点击该按钮就可以听到你的真人发音。但是,该大模型已经禁止浏览使用开发模式,生成的TTS音频无法通过插件工具实现音频导出。

解决方案:通过声卡复制类软件,实现在朗读语音时,对声卡数据进行复制,进而实现音频导出。

请重新输出以下文本:土木工程现在房地产大环境下不是太热门,其实大学的专业作为对于每个人来讲(个人观点),本身就是将来对于自己的一个谋生的手段,这个专业大家最多的印象最多的就是提桶跑路吧,但是每个专业都有每个专业的好处与坏处,这个专业门槛低,就业前期工作收入比较高,就业方向比较多,造价,施工、设计,监理等,适合善于交际的人。

作为一个准程序员,这种方案可以解决问题,但总是差强人意。

于是,在想,能不能通过fiddler分析转换接口,形成API或者封装成一个工具?说干就干,刚好西安周末下雨,宅在家里,对其进行分析,最终封装成一个exe。

使用该工具,需要下载fiddler,获取ID和cookies。

上图,点击①链接,在②处复制header即可获取到cookie,在③处可以获取到ID(tts)。

接下来就可以用剪映工具制作视频(真人原声),从此告别千篇一律的机器声。

【工具下载】

https://intumu.com/article/202

【应用拓展】

真人人声+MD数字人?可以衍生出很多Ideas,感兴趣的小伙伴也可以加小编微信探讨。

学Python并不难,会敲键盘就能学!

【扩展操作】

第1步,借助天工AI搜索(tiangong.cn),直接手机短信验证就可以使用,该大模型已经接入互联网,注意提问方式。细心的筒子已经发现,该回答可能已经包含了逼乎的优质答案。举个例子:

设计院作为一种专业设计机构,在技术发展和社会变革的进程中,AI的出现无疑对其职能和工作方式产生了一定的影响。从不同的角度来看,可以得出以下结论:

  1. 辅助设计工具角度:AI在设计过程中可以作为一种辅助工具,提供更高效、精确的设计方案,例如自动生成设计草图、优化设计布局、预测设计风格趋势等。这使得设计师能够更加专注于创造性的思考和决策,提高整体设计效率和质量。2

  2. 可替代性角度:虽然AI在某些设计领域已经取得了一定的成就,但目前AI在感知、理解和创造性思维等方面仍存在局限性,难以完全替代设计师。设计师的专业知识、审美能力、情感共鸣等人类特质仍然是无法被AI所取代的重要优势。23

  3. 创新驱动角度:设计院作为创新的源头和推动者,需要不断引领和适应时代的发展潮流。AI作为一种前沿技术,可以为设计院注入新的思维和工具,推动设计过程中的技术创新和设计方法的更新。同时,设计院也需要拥抱AI,不断学习和掌握AI技术,以更好地应对未来的设计需求和挑战。2

  4. 可能的协作模式角度:AI和人类设计师可以形成一种合作共生的模式,人类设计师依托AI技术进行设计创造,而AI作为设计创意的辅助和扩展,提供更多样的设计选项和创意启发。这种协作模式可以将人机优势进行有机结合,创造出更具创新性和人性化的设计成果。2

  5. 市场需求角度:随着AI技术的不断发展和应用,一些低端和重复性的设计任务可能会逐渐被AI所取代,设计师需要转向更加高级和创造性的设计方向。同时,人们对于个性化、定制化设计的需求也在不断增加,这为设计师提供了更多的发展空间和机会。4

  6. 知识产权保护角度:在AI的设计过程中,对于涉及专利、版权等知识产权的问题,需要加强相关的法律和制度保护,以确保设计活动的公平性和正当性。AI与设计师之间应遵守知识产权的法律法规,保护设计成果的合法权益。2

  7. 教育培训角度:随着AI的发展应用,设计院需要不断更新教育培训内容和方法,加强对设计师的技术和人文素养的培养,使其具备与AI技术协作的能力和思维方式。同时,设计院也需要与高校、科研机构等合作,推动相关学科的交叉融合,培养具备跨学科综合素养的设计人才。3

  8. 社会认知角度:设计院的发展与社会对于AI的认知和接受程度密切相关。加强对于人工智能技术的普及和宣传,提高公众对AI的理解与信任,有助于推动设计院与AI的良好合作与发展。2

  9. 倫理責任角度:面对AI技术在设计领域的广泛应用,设计师和设计院应当重视伦理责任的问题,确保设计过程中的公正、公平和人类价值的尊重。避免AI技术的滥用和伦理风险,提倡科技与人文的有机结合,实现设计的社会效益最大化。23

  10. 发展前景角度:综上所述,AI对设计院的影响是不可忽视的,但目前并不存在AI能够完全取代设计院的可能。设计院在与AI技术的结合中应以智能化、创新化为方向,不断适应时代的发展,提高设计效率和质量,为社会经济建设提供更加优秀的设计方案。23

综合以上观点可以得出结论:设计院将与AI形成合作共生关系,利用AI技术提升设计效率和质量;设计师的专业知识、审美能力和创造性思维仍然是无法被AI所替代的重要优势;设计院需要适应和引领AI技术的发展趋势,重视伦理责任,推动设计创新和社会效益的最大化。

第2步,借助讯飞星火大模型的真人人声训练,可以避免千篇一律的机器人声音,这个时候需要借助工具,将你自己的声音导出。

第3步,借助必剪工具,图文成片,必剪可以根据文案生成对应的素材,字幕,背景音乐等。这个时候,我们需要删除字幕、背景音乐,只保留视频素材。

第4步,加载第2步生成的真人人声,再借助必剪工具的智能字幕根据真人人身匹配文案,这个时候可能出现原有视频素材长度大于真人人声,直接剪掉多余部分即可。最后,换上自己喜欢的背景音乐,加上封面,Over,发布在各大视频平台,慢慢积攒用户。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/943419.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IMX989 35mm模组首发,厚度惊人,努比亚能吃到第一波红利吗?

根据数码闲聊站的曝光内容,努比亚即将推出一款工程机,据称将搭载索尼IMX989 35mm镜头。从曝光图来看,该工程机的镜头模组采用了圆形设计,相比传统手机要更厚一些。最引人注目的是该手机预计将搭载对焦环,这使得该工程机…

.ssh文件夹下缺失known_hosts文件

.ssh文件夹下缺失known_hosts文件 先确认工蜂或github 添加了git生成的密钥 然后 桌面打开git bash 1、执行ssh -T gitgitlab.com 2、输入yes

Vue2-初识路由、路由分类、路由的基本使用、嵌套(多级)路由、路由的query参数、路由的params参数、路由的props配置

🥔:有的山长满荆棘,有的山全是野兽,所以你应该是自己的那座山 更多Vue知识请点击——Vue.js VUE2-Day12 路由简介1、什么是SPA?2、什么是路由?3、路由的分类①前端路由②后端路由 路由的基本使用1、编写rou…

spark 部署

下载spark 安装包 spark官网下载 pre-built with user-provided 会支持更多的hadoop,已经安装了hadoop和java环境的选这个比较好 wget https://dlcdn.apache.org/spark/spark-3.3.2/spark-3.3.2-bin-hadoop3.tgz安装 解压 tar -xvf spark-3.3.2-bin-hadoop3.tgz …

【java】【项目实战】[外卖八]产品展示、购物车、下单开发

目录 一、导入用户地址簿相关功能代码 1 需求分析 2 数据模型 3 导入功能代码 3.1 实体AddressBook 3.2 Mapper接口AddressBookMapper 3.3 业务接口层AddressBookService 3.4 业务接口实现类AddressBookServiceImpl 3.5 控制层AddressBookController 4 功能测试 二、…

读SQL学习指南(第3版)笔记06_连接和集合

1. 连接 1.1. 笛卡儿积 1.1.1. 交叉连接(cross join) 1.1.2. 查询并没有指定两个数据表应该如何连接,数据库服务器就生成了笛卡儿积 1.1.2.1. 两个数据表的所有排列组合 1.1.3. 很少会用到(至少不会特意用到) 1.…

NameNode 故障无法重新启动解决方法

文章目录 NameNode 进程挂掉NameNode 进程挂掉且数据丢失 NameNode 进程挂掉 如果只是单纯的进程挂掉了,可以直接使用下列命令进行重启: hdfs --daemon start namenode示例: NameNode 进程挂掉且数据丢失 这种情况就不可以直接通过重启解决…

com.mysql.jdbc.PacketTooBigException: Packet for query is too large(windows)

使用mysql查询数据的时候报错: Caused by: com.mysql.jdbc.PacketTooBigException: Packet for query is too large (1078 > 1024). You can change this value on the server by setting the max_allowed_packet variable. 这是因为mysql的server默认接受数据…

java项目mysql转postgresql

特殊函数 : mysql: find_in_set(?, ancestors) postgresql: ? ANY (string_to_array(ancestors,,)) mysql: date_format(t1.oper_time, %Y-%m-%d) postgresql: rksj::date to_char(inDate,YYYY-MM-DD) mysql&am…

基于北斗RTK+UWB矿山智能人车定位系统

露天矿山开采环境复杂,作业危险系数高,安全生产隐患多。智能人车定位技术在保障露天矿山安全生产方面具有重要作用。通过实时监测人员和车辆的位置和行动,可以有效防止事故发生、提高工作效率和管理水平。 华安联大以露天矿山安全生产为出发…

Ubuntu 下安装Qt5.12.12无法输入中文解决方法

Ubuntu 下安装Qt5.12.12无法输入中文解决方法 一,环境: (1)VMware Workstation 15 Pro (2)Ubuntu 20.04 (3)Qt 5.12.12 64bits (4)Qt Creator 5.0.2 &#…

基于 OV5640 摄像头理论知识讲解-成像和采样原理

基于OV2640/ OV5640 的图像采集显示系统系列文章目录: (1)基于 OV5640 摄像头理论知识讲解-成像和采样原理 (2)基于 OV5640 摄像头理论知识讲解-数字接口和控制接口 (3)基于 OV5640 摄像头理论知…

Qt应用开发(基础篇)——字体选择器 QFontDialog

一、前言 QFontDialog类继承于QDialog,是一个设计用来选择字体的对话框部件。 对话框窗口QDialog QFontDialog字体选择对话框,设计用来让用户选择某一种字体,一般用于文本编辑窗口、标签显示和一些需要文本输入的场景。你可以直接使用静态函数…

2、DVWA——命令注入

文章目录 一、命令注入1.1 概述1.2 判断命令注入流程 二、low2.1 通关思路2.2.源码分析 三、Medium3.1 通关思路3.2 源码分析 四、high4.1 通关思路4.2 源码分析 五、impossible六、总结 一、命令注入 1.1 概述 命令注入的目标是通过易受攻击的应用程序在主机操作系统上执行任…

『赠书活动 | 第十八期』《深入浅出SSD:固态存储核心技术、原理与实战》

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! 『赠书活动 | 第十八期』 本期书籍:《深入浅出SSD:固态存储核心技术、原理与实战》 赠书规则:评论区:点赞&…

【力扣每日一题】2023.8.29 带因子的二叉树

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 题目给我们一些元素,让我们用这些元素连接形成特定的二叉树,每种元素可以使用任意次数,形成的二叉树要…

【深度解析】朗逸与宝来汽车:哪款更适合你?

在汽车市场中,朗逸和宝来都是非常受欢迎的车型。它们各自都有独特的优点和缺点,那么,究竟哪款车更适合你呢?让我们一起来深度解析一下。 朗逸,作为大众的入门级车型,以其稳定的性能和较高的性价比赢得了消费…

深入详解ThreadLocal

本文已收录至GitHub,推荐阅读 👉 Java随想录 微信公众号:Java随想录 原创不易,注重版权。转载请注明原作者和原文链接 文章目录 什么是ThreadLocalThreadLocal 原理set方法get方法remove方法 ThreadLocal 的Hash算法ThreadLocal …

海川润泽气泡水位计 重磅上线

一、概述 以市场为导向,海川润泽推出新款气泡水位计(型号:HC-QPSW10-S)。气泡水位计具有测量精度高,免气瓶,免测井,免维护,抗振动,寿命长等特点,特别适用于流…

印刷行业MES系统解决方案

印刷行业存在许多问题,这些问题可能因地区、技术和市场变化而有所不同。以下是一些可能的印刷行业现存问题: 1.环保问题:印刷过程中使用的化学品和材料可能对环境造成污染。废墨、废纸、有毒化学品等的处理和处理成为一个重要的问题。 2.…