AI孙燕姿项目实现

news2026/2/13 16:57:39

最近在b站刷到很多关于ai孙笑川唱的歌曲，加上最近大火的ai孙燕姿，
这下“冷门歌手”整成热门歌手了

于是写下一篇文章，如何实现属于的ai歌手。
注意滥用ai，侵犯他人的名誉是要承担法律责任的

在这里插入图片描述
下面是一些所需的文件链接：
sovits：github.com/svc-develop-team/so-vits-svc
一鍵包：www.bilibili.com/video/BV1Cc411H74D/
UVR5：www.bilibili.com/video/BV1ga411S7gP/

RX Audio Editor
123盤：www.123pan.com/s/RiyA-LjS03
夸克網盤：pan.quark.cn/s/f9791f6790d3
百度網盤：pan.baidu.com/s/1xUXd9vVHR11sjJ6wCVuwHQ?pwd=hjhj 提取碼: hjhj

Audio Slicer：
Github鏈接：github.com/flutydeer/audio-slicer/blob/main/README.zh-CN.md

整个项目的使用，从深度学习角度来说，可以分为模型推理和模型训练。

第一种，我们可以用已有的ai歌手模型直接进行推理，输出
第二种，自己训练一个ai歌手模型

对于模型推理，对电脑性能要求不高，但是模型训练，对显卡要求挺高

本项目主要使用的是So-VITS-SVC 4.0这个项目，github地址是：https://github.com/svc-develop-team/so-vits-svc

AI孙燕姿项目实现

本地项目实现
- 1.软件安装
- 2.准备数据集
- 3.开始训练（本地训练）
- 4.模型推理
云端项目实现
⚠️

本地项目实现

1.软件安装

sovits：github.com/svc-develop-team/so-vits-svc

解压后，找到webui.bat（这就是我们ai合成的工具）

2.准备数据集

注意数据集质量比数量更重要，如果要训练一个歌手，最好的方法就是下载他的唱的歌，下载高品质的音乐，除了歌手，还可以考虑采访的，直播的

做过语音处理的应该知道，语音数据需要经过一些处理，这里用UVR5软件提取出音乐的人声

具体实现

打开软件后，把需要提取的视频，拖到select input，文件最好用wav，设置输出路径select Output（随意），其余的参数，可以看下图
然后点击start processing，运行
在这里插入图片描述

处理完，还可以用RX Audio Editor（音频切片机）进一步处理，类似于做语音处理的，预加重，去燥，也可以用代码去实现

下载RX Audio Editor后解压，找到slicer-gui双击运行，将刚才处理好的，导入到其中，设置输出路径，输出完，把文件放到sovits目录下的dataset_raw
在这里插入图片描述

3.开始训练（本地训练）

打开webui
点击识别数据集
然后点击数据预处理

在这里插入图片描述
往下看输出的信息，当看到100%，证明数据已经加载完毕了

配置自己的训练超参数，信息，然后点击从头开始训练
在这里插入图片描述

4.模型推理

回头推理界面，选择G开头的模型。选择配置文件，之后上传要转化的视频

在这里插入图片描述
设置音色变调
男转女设置为5～8，女转男 -5～-8

在这里插入图片描述

接着直接点转换
在这里插入图片描述

如果音色不太好，可能就是模型训练，迭代次数少了，可以继续上次训练。跟深度学习模型训练原理一样

云端项目实现

跟上面处理数据集一样，把数据集压缩后，上传到云上的sovits项目地址的dataset_raw文件夹下，用命令unzip解压

云端项目实现的流程，在项目文件的reame-v4.ipynb里有详细说明了

在这里插入图片描述
按照这个jupyter notebook上面的步骤运行就行了

⚠️

这个github项目最后有一段关于模型使用的说明，以后ai的使用一定也会越来规范，不会滥用
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/516810.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

教你轻松玩转-ChatGPT或生成类大模型--助你成为未来高端黄金职业人

教你轻松玩转-ChatGPT或生成类大模型--助你成为未来高端黄金职业人

文章目录 1、前言2、大模型--巴拉巴拉小魔仙3、巴拉巴拉小魔仙-指导方向3、二次元美女或科幻图-魔法4、Cosplay-魔法5、魔法师5.1、系统消息5.2、小样本学习5.3、非对话场景5.4、使用明确的指令5.5、最后重复一遍指令5.5、对输出的操作5.6、添加语法5.7、把任务分解5.8、思维链…

阅读更多...

如何开发网上独立商城？

如何开发网上独立商城？

互联网快速发展时代，越来越多的商家选择搭建自己的网上独立商城。网上独立商城是指一种完全独立于第三方平台的电子商务网站，可以帮助企业拥有更多的自主权，提高品牌影响力，降低营销成本，并且可以拥有更多的数据分析和…

阅读更多...

java爬虫如何使用代理

java爬虫如何使用代理

在Java程序中使用代理是爬取网站数据的常见技术之一。代理服务器允许你通过它来访问某个网站，从而让你可以隐藏自己的真实IP地址或者规避一些地理限制等问题。本文章将介绍如何使用Java实现网络爬虫代理。我们首先将介绍Java提供的代理相关类和方法，然…

阅读更多...

详解C++类对象（中篇)——超详细

详解C++类对象（中篇)——超详细

目录前言：类的6个默认成员函数一， 构造函数 1. 概念 2. 特性二， 析构函数 2.1 概念 2.2 特性 2.3 牛刀小试三， 拷贝构造函数 3.1概念 3. 2 特点四， 赋值运算符重载 4. 1 运算符重载五&#xff0…

阅读更多...

【Redis高级应用】最佳实践

【Redis高级应用】最佳实践

文章目录 Redis键值设计优雅的key结构拒绝BigKeyBigKey的危害如何发现BigKey如何删除BigKey 恰当的数据类型总结批处理优化Pipeline我们的客户端与redis服务器是这样交互的MSetPipeline 集群下的批处理串行化执行代码实践服务器端优化-持久化配置服务器端优化-慢查询优化什么…

阅读更多...

Maven构建学习

Maven构建学习

目录 nacos是用来干什么的 Maven构建生命周期 Clean 生命周期 nacos是用来干什么的在 Maven 项目中，pom.xml 文件中包含了项目的基本信息，通常包括： 能分别解释一下这里的、、 maven-antrun-plugin分别起什么作用吗？ rocke…

阅读更多...

是德MSOX4104A 数字存储示波器

是德MSOX4104A 数字存储示波器

4000 X 系列拥有一系列引以为傲的配置，包括采用了电容触摸屏技术的 12.1 英寸显示屏、InfiniiScan 区域触摸触发、100 万波形/秒捕获率、MegaZoom IV 智能存储器技术和标配分段存储器。 MSOX4104A数字存储示波器主要特性与技术指标体验超凡速度： •1…

阅读更多...

MQTT服务器搭建流程-QT开发客户端

MQTT服务器搭建流程-QT开发客户端

目录一、环境准备二、客户端开发 2.1 下载并且编译MQTT 2.2 客户端开发准备 2.3 客户端开发源码三、测试演示一、环境准备操作系统：centos7.5 链接: https://pan.baidu.com/s/1BRYQ13RTIgkyD0GDsXB1jQ 提取码: 29e2 MQTT服务器使用EMQX作为服务器安…

阅读更多...

SpringCloud Alibaba 服务注册

SpringCloud Alibaba 服务注册

一、SpringCloud Alibaba简介 Spring官网：https://spring.io/projects/spring-cloud-alibabaGitHub：https://github.com/alibaba/spring-cloud-alibabaGitHub中文文档：https://github.com/alibaba/spring-cloud-alibaba/blob/master/README-…

阅读更多...

AFG1062任意波形/函数发生器产品资料

AFG1062任意波形/函数发生器产品资料

AFG1000 任意波形/函数发生器，提供 25MHz 或 60MHz 带宽，2 个输出通道，在整个带宽内 1mVpp 到 10Vpp 输出振幅，泰克 AFG1000 任意波形/函数发生器可以生成各种实验室测试所需波形。 *重要的是，它在泰克任意函数发生器系…

阅读更多...

卫龙上市后首份财报：营收净利双降、去年净利下滑8成

卫龙上市后首份财报：营收净利双降、去年净利下滑8成

当你吃辣条的时候，你在吃什么？ 味道？口感？还是童年的记忆？ 近日，卫龙美味全球控股有限公司（下称“卫龙”）发布了上市后的首份年报。卫龙是一家辣味休闲食品的企业，根…

阅读更多...

portraiture插件下载安装PS磨皮滤镜插件

portraiture插件下载安装PS磨皮滤镜插件

coco玛奇朵是讲磨皮插件的安装和使用方法，用的PS版本是PS2023版，不用你学很复杂的高低频磨皮美白祛痘技术，也不需要懂什么是ps磨皮中性灰，也不用各种骚操作，只需要一键就能磨皮。对于摄影爱好者来说，他真的…

阅读更多...

微服务架构路线

微服务架构路线

一、我为什么选择微服务架构？ 众所周知，单体应用程序，由于其种种不足，几乎不支持敏捷方法。如果你想为一个大型或复杂的业务创建一个软件项目，最好从微服务架构开始。微服务架构是一种灵活的架构，可以显著…

阅读更多...

【python 多线程】零基础也能轻松掌握的学习路线与参考资料

【python 多线程】零基础也能轻松掌握的学习路线与参考资料

Python 多线程指的是在同一时间内，Python 程序中存在多个线程同时执行的情况。Python 中的线程是轻量级的，由操作系统进行调度和处理。多线程的学习对于想要进行 Python 并发编程的程序员来说是非常重要的。本文将提供 Python 多线程的学习路线、参考资料…

阅读更多...

Talk预告 | 港中文博士生赖昕：SphereFormer大幅提升LiDAR点云远处识别性能

Talk预告 | 港中文博士生赖昕：SphereFormer大幅提升LiDAR点云远处识别性能

本期为TechBeat人工智能社区第496期线上Talk！ 北京时间5月11日(周四)20:00，香港中文大学三年级博士生—赖昕的Talk将准时在TechBeat人工智能社区开播！ 他与大家分享的主题是: “SphereFormer大幅提升LiDAR点云远处识别性能”，届时…

阅读更多...

Talk预告 | 大连理工大学IIAU Lab在读博士生严彬：走向通用实例感知

Talk预告 | 大连理工大学IIAU Lab在读博士生严彬：走向通用实例感知

本期为TechBeat人工智能社区第495期线上Talk！ 北京时间5月10日(周三)20:00，大连理工大学IIAU Lab在读博士生—严彬的Talk将准时在TechBeat人工智能社区开播！ 他与大家分享的主题是: “走向通用实例感知”，届时将介绍和探讨通用实…

阅读更多...

Nginx从入门到精通

Nginx从入门到精通

一、 Nginx能做什么 1.反向代理 2.负载均衡 3.HTTP服务器（包含动静分离） 4.正向代理例如： 我当前配置的服务器 1、配置http 2、配置https 3、配置反向代理 [rootasia~]# cat /etc/nginx/nginx.conf # For more information on configur…

阅读更多...

【Java零基础入门篇】第 ④ 期 - 继承（一）

【Java零基础入门篇】第 ④ 期 - 继承（一）

【Java零基础入门篇】第 ④ 期 - 继承（一） 博主：命运之光专栏：Java零基础入门学习目标 1.掌握继承性的主要作用、实现、使用限制； 2.掌握this和super的含义及其用法； 3.掌握方法覆写的操作； 4.…

阅读更多...

windows环境安装使用nginx，redis详解

windows环境安装使用nginx，redis详解

01-redis windows版下载地址： Releases microsoftarchive/redis GitHub 直接运行.msi的安装包，一直next，直到下面界面,勾选上再next 这一步选择端口，然后next（后面可以通过配置文件修改的） 选择最大缓存容…

阅读更多...

哪种款式蓝牙耳机戴着舒服？公认佩戴舒适度高的蓝牙耳机

哪种款式蓝牙耳机戴着舒服？公认佩戴舒适度高的蓝牙耳机

真无线蓝牙耳机具有使用方便、随身携带，一跃成为蓝牙耳机行业的新宠，几乎是人手必备的数码单品，耳机市场十分庞大，让消费者很难抉择到底蓝牙耳机哪个品牌最好，所以下面就介绍几款佩戴舒适度高的蓝牙耳机，分…

阅读更多...

推荐文章

最新文章