AI孙燕姿项目实现

news2024/11/19 21:19:35

最近在b站刷到很多关于ai孙笑川唱的歌曲,加上最近大火的ai孙燕姿,
这下“冷门歌手”整成热门歌手了

于是写下一篇文章, 如何实现属于的ai歌手。
注意滥用ai,侵犯他人的名誉是要承担法律责任的

在这里插入图片描述
下面是一些所需的文件链接:
sovits:github.com/svc-develop-team/so-vits-svc
一鍵包:www.bilibili.com/video/BV1Cc411H74D/
UVR5:www.bilibili.com/video/BV1ga411S7gP/

RX Audio Editor
123盤:www.123pan.com/s/RiyA-LjS03
夸克網盤:pan.quark.cn/s/f9791f6790d3
百度網盤:pan.baidu.com/s/1xUXd9vVHR11sjJ6wCVuwHQ?pwd=hjhj 提取碼: hjhj

Audio Slicer:
Github鏈接:github.com/flutydeer/audio-slicer/blob/main/README.zh-CN.md

整个项目的使用,从深度学习角度来说,可以分为模型推理和模型训练。

  • 第一种,我们可以用已有的ai歌手模型直接进行推理,输出
  • 第二种,自己训练一个ai歌手模型

对于模型推理,对电脑性能要求不高,但是模型训练,对显卡要求挺高

本项目主要使用的是So-VITS-SVC 4.0这个项目,github地址是:https://github.com/svc-develop-team/so-vits-svc

AI孙燕姿项目实现

  • 本地项目实现
    • 1.软件安装
    • 2.准备数据集
    • 3.开始训练 (本地训练)
    • 4.模型推理
  • 云端项目实现
  • ⚠️

本地项目实现

1.软件安装

sovits:github.com/svc-develop-team/so-vits-svc

解压后,找到webui.bat(这就是我们ai合成的工具)

2.准备数据集

注意数据集质量比数量更重要,如果要训练一个歌手,最好的方法就是下载他的唱的歌,下载高品质的音乐,除了歌手,还可以考虑采访的,直播的

做过语音处理的应该知道,语音数据需要经过一些处理,这里用UVR5软件提取出音乐的人声

具体实现

打开软件后,把需要提取的视频,拖到select input,文件最好用wav,设置输出路径select Output(随意),其余的参数,可以看下图
然后点击start processing,运行
在这里插入图片描述

处理完,还可以用RX Audio Editor(音频切片机)进一步处理,类似于做语音处理的,预加重,去燥,也可以用代码去实现

下载RX Audio Editor后解压,找到slicer-gui双击运行,将刚才处理好的,导入到其中,设置输出路径,输出完,把文件放到sovits目录下的dataset_raw
在这里插入图片描述

3.开始训练 (本地训练)

打开webui
点击识别数据集
然后点击数据预处理

在这里插入图片描述
往下看输出的信息,当看到100%,证明数据已经加载完毕了
在这里插入图片描述

配置自己的训练超参数,信息,然后点击从头开始训练
在这里插入图片描述

4.模型推理

回头推理界面,选择G开头的模型。选择配置文件,之后上传要转化的视频

在这里插入图片描述
设置音色变调
男转女 设置为5~8,女转男 -5~-8

在这里插入图片描述

接着直接点转换
在这里插入图片描述

如果音色不太好,可能就是模型训练,迭代次数少了,可以继续上次训练。跟深度学习模型训练原理一样

云端项目实现

跟上面处理数据集一样,把数据集压缩后,上传到云上的sovits项目地址的dataset_raw文件夹下,用命令unzip解压

云端项目实现的流程,在项目文件的reame-v4.ipynb里有详细说明了

在这里插入图片描述
按照这个jupyter notebook上面的步骤运行就行了

⚠️

这个github项目最后有一段关于模型使用的说明,以后ai的使用一定也会越来规范,不会滥用
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/516810.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

教你轻松玩转-ChatGPT或生成类大模型--助你成为未来高端黄金职业人

文章目录 1、前言2、大模型--巴拉巴拉小魔仙3、巴拉巴拉小魔仙-指导方向3、二次元美女或科幻图-魔法4、Cosplay-魔法5、魔法师5.1、系统消息5.2、小样本学习5.3、非对话场景5.4、使用明确的指令5.5、最后重复一遍指令5.5、对输出的操作5.6、添加语法5.7、把任务分解5.8、思维链…

如何开发网上独立商城?

互联网快速发展时代,越来越多的商家选择搭建自己的网上独立商城。网上独立商城是指一种完全独立于第三方平台的电子商务网站,可以帮助企业拥有更多的自主权,提高品牌影响力,降低营销成本,并且可以拥有更多的数据分析和…

java爬虫如何使用代理

在Java程序中使用代理是爬取网站数据的常见技术之一。代理服务器允许你通过它来访问某个网站,从而让你可以隐藏自己的真实IP地址或者规避一些地理限制等问题。 本文章将介绍如何使用Java实现网络爬虫代理。我们首先将介绍Java提供的代理相关类和方法,然…

详解C++类对象(中篇)——超详细

目录 前言:类的6个默认成员函数 一, 构造函数 1. 概念 2. 特性 二, 析构函数 2.1 概念 2.2 特性 2.3 牛刀小试 三, 拷贝构造函数 3.1概念 3. 2 特点 四, 赋值运算符重载 4. 1 运算符重载 五&#xff0…

【Redis高级应用】最佳实践

文章目录 Redis键值设计优雅的key结构拒绝BigKeyBigKey的危害如何发现BigKey如何删除BigKey 恰当的数据类型总结 批处理优化Pipeline我们的客户端与redis服务器是这样交互的MSetPipeline 集群下的批处理串行化执行代码实践 服务器端优化-持久化配置服务器端优化-慢查询优化什么…

Maven构建学习

目录 nacos是用来干什么的 Maven构建生命周期 Clean 生命周期 nacos是用来干什么的 在 Maven 项目中,pom.xml 文件中包含了项目的基本信息,通常包括: 能分别解释一下这里的 、、 maven-antrun-plugin分别起什么作用吗? rocke…

是德MSOX4104A 数字存储示波器

4000 X 系列拥有一系列引以为傲的配置,包括采用了电容触摸屏技术的 12.1 英寸显示屏、InfiniiScan 区域触摸触发、100 万波形/秒捕获率、MegaZoom IV 智能存储器技术和标配分段存储器。 MSOX4104A数字存储示波器 主要特性与技术指标 体验超凡速度: •1…

MQTT服务器搭建流程-QT开发客户端

目录 一、环境准备 二、客户端开发 2.1 下载并且编译MQTT 2.2 客户端开发准备 2.3 客户端开发源码 三、测试演示 一、环境准备 操作系统:centos7.5 链接: https://pan.baidu.com/s/1BRYQ13RTIgkyD0GDsXB1jQ 提取码: 29e2 MQTT服务器 使用EMQX作为服务器 安…

SpringCloud Alibaba 服务注册

一、SpringCloud Alibaba简介 Spring官网:https://spring.io/projects/spring-cloud-alibabaGitHub:https://github.com/alibaba/spring-cloud-alibabaGitHub中文文档:https://github.com/alibaba/spring-cloud-alibaba/blob/master/README-…

AFG1062任意波形/函数发生器 产品资料

AFG1000 任意波形/函数发生器,提供 25MHz 或 60MHz 带宽,2 个输出通道,在整个带宽内 1mVpp 到 10Vpp 输出振幅,泰克 AFG1000 任意波形/函数发生器可以生成各种实验室测试所需波形。 *重要的是,它在泰克任意函数发生器系…

卫龙上市后首份财报:营收净利双降、去年净利下滑8成

当你吃辣条的时候,你在吃什么? 味道?口感?还是童年的记忆? 近日,卫龙美味全球控股有限公司(下称“卫龙”)发布了上市后的首份年报。 卫龙是一家辣味休闲食品的企业,根…

portraiture插件下载安装PS磨皮滤镜插件

coco玛奇朵是讲磨皮插件的安装和使用方法,用的PS版本是PS2023版,不用你学很复杂的高低频磨皮美白祛痘技术,也不需要懂什么是ps磨皮中性灰,也不用各种骚操作,只需要一键就能磨皮。对于摄影爱好者来说,他真的…

微服务架构路线

一、我为什么选择微服务架构? 众所周知,单体应用程序,由于其种种不足,几乎不支持敏捷方法。如果你想为一个大型或复杂的业务创建一个软件项目,最好从微服务架构开始。 微服务架构是一种灵活的架构,可以显著…

【python 多线程】零基础也能轻松掌握的学习路线与参考资料

Python 多线程指的是在同一时间内,Python 程序中存在多个线程同时执行的情况。Python 中的线程是轻量级的,由操作系统进行调度和处理。多线程的学习对于想要进行 Python 并发编程的程序员来说是非常重要的。本文将提供 Python 多线程的学习路线、参考资料…

Talk预告 | 港中文博士生赖昕:SphereFormer大幅提升LiDAR点云远处识别性能

本期为TechBeat人工智能社区第496期线上Talk! 北京时间5月11日(周四)20:00,香港中文大学三年级博士生—赖昕的Talk将准时在TechBeat人工智能社区开播! 他与大家分享的主题是: “SphereFormer大幅提升LiDAR点云远处识别性能”,届时…

Talk预告 | 大连理工大学IIAU Lab在读博士生严彬:走向通用实例感知

本期为TechBeat人工智能社区第495期线上Talk! 北京时间5月10日(周三)20:00,大连理工大学IIAU Lab在读博士生—严彬的Talk将准时在TechBeat人工智能社区开播! 他与大家分享的主题是: “走向通用实例感知”,届时将介绍和探讨通用实…

Nginx从入门到精通

一、 Nginx能做什么 1.反向代理 2.负载均衡 3.HTTP服务器(包含动静分离) 4.正向代理 例如: 我当前配置的服务器 1、配置http 2、配置https 3、配置反向代理 [rootasia~]# cat /etc/nginx/nginx.conf # For more information on configur…

【Java零基础入门篇】第 ④ 期 - 继承(一)

【Java零基础入门篇】第 ④ 期 - 继承(一) 博主:命运之光专栏:Java零基础入门 学习目标 1.掌握继承性的主要作用、实现、使用限制; 2.掌握this和super的含义及其用法; 3.掌握方法覆写的操作; 4.…

windows环境安装使用nginx,redis详解

01-redis windows版下载地址: Releases microsoftarchive/redis GitHub 直接运行.msi的安装包,一直next,直到下面界面,勾选上再next 这一步选择端口,然后next(后面可以通过配置文件修改的) 选择最大缓存容…

哪种款式蓝牙耳机戴着舒服?公认佩戴舒适度高的蓝牙耳机

真无线蓝牙耳机具有使用方便、随身携带,一跃成为蓝牙耳机行业的新宠,几乎是人手必备的数码单品,耳机市场十分庞大,让消费者很难抉择到底蓝牙耳机哪个品牌最好,所以下面就介绍几款佩戴舒适度高的蓝牙耳机,分…