AI翻唱+视频剪辑全流程实战

news2024/11/24 23:11:17

目录

一、AI翻唱之模型训练

(1)模型部署    

(2)数据集制作——搜集素材

(3)数据集制作——提升音频质量

方法一:使用RVC提供的音频处理功能。

方法二:可以使用音频剪辑工具Adobe Audition

(4)训练

二、AI翻唱之模型推理

三、视频剪辑


前言:从0到1,忙碌了三天,剪了三个视频,其中两个放在了B站(星铁新角色知更鸟翻唱Love Story和Mr. Wonderful),第三个是四个原神角色合唱孤勇者:【知更鸟】Love Story_哔哩哔哩_bilibili

【知更鸟】Mr. Wonderful_哔哩哔哩_bilibili

一、AI翻唱之模型训练

(1)模型部署    

 我使用的是RVC,也可以使用so-vits-svc。

这里分别提供了Nvida显卡和AMD显卡支持的版本

链接:https://pan.baidu.com/s/1vtw_gRCIUdDjPH9cELjVkw?pwd=bi3r 
提取码:bi3r

以Nvida显卡为例,分别下载“RVC1006Nvidia”和“0128补丁”压缩包,分别解压后,复制“0128补丁”内容粘贴到“RVC1006Nvidia”文件夹进行替换

之后,直接点击go-web.bat运行即可。(需要电脑安装好CUDA,安装步骤不再赘述)

(2)数据集制作——搜集素材

方法一:从网上查找现成音频数据集(如github)

方法二:从B站下载音视频制作。

        这里推荐使用DownKyi(哔哩下载姬),在此提供了三个版本。

链接:https://pan.baidu.com/s/1Kyc_cbYL7cIbwFTpXrDVdA?pwd=saq7 
提取码:saq7

                 1.5.9可能存在B站用户无法登陆问题;1.6.1可以登录然后下载高清视频,但是使用过程中出现无法解析的问题。一种解决方案是登录在1.6.1中账号登录后,将1.5.9文件夹内容复制到1.6.1。

另一种方案是直接使用DownKyi-1.0.10-1.win-x64

(3)数据集制作——提升音频质量

由于视频中可能出现背景音或其他不属于角色的杂音,这时就需要进行背景音处理。 

方法一:使用RVC提供的音频处理功能。

直接将原始音频文件拖到上图中左下角红框内,然后点击模型选择HP3,点击转换;

转换后的结果再次放入上图中左下角红框内,点击模型选择onnx_dereverb,点击转换;

也可继续进行别的处理,每个模型的说明见上图。

方法二:可以使用音频剪辑工具Adobe Audition

安装步骤见我的另一篇博客:

Adobe Audition 2024 下载与安装-CSDN博客

处理背景音:

1. 选中一段不含人声的背景音

2. 在“效果”栏中选择“降噪/恢复”中的“降噪(处理)” 

3. 点击“捕捉噪声样本”,然后点击“选择完整文件”,最后点击“应用”就可以啦

(4)训练

1. 输入实验名(自拟),然后选择音频目标采样率(一般为40k),其他保持默认 ,点击“处理数据”即可。(此步骤是将音频剪切成数个短节,“输出信息”栏会提示进程结束)

2. 根据自身情况选择音高提取算法(输入歌声可用pm提速,高质量语音但CPU差可用dio提速,harvest质量更好但慢,rmvpe效果最好且微吃CPU/GPU),之后点击“特征提取”(“输出信息”栏会提示进程结束)

3. 根据自身显卡性能选择“保存频率”、“总训练轮数”和“每张显卡的batch_size”(显卡不太行的建议设置低一点),其他保持默认,点击“一键提取”(“输出信息”栏会提示进程结束)

二、AI翻唱之模型推理

1. 切换到“模型推理”界面,在“推理音色”上选择上面步骤一训练好的模型权重文件;

也可以在网上直接下载别人已经训练好的模型,将.pth文件放在  RVC\assets\weights  目录下,将索引.index文件放在 logs 目录或logs下面的文件夹皆可。

 

2. 输入待处理音频文件路径,即需要模拟的声音或歌曲文件所在的路径。

3. 输入索引index路径。

4. 根据 下图中蓝色部分的说明适当进行调整,即可点击“转换”开始模型推理。

三、视频剪辑

一个好的视听盛宴当然离不开视频剪辑啦。推荐使用PR进行剪辑,当然也可以使用“剪映”这个软件也比较方便。

PR安装与下载方法,可见:Adobe Premiere Pro安装-CSDN博客

该版本的字幕如果无法自动由音频转文字(建议支持正版!),可以使用网易见外工作台 (youdao.com)这个网站进行操作,导出字幕文件后添加到PR即可。在PR内可以拖动字幕来调整出现时间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1672024.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vivado Kintex UltraScale+ 配置存储器器件

Kintex UltraScale 配置存储器器件 下表所示闪存器件支持通过 Vivado 软件对 Kintex UltraScale 器件执行擦除、空白检查、编程和验证等配置操作。 本附录中的表格所列赛灵思系列非易失性存储器将不断保持更新 , 并支持通过 Vivado 软件对其中所列非易失性存…

CommandLineRunner和ApplicationRunner接口实现类中run方法发生异常导致spring程序关闭

今天其他组的一个程序在k8s中启动报错,启动之后立马就关闭了。我去看日志,发现最后面报了一个UnknownHostException异常,感觉是这个原因导致的,然后查看异常栈。定位到一个CommandLineRunner接口实现类,这个实现类里面…

一道dp错题

dis(a,b)就是两点之间的距离公式 那么这道题该怎么解呢,.先看数据范围x,y<1e4,so,18个点两点之间距离最大18*1e4*sqrt(2)<2^18,所以如果跳过的点大于18个点,那么显然一个区间内最多不会跳跃超过17个点 现在我们想知道前i个点跳跃几次在哪跳跃能够达到最小花费,不妨设跳…

STM32(GPIO)

GPIO简介 GPIO&#xff08;General Purpose Input Output&#xff09;通用输入输出口 引脚电平&#xff1a;0V~3.3V&#xff0c;部分引脚可容忍5V 输出模式下可控制端口输出高低电平&#xff0c;用以驱动LED、控制蜂鸣器、模拟通信协议输出时序等 输入模式下可读取端口的高低电…

迄今为止最全- 前端性能优化

简介 当我们说前端性能优化的时候&#xff0c;指的可能是不同场景的性能优化。前端涉及性能优化的场景主要有&#xff1a; 项目构建性能优化 页面性能优化 加载时性能优化 运行时性能优化 构建性能主要指构建速度&#xff0c;优化方法和打包工具直接相关&#xff0c;主要…

航空科技:探索飞机引擎可视化技术的新视界

随着航空技术的飞速发展&#xff0c;飞机引擎作为航空器最为关键的部件之一&#xff0c;其性能直接影响到飞机的安全性、经济性和环保性。因此&#xff0c;飞机引擎可视化技术的应用日益成为航空行业研究和发展的热点。 通过图扑将复杂的飞机引擎结构和工作原理以直观、生动的…

[GXYCTF 2019]Ping Ping Ping(内联执行)、[鹤城杯 2021]EasyP ($_SERVER)

目录 [GXYCTF 2019]Ping Ping Ping 内联执行 [鹤城杯 2021]EasyP [PHP_SELF]、$_SERVER[SCRIPT_NAME] 与 $_SERVER[REQUEST_URI] RCE命令注入可参考&#xff1a; RCE漏洞及其绕过——[SWPUCTF 2021 新生赛]easyrce、caidao、babyrce-CSDN博客 [GXYCTF 2019]Ping Ping Pin…

有哪些网络兼职适合大学生参与?揭秘几个简单又实用的兼职机会

有哪些网络兼职适合大学生参与&#xff1f;揭秘几个简单又实用的兼职机会 对于大学生而言&#xff0c;除了专注于学业&#xff0c;利用空余时间参与一些网络兼职&#xff0c;不仅能锻炼个人技能&#xff0c;还能为未来的职业生涯积累宝贵的经验。想象一下&#xff0c;步入社会…

基于SpringBoot + Vue的学生宿舍课管理系统设计与实现+毕业论文(15000字)+开题报告

系统介绍 本系统包含管理员、宿管员、学生三个角色。 管理员&#xff1a;管理宿管员、管理学生、修改密码、维护个人信息。 宿管员&#xff1a;管理公寓资产、管理缴费信息、管理公共场所清理信息、管理日常事务信息、审核学生床位安排信息。 学生&#xff1a;查看公共场所清理…

标准输入输出流(中北大学-程序设计基础(2))

目录 题目 源码 结果示例 题目 输入三角形的三边a,b,c&#xff0c;计算三角形的面积。形成三角形的条件是ab>c,bc>a,ac>b&#xff0c;编写程序&#xff0c;输入a,b,c&#xff0c;检查a,b,c是否满足以上条件&#xff0c;如不满足&#xff0c;由cerr输出有关出错信息…

IDEA设置 | 个性化设置

&#x1f64b;大家好&#xff01;我是毛毛张! &#x1f308;个人首页&#xff1a;神马都会亿点点的毛毛张 文章目录 前言IDEA自动生成序列化ID 前言 本篇博客将专注于整理IDEA新UI界面的相关设置 IDEA自动生成序列化ID CtrlAltS快捷键打开设置界面 选择Editor→Inspections…

MyBatis——使用MyBatis完成CRUD

CRUD&#xff1a;Create Retrieve Update Delete 1、insert <insert id"insertCar">insert into t_car(id,car_num,brand,guide_price,produce_time,car_type)values(null,1003,五菱宏光,30.0,2020-09-18,燃油车); </insert> 这样写显然是写死的&#…

大模型微调方法汇总

微调方法 Freeze方法P-tuning方法 prefix-tuningPrompt TuningP-tuning v1P-tuning v2Lora方法 重要相关参数LoRA 的优势Qlora方法 相关参数微调经验 模型选择模型大小选择数据处理微调方案英文模型需要做词表扩充吗&#xff1f;如何避免灾难遗忘大模型的幻觉问题微调后的输出…

2024第八季完美童模 【星光】品牌赛区 【直通】赛 完美收官

2024年5月1日&#xff0c;春风徐徐的【星光品牌赛区】热闹非凡&#xff0c;备受瞩目的第八季完美童模【星光品牌赛区】赛区【直通赛】在这一天正式拉开了帷幕。比赛现场&#xff0c;童模们身着华服&#xff0c;在舞台上演绎了“亚特兰蒂斯”的时尚主题赛。 参赛选手们身着带有海…

新店2个月盈利6万,就是因为做对了这六个步骤,教你正确起店步骤

大家好&#xff0c;我是电商花花。 2024年依然能做抖音小店&#xff0c;因为就按照我们这边团队的实操经验来看。 抖音小店不仅可以做&#xff0c;而且即便是新手小白也可以做&#xff0c;只要掌握抖音小店背后的运营方法和起店步骤&#xff0c;就能很快出单并做起来。 今天…

【Linux】Linux安装JDK

一、卸载Linux自带的JDK #查询已有的JDK rpm -qa | grep jdk ①将查询到的JDK全部卸载掉 #直接复制一整行的JDK名称 yum -y remove java-1.7.0-openjdk-headless-1.7.0.261-2.6.22.2.el7_8.x86_64 ②卸载完第一个后再次查询 ③继续卸载&#xff0c;卸载完成后再次查询 ④查询…

如何将draw.io的图导入word

解决办法&#xff08;有点点复杂&#xff09; 先在http://draw.io导出格式为svg矢量图格式&#xff0c;然后用visio打开svg&#xff0c;调整完界面等等之后再保存&#xff0c;然后在word里面插入visio

simulink-仿真以及PID参数整定/PID tuner 的使用流程

控制器搭建与参数整定 搭建一个前馈PID控制器控制系统PID tuner使用 一个懂点控制但不多的小白&#xff0c;因为需要利用simulink仿真&#xff0c;所以不得不学习一些仿真的知识&#xff0c;这篇文章适合和我一样的新手入门&#xff0c;有理解错误的地方希望大手们能够指出来共…

volatile详解、原理

文章目录 一、Volatile的定义和作用1.1 Volatile简介1.2 Volatile作用 二、并发编程中的三个问题&#xff1a;可见性、原子性、有序性二、Java内存模型&#xff08;JMM&#xff09;三、volatile变量的特性3.1 线程可见性3.2 禁止重排序禁止重排序原理禁止重排序举例 3.3 volati…

七、e2studio VS STM32CubeIDE之显示中文编码

目录 一、概述/目的 二、查看和修改文件编码 三、eclipse编码格式 3.1 优先级 3.1.1 全局workspace 3.1.2 工程 3.1.3 文件 3.1.4 全局文件的content type 二、STM32CubeIDE设置显示中文编码 二、e2studio设置显示中文编码 七、e2studio VS STM32CubeIDE之显示中文编…