ai翻唱部分步骤

ai翻唱部分步骤

news2025/4/6 6:20:54

模型部署

我是用的RVC进行的训练，也可以使用so-vits-svc。

通过百度网盘分享的文件：RVC-beta
链接：https://pan.baidu.com/s/1c99jR2fLChoqUFqf9gLUzg
提取码：4090

以Nvida显卡为例，分别下载“RVC1006Nvidia”和“0128补丁”压缩包，分别解压后，复制“0128补丁”内容粘贴到“RVC1006Nvidia”文件夹进行替换之后，直接点击go-web.bat运行即可。

需要电脑安装好CUDA，安装步骤可以看这个链接：最详细！Windows下的CUDA与cuDNN详细安装教程_cuda安装-CSDN博客

收集素材

从b站下载音视频制作

使用DownKyi

通过百度网盘分享的文件：DownKyi
链接：https://pan.baidu.com/s/1pDGbFYYw6HIRuPB41U5Hgw
提取码：4090

数据集制作

1.将文件转换为wav类型

2.

将音频文件拖到上图红框内，然后点击模型选择HP3，点击转换；

转换后的结果再次放入上图红框内，点击模型选择onnx_dereverb，点击转换；

也可继续进行别的处理。

训练

1. 输入实验名（自拟），然后选择音频目标采样率（一般为40k），其他保持默认，点击“处理数据”即可。（此步骤是将音频剪切成数个短节，“输出信息”栏会提示进程结束）

2.根据自身情况选择音高提取算法（输入歌声可用pm提速,高质量语音但CPU差可用dio提速,harvest质量更好但慢,rmvpe效果最好且微吃CPU/GPU），之后点击“特征提取”（“输出信息”栏会提示进程结束）

3.根据自身显卡性能选择“保存频率”、“总训练轮数”和“每张显卡的batch_size”（显卡不太行的建议设置低一点），其他保持默认，依次点击“训练模型”“训练特征索引”和“一键训练”（“输出信息”栏会提示进程结束）

Ai翻唱之模型推理

1. 切换到“模型推理”界面，在“推理音色”上选择上面步骤一训练好的模型权重文件；

2. 输入待处理音频文件路径，即需要模拟的声音或歌曲文件所在的路径。

3. 输入索引index路径。

4.根据下图说明进行适当调整，即可点击“转换”开始模型推理。

（待处理音频为目标转换音频）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2232218.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

[综述笔记]Deep learning for brain disorder diagnosis based on fMRI images

[综述笔记]Deep learning for brain disorder diagnosis based on fMRI images

论文网址：Deep learning for brain disorder diagnosis based on fMRI images - ScienceDirect 英文是纯手打的！论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误，若有发现欢迎评论指正！文章偏向…

阅读更多...

HarmonyOS：UIAbility组件概述

HarmonyOS：UIAbility组件概述

一、概述 UIAbility组件是一种包含UI的应用组件，主要用于和用户交互。 UIAbility的设计理念： 原生支持应用组件级的跨端迁移和多端协同。支持多设备和多窗口形态。 UIAbility划分原则与建议： UIAbility组件是系统调度的基本单元&#xff0c…

阅读更多...

jeecgbootvue2菜单路由配置静态文件夹(public)下的html

jeecgbootvue2菜单路由配置静态文件夹(public)下的html

需求:想要在菜单配置src/assets/iconfont/chart.html显示页面(目的是打包上线以后运维依然可以修改数据) 官网没有相关数据：菜单配置说明 JeecgBoot 开发文档看云问题现象: 我把文件放在src/assets/iconfont/chart.html然后在vue中作为 iframe 的 src 属性&am…

阅读更多...

【Vue框架】基础语法练习（1）

【Vue框架】基础语法练习（1）

其实更多知识点已经在Vue.js官网十分清楚了，大家也可以去官网进行更细节的学习 https://cn.vuejs.org/ 说明：目前最新是Vue3版本的，但是Vue2已经深得人心，所以就是可以支持二者合用。它们最大的区别就是Vue3是组合式API&#xf…

阅读更多...

爬虫学习4

爬虫学习4

from threading import Thread#创建任务 def func(name):for i in range(100):print(name,i)if __name__ __main__:#创建线程t1 Thread(targetfunc,args("1"))t2 Thread(targetfunc, args("2"))t1.start()t2.start()print("我是诛仙剑")from …

阅读更多...

qt QScrollArea详解

qt QScrollArea详解

1、概述 QScrollArea是Qt框架中的一个控件，它提供了一个可滚动的视图区域，用于显示超出视图大小的内容。这个控件非常有用，尤其是在处理大型表格、文本区域、图像集合或任何需要滚动浏览的内容时。QScrollArea本身不直接显示内容&#xff0c…

阅读更多...

【ChatGPT】搜索趋势分析

【ChatGPT】搜索趋势分析

【ChatGPT】搜索趋势分析为了分析 ChatGPT 在过去一年的流行趋势，我们可以查看 Google Trends 的数据安装依赖pytrends pip install pytrends运行以下 Python 脚本 import pandas as pd import matplotlib.pyplot as plt from pytrends.request import TrendR…

阅读更多...

Mac如何实现高效且干净的卸载应用程序

Mac如何实现高效且干净的卸载应用程序

使用Mac卸载应用程序，你还在使用废纸篓这个办法吗，看不见卸载了什么，看不见清理了多少，真的不会有残留吗 XApp Mac上的卸载专家，强大的垃圾逻辑检测，垃圾扫描更全面，卸载更干净使用简单&#…

阅读更多...

安科瑞AMB400分布式光纤测温系统解决方案--远程监控、预警，预防电气火灾

安科瑞AMB400分布式光纤测温系统解决方案--远程监控、预警，预防电气火灾

安科瑞戴婷可找我Acrel-Fanny 安科瑞AMB400电缆分布式光纤测温具有多方面的特点和优势： 工作原理： 基于拉曼散射效应。激光器产生大功率的光脉冲，光在光纤中传播时会产生散射。携带有温度信息的拉曼散射光返回光路耦合器，耦…

阅读更多...

GitHub上传自己的项目

GitHub上传自己的项目

目录一、安装Git插件 1）下载 2）安装二、创建Gothub的创库三、通过Git上传本地文件到Github 四、其他 1、部分指令 2、如果已经运行过git init并设置了[user]，下次可以直接用一、安装Git插件 1）下载下载地址&#x…

阅读更多...

Spring Boot框架

Spring Boot框架

一.SpringBoot简介 1.1 设计初衷目前我们开发的过程当中，一般采用一个单体应用的开发采用 SSM等框架进行开发，并在开发的过程当中使用了大量的xml 等配置文件，以及在开发过程中使用MAVEN的构建工具来进行构建项目，但是往往有…

阅读更多...

【C++】vector 类深度解析：探索动态数组的奥秘

【C++】vector 类深度解析：探索动态数组的奥秘

🌟快来参与讨论💬，点赞👍、收藏⭐、分享📤，共创活力社区。 🌟 如果你对string类还存在疑惑，欢迎阅读我之前的作品 ： 👉【C】string 类深度解析：…

阅读更多...

windows——病毒的编写

windows——病毒的编写

声明学习视频来自B 站up主泷羽sec，如涉及侵权马上删除文章。笔记的只是方便各位师傅学习知识，以下网站只涉及学习内容，其他的都与本人无关，切莫逾越法律红线，否则后果自负。 windows基础我们学习了前面的window…

阅读更多...

STM32 + CubeMX + 硬件SPI + W5500 +UDP

STM32 + CubeMX + 硬件SPI + W5500 +UDP

这篇文章记录一下STM32W5500UDP的调试过程，实现UDP数据的接收与发送。目录一、W5500模块介绍二、Stm32CubeMx配置三、Keil代码编写1、添加W5500驱动代码到工程（添加方法不赘述，驱动代码可以在官网找）2、在工程中增加代码&#…

阅读更多...

原来大佬的测试用例都是这样写的...

原来大佬的测试用例都是这样写的...

1、测试点与测试用例测试点不等于测试用例，这是我们首先需要认识到的。问题1：这些测试点在内容上有重复，存在冗余。问题2：一些测试点的测试输入不明确，不知道测试时要测试哪些。问题3：总是在搭相似…

阅读更多...

【论文解读】Med-BERT: 用于疾病预测的大规模结构化电子健康记录的预训练情境化嵌入

【论文解读】Med-BERT: 用于疾病预测的大规模结构化电子健康记录的预训练情境化嵌入

【论文解读】Med-BERT: 用于疾病预测的大规模结构化电子健康记录的预训练情境化嵌入 Med-BERT：pretrained contextualized embeddings on large-scale structured electronic health records for disease prediction 摘要：基于电子健康记录（EHR）的深度学习（DL）预…

阅读更多...

天锐绿盾加密软件与Ping32 — 数据安全与性能优化的完美结合

天锐绿盾加密软件与Ping32 — 数据安全与性能优化的完美结合

在数字化时代，企业对数据安全的重视程度日益增加。随着网络攻击和数据泄漏事件频发，选择合适的安全解决方案显得尤为重要。天锐绿盾与Ping32作为两款备受推崇的安全软件，各自为企业提供了独特的功能和优势，共同为企业的数据安全和…

阅读更多...

随身WiFi三网切换靠谱吗？格行随身WiFi网速怎么样？

随身WiFi三网切换靠谱吗？格行随身WiFi网速怎么样？

出门在外手机流量不够用，连接公共WIFI网速不稳定还存在安全隐患。小巧便携的随身WIFI成了外出用网的首选。面对市面上不同品牌，不同类型的随身WIFI不少朋友不免心生疑问：随身WIFI到底值不值得买？究竟是不是“智商税”？…

阅读更多...

服务器数据恢复—SAN环境中LUN映射错误导致文件系统一致性出错的数据恢复案例

服务器数据恢复—SAN环境中LUN映射错误导致文件系统一致性出错的数据恢复案例

服务器数据恢复环境： SAN光纤网络环境，存储由一组6块硬盘组建的RAID6阵列构成，划分为若干LUN，MAP到跑不同业务的SUN SOLARIS操作系统服务器上。服务器故障&分析： 因为业务需要，用户在该光纤存储环境中…

阅读更多...

【skywalking 】More than 15,000 ‘grammar‘ tokens have been presented. 【未解决请求答案】

【skywalking 】More than 15,000 ‘grammar‘ tokens have been presented. 【未解决请求答案】

问题 skywalking相关版本信息 jdk：17skywalking：10.1.0apache-skywalking-java-agent：9.3.0ElasticSearch : 8.8.2 问题描述 More than 15,000 grammar tokens have been presented. To prevent Denial Of Service attacks, parsing has b…

阅读更多...

推荐文章

最新文章