我用AI帮我唱了首“基尼太美”,颠覆了我的认知!太牛逼了

news2024/11/17 16:36:42

目录

前言

AI唱"基尼太美"是什么感觉

使用so-vits-svc打造自己专属歌手

1.声音素材整理

2.训练模型

3.让AI唱歌​编辑

AI歌手背后的技术

AI歌手会成为主流吗

写到最后


大家好,我是大侠,AI领域的专业博主

前言

在5月份,孙燕姿再次成为了乐坛的顶流,但这一次她火爆的并不是她本人,而是AI孙燕姿。2023乐坛最佳新人奖非她莫属~


AI唱"基尼太美"是什么感觉

大侠看着也手痒啊,于是训练了一个孙燕姿版的篮球战歌

接下来 开始ctrl

原音频
http://image.aidaxia.net/start.mp3

AI唱“鸡你太美”

http://image.aidaxia.net/end.wav

 通过音频可以清晰地听出,咯咯的声音已经完全变成了孙燕姿的声音。而令人惊叹的是,这个声音仅经过不到2000次的训练就已经达到了如此高的仿真度。


使用so-vits-svc打造自己专属歌手

大侠使用的是开源项目 <so-vits-svc> 来训练的AI歌手

项目地址 https://github.com/svc-develop-team/so-vits-svc

 

1.声音素材整理

注意So-VITS-SVC只能识别WAV格式的音频文件。

1.使用UVR来处理音频文件

使用UVR去除背景音、噪音、呼吸声等,只保留纯粹的人声,以保证最佳的语音识别效果。

2.把处理好的音频文件切片

为了避免显卡显存崩溃,建议在使用So-VITS-SVC训练声音素材时,每段音频不要超过30秒

可以使用<Audio Slicer>来将音频文件切分成合适长度的片段。

在So-VITS-SVC的/dataset_raw目录下创建一个文件夹,并将刚才处理好的音频数据放到里面。

2.训练模型

打开So-VITS-SVC根目录下的【启动webui.bat】文件,启动Web UI界面,并切换到训练Tab选项卡。然后点击“选择数据集”按钮,选择你的数据集文件夹,上方会显示数据集文件夹的名称,这也将成为你训练模型的名称。

然后点击“写入配置文件”准备工作就OK了。

接下来点击下面"从头开始训练"就可以丢到一边训练模型了,是不是很简单

3.让AI唱歌

切换到“推理”选项卡,然后刷新页面选择你训练的模型(以G_开头),然后选择配置文件并加载模型。

在页面下方上传你需要转换的音频文件,然后等待转换完成即可。

如果转换后的声音质量不佳,比如听起来不够清晰,带有电流声等问题,你可以返回到训练界面,点击“继续训练”,直到满意为止。


AI歌手背后的技术

So-VITS-SVC是基于深度神经网络的语音转换模型,它主要使用了以下技术:

  1. 声码器:使用WaveNet作为声码器,WaveNet是一种基于卷积神经网络的生成式模型,能够生成高质量的音频信号。

  2. 风格迁移:使用CycleGAN作为风格转换器,CycleGAN是一种基于生成式对抗网络(GAN)的模型,能够将音频的风格转换为目标风格,例如将男性的声音转换为女性的声音。

  3. 语音识别:使用语音识别模型,例如DeepSpeech,来提取语音特征,以便进行音频转换。

  4. 深度学习:使用深度学习技术,如循环神经网络(RNN)和卷积神经网络(CNN),来训练模型进行语音转换。


AI歌手会成为主流吗

随着AI歌手的爆火,我们不时会想到AI歌手真的会取代歌手,全面进入AI娱乐时代吗,

我们先来看看AI歌手的优缺点

它的优点很明显:

  1. 声音非常纯净,几乎听不到换气的声音。

  2. 拥有无限的歌曲库(AI歌手不需要休息时间,只要有电就能创作)。

  3. 效率非常高(转换一首歌只需要2分钟,可以在短时间内创作大量的歌曲)。

当然,它的缺点也很明显:

  1. 情感方面不如人类歌手,AI歌手的声音听起来缺乏感染力。

  2. 创作性方面也还不够,AI发展还处于初级阶段。

  3. 道德和安全问题是最致命的问题,AI歌手不仅可以用来唱歌,还可以被不法分子用来模仿人的声音进行诈骗等危险行为,这已经发生了多起事件,涉及金额高达数百万。此外,还涉及到著作权、知识产权等问题。

“AI娱乐”在大侠看来以后肯定会成为主流,但从技术层面和管控方面来看,仍需要进一步提升和加强。我们期待AI娱乐的发展能够更好地保障道德和安全问题,同时也期待这个时代早日到来。


写到最后

AI歌手已经为我们打开了一扇通往音乐世界的新窗口。

未来,还有更多的AI文化创意产业值得我们去探索和期待,例如AI艺术、AI影视等领域。

这些新兴领域不仅将为我们带来全新的艺术体验,也将为创作者和文化产业带来更多的机遇和挑战。

AI是一个充满机遇和挑战的领域,

AI时代已经到来,AI真的会取代我们吗?

你还不主动了解AI?

你还在为跟同事聊AI插不上话吗?

那请关注大侠,带你了解AI行业第一动态。

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/570531.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第五篇:强化学习基础之马尔科夫决策过程

你好&#xff0c;我是zhenguo(郭震) 今天总结强化学习第五篇&#xff1a;马尔科夫决策过程 基础 马尔科夫决策过程&#xff08;MDP&#xff09;是强化学习的基础之一。下面统一称为&#xff1a;MDP MDP提供了描述序贯决策问题的数学框架。 它将决策问题建模为&#xff1a; 状态…

司空见惯 - 使用dBm表示功率的各种现实情况

前面一篇文章介绍过&#xff0c;使用dBm表示功率时&#xff0c;如何转换为mW。 那现实世界的实际情况中&#xff0c;使用dBm来表示电磁波的能量强度&#xff0c;列表如下&#xff1a; Power level Power Notes 526 dBm 3.61049 W 黑洞碰撞后的引力波辐射的功率&#xff0c…

解决缓存与数据库数据不一致的问题,这篇文章告诉你如何做!

缓存是提高应用程序性能和响应速度的关键组件之一。缓存可以帮助减少数据库查询次数&#xff0c;从而减轻服务器负担并加快页面加载速度。然而&#xff0c;缓存与数据库一致性是分布式系统中常见的问题&#xff0c;因为缓存和数据库之间可能存在数据不一致的情况。为了解决这个…

CyberLink的摄像头应用程序YouCam 10.1版本在win10系统的下载与安装配置教程

目录 前言一、YouCam安装二、使用配置总结 前言 YouCam是由CyberLink公司开发的一款实用的摄像头应用程序&#xff0c;它集成了多种实时视频特效、背景虚化、美颜、屏幕录制等功能。 通过使用该软件内置的相机特效&#xff0c;用户可以将视频聊天或自拍照片变得更加精彩和有趣…

oracle表空间、用户、表的关系和创建

目录 一、表空间 二、用户 &#xff08;1&#xff09;Oracle和mysql、sqlserver的区别 &#xff08;2&#xff09;创建用户 &#xff08;3&#xff09;给用户授权 三、表 &#xff08;1&#xff09;创建表 &#xff08;2&#xff09;用图像化软件添加表约束 1.主键约束…

TikTok正测试名为“Tako”的AI聊天机器人;武汉大学宣布推出CheeseChat

&#x1f680; 近日安徽安庆一起利用AI换脸技术的电信诈骗案件 近日安徽安庆一起利用AI换脸技术的电信诈骗案件&#xff0c;3名涉案人员被抓获并返还被骗款132万元。 此前也有多起利用AI换脸技术进行的电信诈骗案件&#xff0c;甚至还出现在明星直播带货中。 专家提示&#…

ChatGPT无限可能性:自然语言生成的奥秘

&#x1f497;wei_shuo的个人主页 &#x1f4ab;wei_shuo的学习社区 &#x1f310;Hello World &#xff01; ChatGPT无限可能性&#xff1a;自然语言生成的奥秘 数字化时代&#xff1a;跨越语言和文化障碍 冰岛是北大西洋中部的一个岛国&#xff0c;拥有充满活力的科技产业和…

网络编程初识

如果这篇有没接触过的知识点&#xff0c;请转到网络编程先导知识_小梁今天敲代码了吗的博客-CSDN博客 目录 IPv4和IPv6的概念&#xff1a; 子网掩码 默认网关 ping命令 端口 OSI网络分层模型 TCP/IP四层模型 字节序转换函数 IP地址转换 上一篇介绍了网络编程的先导知…

chatgpt赋能python:Python动态实时轨迹绘图:让数据可视化更生动

Python 动态实时轨迹绘图&#xff1a;让数据可视化更生动 数据可视化是现代数据分析中不可或缺的一部分。在Python语言中&#xff0c;有许多工具和库可以帮助我们将数据转化为可视化的图表。然而&#xff0c;有些情况下&#xff0c;静态图表难以准确有效地展现数据的变化趋势和…

chatgpt赋能python:Python动态Import:优化你的编程体验

Python 动态 Import&#xff1a;优化你的编程体验 在 Python 中&#xff0c; Import 是一个非常常见的操作。它允许你从其他模块中引入需要的函数或者变量&#xff0c;从而避免在不同模块中重复编写代码。在大型项目中&#xff0c; Import 操作可能会变得很混乱&#xff0c;导…

Java内存管理:垃圾回收算法和内存分配的原理和优化

章节一&#xff1a;引言 在当今的软件开发领域&#xff0c;Java是一门广泛应用的编程语言。Java虚拟机&#xff08;JVM&#xff09;负责管理Java应用程序的内存&#xff0c;并通过垃圾回收算法和内存分配策略来优化内存使用。本文将详细介绍Java内存管理的原理、垃圾回收算法的…

【熬夜送书 | 第一期】Java生日快乐,不负代码不负君,面向对象面向卿

文章目录 前言一、java是什么&#xff1f;二、好书推荐《Java核心技术》《Java编程思想》Effective Java 中文版&#xff08;原书第3版&#xff09;Java语言程序设计基础篇进阶篇&#xff08;原书第12版&#xff09;Java并发编程实战软件架构实践&#xff08;原书第4版&#xf…

ThingsBoard教程(五三):规则节点解析 Kafka Node, MQTT Node

Kafka Node Since TB Version 2.0 Kafka节点将消息发送到Kafka代理。它可以接收任何类型的消息。该节点会通过Kafka生产者将记录发送到Kafka服务器。 配置 主题模式 - 可以是静态字符串,也可以是使用消息元数据属性解析的模式。例如${deviceType}引导服务器 - 用逗号分隔的…

fork/join框架

文章目录 前言一、fork/join是什么&#xff1f;二、使用步骤总结 前言 使用Fork/Join框架首先要考虑到的是如何分割任务,分割之后,根据join 再进行任务结果的合并,也就是类似二分法的,分而治之的理念; 一、fork/join是什么&#xff1f; fork 拆分任务,将大任务拆分成小任务,拆…

Linux学习笔记---编辑器Vim

Vim是Linux中功能十分强大的文本编辑器&#xff0c;熟练地使用Vim可以让你高效地在Shell界面编写代码&#xff0c;接下来我们开始一步一步地学习Vim的使用方法: 一、文本编辑器vim的使用 1. 打开Vim 打开终端直接输入vim&#xff0c;即可打开Vim编辑器主界面 它是原始vi编辑…

简单谈谈BIO,NIO,AIO

目录 IO 概述 阻塞 IO (BIO) 基本理解 非阻塞 IO(NIO) ​核心部分 Channel Buffer Selector Channel Buffer Selector 三者关系 异步非阻塞 IO(AIO) IO 概述 IO 的操作方式通常分为几种&#xff1a;同步阻塞 BIO、同步非阻塞 NIO、异步非阻塞 AIO。 &#xff08;1…

如何检查Linux硬盘大小、类型和硬件详细信息?

在Linux系统中&#xff0c;了解硬盘的大小、类型和硬件详细信息对于系统管理和故障排除非常重要。本文将详细介绍如何使用命令行工具来检查Linux硬盘的大小、类型和硬件详细信息。 1. 检查硬盘大小 要检查Linux硬盘的大小&#xff0c;可以使用lsblk命令。该命令显示了系统中所…

chatgpt赋能python:Python取位:介绍和应用

Python取位&#xff1a;介绍和应用 Python是一种解释型&#xff0c;高级&#xff0c;通用编程语言。它在最近几年中变得越来越受欢迎&#xff0c;因为它易于学习和使用&#xff0c;并且具有很强的可读性和简洁性。在Python编程中&#xff0c;取位是一种很常见的操作。在本文中…

chatgpt赋能python:Python中如何取空格之前的内容?

Python中如何取空格之前的内容&#xff1f; 在Python中&#xff0c;我们经常需要从文本中提取关键信息&#xff0c;但有时这些信息的位置并不是固定的&#xff0c;而是被包围在一些无用的字符中&#xff0c;比如空格。那么&#xff0c;在Python中&#xff0c;如何取空格之前的…

springboot医院在线医疗挂号服务系统+jsp网上药店药品商城b254v

选题意义、价值和目标&#xff1a; 随着经济的迅速发展,人们对生活水平和身体健康的要求越来越高,但同时也面临着优质医疗资源紧缺,看病难,看病贵,医患关系危机等各种各样的问题。近些年,越来越多传统行业的服务被迁移到互联网上来。如何使用互联网技术解决当前医疗系统中存在的…