【AI作曲】毁掉音乐?早该来了!一个网易音乐人对于 AI 大模型音乐创作的思辨

news2025/1/16 3:49:25

引言:AI在创造还是毁掉音乐?

正如当初 midjourney 和 StableDiffusion 在绘画圈掀起的风波一样,suno 和 各大音乐大模型的来临,其实早该来了。

AI 在毁掉绘画?或者毁掉音乐?

没错,但也错了。至于理由稍稍有些复杂。也许我们的想法略有不同。

我将从社会、商业、艺术形式、人工智能技术、深度学习原理及其思辨等多个角度,结合我作为音乐人、艺术爱好者和技术工作者的角色,对音乐和AI发展的个人见解来议论这个话题。

写得略深,懒得配图… 如果不想动脑可以关掉了。

// 免责声明:本篇博客纯属个人娱乐见解,不代表任何权威观点,仅供参考。//


一、AI 音乐(艺术)大模型能真正创新吗?

先说答案:看似,能;理解深度学习的原理后,能,但不完全能。

1.你的神经网络孩子,是如何创作的?(概念说明:神经网络、数据集、拟合、学习训练原理)

无论是绘画、文字还是音频,深度学习需要把 已经存在的内容(也就是其他人画好的画、写好的小说、创作好的音乐) 输入给神经网络,通过指定的一些算法进行学习。

你可以这样理解:在神经网络被初创的时候,它只是一个什么都不会的婴儿 —— 具有学习的能力,但目前还什么都没学。

所以说,你需要教他,让他学习你想要让他学习的内容,这样在它学会了之后,才能为你服务。

你给神经网络喂乌龟的图片,它就能够学习乌龟是什么样子的,之后,它就能生成出乌龟来。这相当于你给这个“神经网络孩子”报了个绘画补习班(补习班的内容就是学习画各种各样的乌龟)。当它学成了之后,它也只能画乌龟,而不能创作模仿德彪西的钢琴曲写出个《月光》来。

一切神经网络所掌握的内容,都来源于它所学习的内容(数据集)。

所以,看似它能相对而言进行 假的 “创新”;然而在实际上,这是一种 真的 “模仿”。 模仿的过程,我们称之为 “拟合” ,也就是通过持续不断地迭代学习,来学着概括它所学习的内容的普遍形式(一种 “特征”)。这里,我们要引出两个概念:过拟合、欠拟合

概念一:过拟合
过拟合的意思是,它太过于接近,反而导致了它会直接生成出和他所学的内容一模一样的东西。比如说你把贝多芬创作的所有钢琴曲都让这个神经网络进行学习。
它学习了很久,你本来希望的是,它能模仿贝多芬的风格进行创作,然而它 过拟合 了,它创作出来的内容就是贝多芬的原曲!变都没变!(这只是极端的过拟合情况,正常的过拟合情况是,会和原曲很像)。如此一来,它失去了 “创新” 的能力。

概念二:欠拟合
很简单,欠拟合就是,你可怜的神经网络孩子在补习班里没学会贝多芬的风格,你叫它生成出来贝多芬风格的音乐给你听的时候,它生成出了一堆噪音(笑)。
导致这种现象的原因主要是因为:1.你没给这个神经网络孩子足够的时间来学习(迭代次数少)2.你没告诉它正确的学习方法(算法选用不合适、训练参数不正确)。
第二种情况比第一种严重得多,如果这个神经网络孩子是聪明的,方法也对,那么我们只需要时间来让它学习;然而,当它被设置了错误的算法和参数后(天生是个傻子),你无论让它学习多久,它也无法学会(损失函数无法很好地收敛)。

2.为何是 “模仿”,难道真的不能 “创新”?

搞清楚了深度学习的原理后,请仔细思考我下面的这段话,它是关于 AI 能否创新的核心内容:

你并没有在创造一个 “贝多芬的艺术作品”,你在创造的,是一个尽可能接近于 真实贝多芬 的 “赛博贝多芬” —— 它能为你带来量产的贝多芬风格作品,快速、高效地生成 —— 比贝多芬写得快,但如果贝多芬还活着,他有能力创作出更多的风格的音乐;而你的神经网络孩子却无法这样做。

原因只有一个:当你把真实的贝多芬看做一个生物神经网络时,他学习的数据集是 无限的 广阔的世界;而你的神经网络孩子学习的数据集是真实贝多芬创作出来的 有限的 音乐作品。

能不能人为地制造 “无限” 呢?

可以,但不完全可以。

方法是为数据集的内容添加 随机噪声(random noise);或者,在选取数据集的时候就人为筛选“美感”较为强烈的内容(与 StableDiffusion 较为类似的一个新的模型 Playground-v2 就是这样做的 )

尽管这种方法从理论上实现了 “无限”,可实际的效果却不那么尽如人意。

就当前的技术手段来讲,神经网络可以学习“风格”,而对于形而上的“美感”的学习的能力却十分有限。虽然两者都很抽象,但后者明显更难被把控。一方面是我们在哲学上对于美感的解释并未得到一个大统一,再者是已有的解释也没能被量化。

如果想要更进一步,也许将来的某一天,“美感”这种不明确的学习目标可以被解释成学习参数,再通过某种形式变为具体的网络训练参考或具体算法。


二、神经网络孩子,你动了谁的奶酪

1.AI 音乐大模型为何存在,意义在哪儿?

它的存在,主要原因只有一点:商业化。说白点儿,搞钱。
次要原因:有趣好玩、降低音乐创作门槛、科研、技术发展自然推动(其实说白了,所有次要原因的最终指向,还是出于市场角度考虑。除了真正热爱 AI 和 音乐的人把它当成玩物)

在这里插入图片描述
<图片为,现在登顶第一的音乐生成大模型 suno>

2.为何近年来大家如此厌恶各类大模型

是因为 AI 画出来的东西真的很难看吗?

AI 画出来的东西碾压了绝大部分中小画师,这是不争的事实。至于大画师,受到的影响几乎为零。音乐方面亦复如是。

大家讨厌的原因无非集中于两个主要点:没灵魂、抢我饭碗

讨厌点一:没灵魂
艺术创作是有目的性的、旨在使用一种抽象的偏感性和形而上的方式来表达个人情感、见解或其他内容的社会意识形态、一种“链接” —— 一种带有浓厚个人色彩的、目的却是尝试对外界进行输出或沟通的表现形式(下面的板块会详谈)。
然而,AI省略了情感和思考,用冷冰冰的一个又一个带着权重的神经网络节点,把艺术作品克隆出来了。
这不得不让人感到愤怒和抵触,如果严重一点说,这是对人类意识形态和情感的一种挑衅行为。

讨厌点二:抢我饭碗
断人财路如srfm,讨厌也正常。

3.所以 AI 到底是在创造音乐还是毁灭音乐(包括绘画)

我觉得两者都有。

创造音乐:
今年3月份,杭州第一个AI绘画模型维权成功,理由是“在使用AI的过程中进行了头脑劳动”之类的。其实很公平,就是这样的。
社会的发展必然会导致这样的结果,就好像当初工人砸掉织布的机器一样,如今又上演。
不过这一次,为何不当一回制造机器的人呢(笑)。
如果按照艺术的角度上来说,如果把一首歌的全部部分都交给AI,你的作品的创造性是十分有限的,我们在解释深度学习的原理的时候就已经说明过这个问题了。
正确的用法应该是,AI为音乐人提供思路和旋律走向、和弦编排,而音乐人是那个“审阅人”,找出自己觉得好的内容,然后使用,并优化。
在这个过程中,音乐人关键的付出是“审美”和对于音乐宿主软件(你可以把宿主软件理解为集成开发环境)的操作,以及一些细节调整和整体把控。这样人机共同创作歌曲,才是最优解。

毁掉音乐
其实相比于画师,音乐人受到的影响并没有多大,甚至说没什么影响。
因为音乐创作的感性点更多,很多时候要不按常理出牌,这正好是 AI 不擅长的内容。
如果你要创作口水歌,那么无疑,AI 现在就已经能把你淘汰了 —— AI 最擅长口水歌。因为当今乐坛大部分都是口水歌!
如此的压力下,中低水平的画师和音乐人就要另谋出路,将来选择进入这个行业的人也会越来越少。
所以你看,AI 毁掉的不是音乐,而是音乐创作的生态圈。到此为止吧。


三、对于艺术的思考(附加篇)

1.什么是艺术

无论是美术还是音乐,它们都是艺术的一种形态。

然而无论是度娘还是google,在我们去搜索关于艺术的定义时,会发现始终没有一个一锤定音的答案。最好的结果,你能找到各大搜索引擎和稠人广众的洋洋洒洒。那不妨,鄙人也于百舌之声中抛砖引玉,浅谈拙见。

且不论艺术之历史,只谈它的表现形式。

艺术创作大多是有目的性的,它旨在使用一种抽象的、偏感性和形而上的方式来表达个人情感、见解或其他内容。如果你仔细观察便不难发现,它是一种“链接” —— 一种带有浓厚个人色彩的、目的却是尝试对外界进行输出或沟通的表现形式。

艺术作品的好与坏,评论者的身份是决定性的。我们也许可以从两个角色的角度来将它们大体划分,然后再进行细分。

2.艺术的受众

第一部分:大众之声
如今艺术作品最大的欣赏群体是大众。相比于专业人士的角色视角,大众对于艺术作品的审视和判断,是不容忽视的。在过去的这些年里,我一直对于网络小说和量产口水歌有一定的偏见。
然而近些年我改变了自己的观点。因为它的存在是能为大部分人带来实打实的欣赏价值的。
而大部分的对此类艺术作品的评价来源于它是否能够勾起大部分人对于此作品的朴素美感认同,而非专业性和高级审美上的认同。

第二部分:专业人士
专业人士在自己擅长的艺术形式上的鉴赏是苛刻的。比如对于一首流行歌曲,在大众听来,或许不会在意其作曲旋律走向是否经过和声学的精心编排;编曲配器有多少,又是如何相互配合;效果器用了哪些;歌曲的结构是怎样的;缩混母带做没做好等等。只大家觉得 “好听”,这就够了。
然而在研究音乐的人耳朵里,这首歌曲在被欣赏时就已经被肢解得支离破碎了。美术、摄影等艺术创作形式也是一样,构图、色彩等等都会被肢解。
我在读大学的时候开过一家猫舍,对于各种品种猫从最开始觉得“这只猫好看”、“这只猫难看”,到后来的我看到一只猫,我已经无法分清它是否好看了。我能看到的只有一个标签,上面写着这只猫从品相分析和当前行情的角度上分析得来的市场价格。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1848607.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android网络收集和ping封装库

功能Stetho 是 Facebook 开源的一个 Android 调试工具。是一个 Chrome Developer Tools 的扩展&#xff0c;可用来检测应用的网络、数据库、WebKit 、SharePreference等方面的功能。开发者也可通过它的 dumpapp 工具提供强大的命令行接口来访问应用内部。 02.stetho大概流程 …

学校图书借阅管理系统(数据库课设)PS:有前端界面

1.课设要求描述 ●实现图书信息、类别、出版社等信息的管理; ●实现读者信息、借阅证信息的管理; ●实现图书的借阅、续借、归还管理; ●实现超期罚款管理、收款管理; ●创建触发器&#xff0c;分别实现借书和还书时自动更新图书信息的在册数量; ●创建视图查询各种图书…

谷歌手机刷机教学

注意&#xff1a;手机已经解开了oem锁和bl 1、adb基础命令 连接设备adb devices&#xff1a;列出当前连接的所有设备。 adb connect <设备IP>&#xff1a;通过IP地址连接设备&#xff08;用于无线连接&#xff09;。 设备信息adb shell getprop&#xff1a;获取设备的所…

数据结构 —— 线索二叉树

数据结构 —— 线索二叉树 线索二叉树结构定义结点类树类 线索化找线索二叉树的后继找线索二叉树的前驱 我们今天来看看线索二叉树。 线索二叉树 线索二叉树&#xff08;Threaded Binary Tree&#xff09;是一种特殊的二叉树结构&#xff0c;它是在二叉树的基础上进行改良的数…

前端 CSS 经典:旋转边框效果

效果&#xff1a; 思路&#xff1a;使用伪元素&#xff0c;给伪元素设置背景色&#xff0c;然后定位&#xff0c;遮盖&#xff0c;旋转。就可以实现旋转边框效果。 实现代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta chars…

[FlareOn5]Ultimate Minesweeper

一切题目&#xff0c;可以运行的&#xff0c;首先就要自己运行一次 运行完毕你会发现这是个扫雷游戏 net dnspy打开 一般没有特别的 我们都是点这花括号 这有个getkey 一眼加加密 然后可以三个方向&#xff1a;动调&#xff0c;改文件&#xff0c;静态找数据写加密脚本 简…

软件工程学系统设计

一、概述 软件设计阶段用比较抽象概括的方式确定目标系统如何完成预定的任务&#xff0c;即确定系统的物理模型。 回答系统 “做什么”。 软件设计是将需求转化为最终产品的唯一途径&#xff0c;是后续开发和维护工作的基础。 1、软件设计过程 从工程管理角度&#xff0c;…

STM32通过SPI软件读写W25Q64

文章目录 1. W25Q64 2. 硬件电路 3. W25Q64框架图 4. 软件/硬件波形对比 5. 代码实现 5.1 MyI2C.c 5.2 MyI2C.h 5.3 W25Q64.c 5.4 W25Q64.h 5.5 W25Q64_Ins.h 5.6 main.c 1. W25Q64 对于SPI通信和W25Q64的详细解析可以看下面这篇文章 STM32单片机SPI通信详解-CSDN博…

手撕排序2--选择排序(直接选择+堆排序

目录&#xff1a; 1.直接选择排序 的实现及分析 2.堆排序 的实现及分析 1.直接选择排序 1.1基本思想&#xff1a; 每一次从待排序的数据元素中选出最小&#xff08;或最大&#xff09;的一个元素&#xff0c;存放在序列的起始位置&#xff0c;直到全部待排序的数据元素排完…

BP神经网络-入门到理解-长文讲述

本文来自&#xff1a;老饼讲解-BP神经网络 https://www.bbbdata.com 目录 一、BP神经网络的仿生意义 二、BP神经网络的结构 三、BP神经网络的前馈与后馈 3.1 BP神经网络的前馈 3.2 什么是BP神经网络的后馈 四、BP神经网络的训练 4.1 BP神经网络归一化 4.2 梯度下降算法…

Django使用

一、安装Django 可以在创建好的虚拟环境中下载包 pip install Django3.2.20 -i https://pypi.tuna.tsinghua.edu.cn/simple 查看对应的下载好的内容 1、在Lib的site-packages第三方包里&#xff1a;这就是django框架源码 2、在scripts中有个 这是个工具&#xff0c;帮助创建d…

vs2022 studio控制台出现中文乱码解决

vs2022 studio控制台出现中文乱码解决 问题解决 问题 这里cout中间的中文&#xff0c;但控制台出现的是乱码对此需要进行修改 解决 打开运行的主文件&#xff0c;也就是整个程序的入口&#xff0c;对他另存为 之后点击编码保存 接着将编码保存的格式变为图片对应的这种 记…

微信小程序UI组件库合集

文章目录 前言参考地址推荐组件库1.官方WeUI&#xff08;建议使用☆☆☆☆&#xff09;2.ColorUI&#xff08;广告很多&#xff0c;不建议使用&#xff09;3.vantUI又名&#xff1a;ZanUI&#xff08;操作简单&#xff0c;建议使用☆☆☆☆&#xff09;4.MinUI&#xff08;比较…

STM32通过SPI硬件读写W25Q64

文章目录 1. W25Q64 2. 硬件电路 3. 软件/硬件波形对比 4. STM32中的SPI外设 5. 代码实现 5.1 MyI2C.c 5.2 MyI2C.h 5.3 W25Q64.c 5.4 W25Q64.h 5.5 W25Q64_Ins.h 5.6 main.c 1. W25Q64 对于SPI通信和W25Q64的详细解析可以看下面这篇文章 STM32单片机SPI通信详解-C…

设计模式4-模版方法

设计模式 重构获得模式重构的关键技法1. 静态转动态2. 早绑定转晚绑定3. 继承转组合4. 编译时依赖转运行时依赖5. 紧耦合转松耦合 组件协助动机模式定义结构 要点总结。 例子示例解释&#xff1a; 重构获得模式 设计模式的目的是应对变化&#xff0c;提高复用 设计模式的要点…

昇思25天学习打卡营第3天|数据集Dataset

一、简介&#xff1a; 数据是深度学习的基础&#xff0c;高质量的数据输入将在整个深度神经网络中起到积极作用。有一种说法是模型最终训练的结果&#xff0c;10%受到算法影响&#xff0c;剩下的90%都是由训练的数据质量决定。&#xff08;doge&#xff09; MindSpore提供基于…

基于STM32的智能病房监控和人脸识别系统设计(毕业设计)

摘 要 随着技术的不断进步和医疗需求的不断增长&#xff0c;智能病房控制系统有望在医疗领域发挥更大的作用。基于此&#xff0c;本文研究设计了一款低成本、操作简单、适用性强的基于STM32的智能病房监控和人脸识别系统。该系统通过STM32作为控制器和OpenMV对人脸分辨进行门…

你好,复变函数1.0

输入时用后缀&#xff0c;开头空格 #include <easyx.h> #include <stdio.h> #define PI 3.141592653589793 #define E 2.718281828459045 #define K (1.0 / 256.0) #define K_1 256.0 //#define LINE//决定函数是用线画还是用点画 struct C {double i;double r;…

同一天里,两位大厂程序员猝死。。。

2024年&#xff0c;真的不是平静的一年。在几天前&#xff0c;IT行业接连发生了两件不幸的事情。 6月17日下午&#xff0c;东南亚电商公司Sh**ee位于北京的研发中心&#xff0c;一位负责研发的女员工突然在工位上晕倒。 同事们赶紧拨打了120&#xff0c;然而还是没能抢救过来&a…

USB2.0网卡安装驱动

有三种安装方式&#xff1a; 驱动精灵驱动总裁USB2.0网卡自带安装程序 前两种很简单&#xff0c;下载驱动精灵或者驱动总裁&#xff0c;然后检测本地硬件&#xff0c;安装相应驱动。 本文重点要介绍的是第三种&#xff0c;利用USB2.0网卡自带的安装程序。有的时候驱动精灵或…