争议不断的AI绘画,靠啥成为了顶流?

news2024/10/7 20:36:18
今年以来,AIGC迅速崛起。
所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。
在这一技术赛道,不仅有诸多老牌巨头持续布局,甚至已经跑出了几家估值逾十亿美元的独角兽。
10月18日,Stability AI宣布获得1.01亿美元的融资。它正是开源界“当红炸子鸡”文本到图像生成器Stable Diffusion的背后公司。
10月19日,主打文字生成的AI初创公司Jasper宣布完成1.25亿美元的A轮融资,估值达到15亿美元。
此外,据统计,8成AIGC概念股前三季度实现盈利。创投圈无疑对其青睐有加,可以说一时风头无两。
这个不算新的概念为什么突然就火了?

为什么一夜爆火


从表面来看,一切似乎肇始于在今年8月于美国科罗拉多州举办的数字艺术家竞赛。一幅名为《太空歌剧院》的绘画作品获得了数字艺术类别冠军。消息一经公布就引发了诸多争议。
89ff9db1744677895659e69ac855559c.jpeg Théâtre D'opéra Spatial(太空歌剧院)@百度百科
争议焦点就在于,这幅作品是游戏设计师杰森·艾伦(Jason Allen)利用AI绘图工具Midjourney生成。虽然艾伦对其又进行了润色,但这一点显然不足以平复争议。
关于“AI绘画是否会取代画师”、“AI是否会导致艺术之死”的讨论迅速升温,事件发酵后,更多人则陡然发觉:原来AI绘画的发展水平已经到了十分惊人的地步。
其实早在去年年初,OpneAI推出的图像识别系统CLIP和语言模型DALL·E就是一个非常重要的信号。之后,AIGC领域就开始遍地开花,除了AI绘画之外,AI写作、AI编程工具也相继涌现。
今年以来,Disco Diffusion、Midjourney、Stable Diffusion等AI辅助工具陆续走红,更不用说国内外大厂在这一领域的不断深耕:
  • 谷歌Brain接连推出了AI绘画工具“Imagen”和“Parti”;
  • 微软亚洲研究院发表了无限视觉生成模型 NUWA-Infinity;
  • Github 的AI编程神器Copilot可以根据海量的开源代码生成子模块供开发者使用;
  • OpenAI正式开放了DALL-E 2的程序接口;……

AIGC的爆火看似突然,实则也经历了较长的蛰伏期,而《太空歌剧院》碰巧成为了那根让其“一朝成名天下知”的引线。归根结底,多重因素的加持才让AIGC在今年名声大噪。
首先,技术层面达到了一定水平,尤其是生成扩散模型和多模态预训练模型等技术的发展进步显著,让AI可以迅速生成不同模态的数据内容,能广泛用于内容生成、编辑和辅助创作。
然后,市场需求驱动着内容生产方式的演进。人们对内容的需求快速增长,内容产业也需要相应升级。PGC制作门槛较高、质量有保证,但生产周期较长,UGC降低了生产成本与中心化程度,但质量往往参差不齐,而AIGC在某种程度上兼顾了产能和质量,可以被视作是内容生态在发展过程中的新一轮范式转移。
再者,经济下行的大环境让技术更趋向于务实的应用。后疫情时代,降本增效成为诸多企业努力的方向。生成式人工智能恰恰可以满足个人和团队在创意辅助上的提效需求。
最后,不得不提的是,Stable Diffusion的开源所产生的的破圈式效应。作为一款文本到图像生成器,Stable Diffusion不仅开放了程序,还有其已经训练好的模型,这意味着其允许后继的创业者们使用开源框架构建起更加开放而生猛的内容大生态,这为更广泛的C端用户的链接提供了可能。

引爆画师圈的“抢饭碗”之忧


尽管AIGC在设计、绘画、写作、编程等领域均有了一展身手的空间,但关于其本身的质疑却从未中断。“AI绘画”相关话题甚至一度登上众多平台的热搜榜单,成为名副其实的流量密码。
在画师圈呈现出了两极分化的巨大差异。有人抱着抵触或警惕态度,也有人坦然接受甚至愿意主动接触。
反对者们认为,不知疲倦的AI“10秒可以出一幅画,而我却需要几天”。从短期来看,它的出现会挤占一大批中低层画师的职业空间。长期来看,会导致绘画圈的严重断层,到最后存活的只有“大佬”。
更有甚者,提出了这样一个观点——“绘画”已经是行业中比较具有不可替代属性的职业技能了,如果画师能被取代,其他职业还会远吗?
就像某位网友的评论:“不知未来路在哪里,我相信AI绘画无法完全代替人类,但是可以替代我。”这种危机感引发了不少人的共鸣。
而支持者则认为,技术发展势不可挡,AI绘画可以更高效地帮助画师制作内容,有时甚至可以提供灵感。优胜劣汰是发展的必然,不会以人的情感为转移。
当然,也有对此持无谓态度,主张它山之石可以攻玉的。比如CG画师乌合麒麟就表示:“画画这玩意不一直是谁画的好就学谁么?ai画的好把他好的部分学过来不就完事了。”
4c7bfd2058d1fe5858ef809b24fad1b0.jpeg 图源:CG画师乌合麒麟评论@微博
自人工智能诞生之日起,不可回避的一点就是:需要直面关于“AI取代人”的担忧。而AIGC的发展似乎又加剧了这一“饭碗”之争,但如果在众声喧哗中回归到AIGC本身,就会发现AIGC存在的意义更多是将生产者从枯燥的生产工作中释放,或者帮助生产者突破生产瓶颈,而非取代从业者。正如AI绘画工具Midjourney的创始人David Holz曾经提到的:
“我认为艺术家不仅仅是关于图像的产生者,艺术往往是关于故事和情感的,而AI没有故事和情感,AI创作的影像的叙事来源于使用它的人。贝壳皆来自大海,但海洋非造物者。美石皆来自川河,但河流非孕育者。这套系统并无创造的能力,但美可以来自其中。”
人工智能在创造性活动中的作用只是一种工具,一个载体,而不是创造者本身。Holz将人工智能比作水,“水是危险的,但你也可以在里面游泳、制造船只、用水坝发电”,关键是要学会如何利用它以及与之共处,“它没有意志,没有恶意,是的,你可能淹死在里面,但这并不意味着我们应该禁止水。当你发现一个新的水源时,这真的是一件好事”。

风光背后的阴翳


尽管很多人对AIGC的价值依旧存疑,甚至有些人批评其一直游走在道德和法律的边缘。但某种程度上,黑红也是红,AIGC已经进入了大众视野,并在逐步重塑众多行业场景,在认知和关注度上打下了基本盘。市场也普遍看好这一赛道的发展潜力。
据量子位AIGC图谱显示,现在AIGC主要用在文字、图像、视频、音频、游戏以及虚拟人上,里面涉及的初创企业大多集中在A到B轮,包括DeepMusic、倒映有声、聆心智能、彩云小梦、rct.ai、影谱科技、超参数等。
e0d30b338fbd0293865672bb8371db43.jpeg

我国现有AIGC产业链划分

@《AIGC/AI生成内容产业展望报告》
而国内大厂百度、腾讯、阿里巴巴、字节跳动、网易等也都在AIGC领域有所投入。
  • 百度推出了AI作画平台“文心一格”;
  • 腾讯研发的写稿机器人Dreamwriter可以在规定的22种场景中写作;
  • 阿里巴巴旗下的AI在线设计平台Lubanner可以帮助营销人员生产Banner;
  • 字节跳动旗下的剪映以及快手云剪都能提供AI生成视频;
  • 网易推出了AI编曲系统“网易天音”;……

不过,尽管前景被多数人看好,但目前AIGC领域还存在着不少问题。
第一,关键核心技术仍然有待提升。围绕AI绘画、AI写作的批评中,很多人直指其生成的内容堆砌且质量层次不齐,有时甚至会产生类似“缝合怪”一般的滑稽感。不久前哈佛大学的一项研究表明,DALL-E 2对于文本提示内的关系根本不理解,只是把文本中的几个实体粘合在一起,图像正确率仅有22%。
第二,需求的差异化提升了开发门槛。以AI写作为例,AIGC能做到根据关键词自动生成文本,甚至达到一定的流畅度,但是不同场景对写作需求不同。比如,说明书和广告文案在措辞上就有天壤之别,新闻评论和小说也是风格迥异。需求不同,训练数据自然不同,这无疑提高了AIGC产品开发的成本和时间。
第三,大规模商业化落地依旧挑战重重。由于当前的人工智能还处在传统的弱人工智能阶段,必须高度依赖人类对实际问题的建模,但这种方式存在着相当的不稳定性,加之硬件设施的性能限制,导致生成结果不理想,以及用户缺乏付费意愿,这让AIGC距离大规模商业化落地还需时日。
此前,曾经拥有50万月活用户的AI编程工具Kite在坚持8年后宣布了失败,令人扼腕。其创始人Adam Smith将失败归因于“算法不够好”和“用户不买账”。“最大的问题是最先进的模型不理解代码的结构,例如非本地上下文。”其次,他们花了很长时间才发现,“个人开发者不会购买工具,只有他们的经理可能这样做。但仅仅使开发人员在编写代码时速度提高18%——这也不足以打动他们。”
第四,AI作品的版权之争未有定论。如今很多AIGC工具免费进行开放使用,但仍有很多使用者担心其版权的合法性。由于整个行业目前还处于探索阶段,各个国家的政策也不同,不同公司在面对相关问题时处理方法也千差万别,因此,全世界还都处在蒙昧和混沌期。
版权之争的核心问题主要集中在两个方面:一是你能获得AI模型所创造的东西的版权吗?二是你可以使用受版权保护的数据来训练AI模型吗?
不久前GitHub Copilot引发的官司就是一个典型案例。在这项集体诉讼中,广大程序员们指控OpenAI涉嫌违反开源许可,OpenAI和微软使用他们贡献的代码训练专有AI工具GitHub Copilot。不少业界人士认为,这起案件的进展和结果可能会为整个生成式人工智能领域的版权归属问题开创先例。

争议不断的前路


曾几何时,人们对AI在创造性活动,尤其是艺术方面的落地并不抱有幻想。因为AI永远只能依靠模仿而习得技能,而创作无疑是人的独有禀赋。但AIGC的出现似乎打破了人类的这点自傲,故而又出现了“艺术已死”的论调。但正如相机的出现并没有让绘画走上末路,AIGC的发展同样如是。
尽管在发展之路上还要面临核心技术不成熟、短期内难以实现大规模商用、相关法律法规不健全及技术伦理的挑战,但这基本上是技术发展路径上的普遍问题,碰撞不可避免,磨合尚需时日。不能否定的是,AI技术的发展确实会提升人类生产力。在争议不断的前路上,我们需要的可能只是一点耐心和一点信心。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/66074.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

品牌化、跨境电商、专注细分赛道,平台助力品牌快速出海

国内国外产品都面临着日趋激烈的竞争,卖家越来越意识品牌的效应的重要作用。在竞争激烈的大环境之下,卖家必须采取有效的产品品牌营销策略来提高自身产品的市场竞争力。品牌营销在一定程度上可以增强产品在激烈的市场竞争的影响力。同时,口碑…

【DL】Windiws10系统下安装CUDA和CUDNN实践教程

Windiws10系统下安装CUDA和CUDNN实践教程(手把手系列,不错过任何一个环节): 一、查看需要的CUDA版本 点击开始菜单栏右侧的放大镜,输入NVIDIA 然后点击NVIDIA Control Panel,进入NVIDIA控制面板 点击管理3D设置->系统信息 弹出以下界面框 点击组件,就可以看到驱动对…

工业CT检测技术及工业CT基本组成

工业CT基本组成 由重建CT图像的基本过程出发,我们可以想象一下组成一台工业CT设备的基本要求:它应该能够量 X射线穿透被检物体以后射线的强度,同时能够完成X射线机-探测器系统与被检测物体之间的扫描运动,从而获得重建CT图像所需的…

如何将u盘两个分区合并?u盘怎么合并一个区

U盘是我们日常工作中应用得很广泛的便携式存储设备,具有体积小、便携易带、容量大、随插随拔等优势。为了方便存储数据,不少的用户都会对U盘分区,那么,如何将u盘两个分区合并? 一、合并U盘分区的应用与说明 合并U盘分…

Java高效率复习-MySQL下篇

前言 本文章的语言描述会比上篇多一些 数据库的创建修改与删除 标识符命名规则 数据库名、表名不得超过30个字符,变量限制为29个必须只能包含A-Z,a-z,0-9,_等63个字符数据库名、表名、字段名等对象名中间不要包含空格同一个My…

【Unity编辑器扩展】GF_HybridCLR自定义Toolbar, 一键出包/打热更扩展工具

GF_HybridCLR是基于GameFramework HybridCLR的一款工具链完善,工作流简洁的游戏框架。拥有标准高效的开发工作流,开箱即用,适用于快速研发。 出包时经常遇到忘记刷新配置表、忘记重新打AB包等等,接入HybridCLR每次打热更包也需要…

Android Span进阶之路——ClickableSpan

一、前言 在Android中,可以使用强大的标记(Span)对象来实现富文本展示,相比 HTML 而言更高效实用。关于 Android Span 的入门篇可以阅读 Android中强大的标记对象-Span。本文将对 ClickableSpan (可点击的Span&#xf…

WebDAV之葫芦儿·派盘 + Koder

Koder 支持WebDAV方式连接葫芦儿派盘。 一款可以让你在iPhone、iPad上写各种编程语言代码的app,码农不要错过。 Koder是iPad和iPhone的代码编辑器。它确实具有许多功能,包括语法突出显示,代码段管理器,选项卡式编辑,查找和替换代码,编辑器主题,远程和本地文件连接等等…

OpenCV入门(C++/Python)- 使用OpenCV标注图像(六)

使用OpenCV标注图像用颜色线标注图像绘制圆绘制实心圆绘制矩阵绘制椭圆绘制带轮廓和填充半椭圆使用文本注释图像为图像和视频添加标注的目的不止一个,包含:向视频中添加信息在对象检测的情况下,在对象周围绘制边界框,用不同颜色的…

并查集介绍

文章目录:并查集原理并查集实现并查集的类结构并查集的合并统计集合数量并查集原理 在一些应用问题中,需要将 n 个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按照一定的规律将归于同一组元素的集…

《找对英语学习方法的第一本书》

简 述: 此书写于二十年前,结合我自身情况参照,有了一种理论指导,可在众多学习方法中有效抉择,亦能在不同阶段更换不同策略。本文为读后的一个简要归纳和札记。 文章目录第一章:爱之愈深、误之愈切第二章:我…

李宏毅2022《机器学习/深度学习》——学习笔记(5)

文章目录优化方法CNNCNN和全连接神经网络的区别感受野共享参数CNN和全连接神经网络的总结PoolingCNN流程自注意力机制自注意力机制解决的问题输入是一组向量的例子输入是一组向量时输出的可能自注意力机制核心思想自注意力机制具体细节Self-attention和CNN的关系参考资料优化方…

网络安全之从原理看懂XSS

01、XSS的原理和分类 跨站脚本攻击XSS(Cross Site Scripting),为了不和层叠样式表(Cascading Style Sheets,CSS)的缩写混淆 故将跨站脚本攻击缩写为XSS,恶意攻击者往Web页面里插入恶意Script代码,当用户浏览该页面时&#xff0c…

七周成为数据分析师 | 业务

为什么业务重要? 唯有理解业务,才能建立业务数据模型 一.经典业务分析指标 模型未动,指标先行 如果你不能衡量它,你就无法增长它 指标建立的要点 ①核心指标 ②好的指标应该是比率 ③好的指标应该能带来显著效果 ④好的指…

民办二本程序员阿里、百度、平安等五厂面经,5 份 offer(含真题)

昨天小休,一位高中同学联系了我,说是要请我吃饭,有这种好事,我当然是毫不犹豫的答应了啦! 等等...会不会是找我借钱的? 好慌,怎么办?已经答应过去了。 在后面的交谈中,…

Word控件Spire.Doc 【图像形状】教程(12) 如何在C#中旋转word文档上的形状

Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转…

【C语言程序设计】实验 3

目录 1. 水仙花数 2. 五位回文数 3. 输入x,计算y 4. 百分制改为等级制 5. 同构数 6. 月份天数 7. 加一天后日期(条件) 8. 计算服装款(条件) 1. 水仙花数 【问题描述】输入一个3位正整数,判断该…

数据可视化之基础图表

一 前言 数据图表则是用来表现数据的一类图表,用来帮助用户理解数据。在这类图表中,以三大类图表最为常用 —— 柱状图(条形图)、折线图、饼图。据非官方统计,数据图表使用率占所有图表的类型的62%。所以,…

Docker之MySQL_GROUP_REPLICATION组复制(MGR)、宕机节点恢复和Spirngboot整合

三台服务器修改hosts文件 vim /etc/hosts追加内容 192.168.1.11 node1 192.168.1.12 node2 192.168.1.13 node3修改hostname vim /etc/hostname重启网络使配置文件生效 systemctl restart network三台服务器拉取MySQL镜像 docker pull mysql:8.0.23创建配置文件夹 …

PDF文档转TXT怎么转?你不知道的几种方法

PDF文档转TXT怎么转?我们经常需要处理PDF文件,根据不同的要求,我们经常需要将PDF文件进行转换,虽然PDF文件相对于其他大多数文件来说体积已经很小了,但是TXT文件会比PDF文件体积更小一些,这样我们不仅可以节…