AIGC技术带给我们什么?基于AIGC原理及其技术更迭的思考

news2024/11/28 20:59:45

AIGC技术带给我们什么?基于AIGC原理以及技术更迭的思考

前言

AI,这个词在如今人们的视野中出现频率几乎超过了所有一切其他的事物,更有意思的是,出现频率仅次于这个词的,几乎都会加上一个修饰亦或是前缀——AI,没错,还是它。

正值五一假期,我们试着在网上搜索关键词的相应指数,分别对“ai”和“五一”两个词进行对比,我们发现:顶峰时期的”五一“一词也几乎只是达到”ai“的日常水平。(数据仅供参考,具有极强的范围局限性——尽管如此,我相信人们如今对于ai的讨论已作为家常便饭)

在这里插入图片描述

也许在五年前,不,三年前,AIGC这门技术还并没有起色,甚至可以说在所有技术领域之中并没有得到实际性的应用和实践。但是仅仅过了一两年——也就是在2022年11月30日,ChatGPT的发布彻底改变了人们对AI,对AIGC的看法,甚至可以说它改变了AIGC这门技术的基本含义以及实际意义。
在这里插入图片描述

AI是什么?这个对于我们这些臭写代码的来说并不陌生,其实它的英文本意就已经很好地解释了其功能和意义:Artificial Intelligence,人工智能,即研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。也就是说它是有助于的。

而AIGC就是由AI自动创作生成的内容AI Generated Content)。它即是AI的衍生学科,由AI技术赋能,为了更好地对AI进行探索和发展,人们创造了这门学科。

像我们如今使用的ai工具例如ChatGPT、文心一言、Sora等等,都是基于AIGC技术而产生的应用和服务。可见它致力于为人类提供更好的创造。

如今网络上随处可见的AI生成图片、视频、音乐,AI合成虚拟人,前段日子火爆全球的游戏《幻兽帕鲁》等等,无疑是AIGC所带给人们关注效果最为显著的杰作,也无疑是人们收益颇丰的技术支持,无论是针对开发者还是消费者。它带来了原本应是人类自身所该带来的情绪价值:歌曲的创作,某张历史图片的复原;同时也带来了无限的物质价值:开发者大赚一笔,关注者进行着无意间的流量消费以及资金开销。毫无疑问,AIGC技术给人类社会带来了众多方面的改革和变化,也实实在在地改变了人们看待周遭事物的想法。

但是,随之而来的争议也是滔滔不绝,引发的思考也是源源不断。

”AI生成的艺术作品无法取代人类情绪价值的付出“,”AI并不能取代人类千万年来在社会各个方面的创作以及思考“。人们对于AIGC技术的”入侵“,很难不表现出不适应或者说是不习惯,并且针对其引发的思考也是各执一言,各有看法。那么针对AIGC对于人类社会的浸入,我们究竟该如何看待呢?


AIGC的前世今生:历史变革与技术发展

下图很好地概括了AIGC的前世今生:

在这里插入图片描述

AIGC的发展理论上可以分为三个阶段:早期萌芽阶段(1950s-1990s)沉淀积累阶段(1990s-2010s)快速发展阶段(2010s-至今),但我认为快速发展阶段实际上可以又分为2022年前后两个阶段(ChatGPT的问世带来了新的AIGC)。

总的来说,AIGC的发展历史是随着科技水平和研究技术的改变而改变的,早期的AIGC仅仅只是局限于计算机自主创作以及简单的人机对话,但是并不成熟;后来我认为的一个里程碑事件就是手机的出现带动了语音助手的发展,例如Siri、小米的小爱同学,这些都是基于AIGC技术面向对话的成果,这很大程度表明了AIGC对于人类生活的帮助是不可忽视的,毕竟涉及到物联网、大数据、云等等,都可以与之良好结合。直到后来的ChatGPT,实际上针对这类文本创作助手,早已有相应研究和科研成果,但真正具有跨时代、开辟意义的只在OpenAI的GPT问世,它带来了一个新的变革,一个新的人机对话方式,新的AIGC。

AIGC以其多元化的应用场景、并联使用的技术融合、迎合生活的操控方式,在未来的发展必将不可限量,未来的历史也是历史,将会有更多历史性的事件等待着我们。

AIGC三把斧:AI核心技术

AI的三项核心技术包括:深度学习、神经网络生成式对抗网络(GAN)。而由于AIGC本身就是基于AI的,所以说这三项核心技术同属于AIGC也不为过。当然,更严谨的说法包括基础模型和预训练大模型两个模块,但这是针对模型来进行分类,在此我们介绍的是技术层面。

神经网络

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。结构类似于像数据结构中的星图。

神经网络模拟的就是人类的神经网络,它的不同点犹如神经元,可以接受和传递信息,它的不同线由于神经纤维,可以控制信息的流动。

深度学习

深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,Artificial Intelligence)。

为了完善和加强神经网络,深度学习将其分为多层从而进行分工合作,犹如大脑中的不同区域负责不同的功能。这样做的目的是使机器能够更加有规律和高效地处理和理解问题。

在这里插入图片描述

生成式对抗网络(GAN)

近年来,深度学习在很多领域的都取得了突破性进展,但大家似乎发现了这样的一个现实,即深度学习取得突破性进展的工作基本都是判别模型相关的。2014年Goodfellow 等人启发自博弈论中的二人零和博弈,开创性地提出了生成对抗网络(GAN)。

GAN包括了一个生成模型(Generator)和一个判别模型(Discriminator),前者的作用是创造,例如文本作品、歌曲等;后者的而作用是判断,用于判断这些作品是否是真实存在的(否则是生成模型所产生的)。

可以这么理解:生成器和判别器互相对抗和挑战,从而更好地完善自己,在努力朝着生成器不被判断器识别出、判断器总是能识破生成器的方向前进——这似乎在趋于一个中间的平衡,但二者实际上是互相矛盾的。

在这里插入图片描述

AIGC技术在各领域的应用

我们先来探讨一下AIGC的技术应用
人工智能生成内容技术AIGC)作为人工智能领域的重要分支,其在各个领域的广泛应用潜力难以估量。其主要的应用在于以下几个方面:

  1. 内容创作:AIGC技术被广泛应用于新闻报道、广告文案、电商商品描述等领域,能够快速生成大量高质量的内容,提高创作效率。
  2. 营销推广:在商业领域,AIGC技术被用于生成个性化的营销内容,根据用户数据和行为进行精准定制,提升品牌曝光和用户参与度。
  3. 客户服务:许多企业利用AIGC技术开发智能客服系统,能够自动回复用户问题、提供产品信息和解决常见问题,提升客户服务效率。
  4. 教育领域:AIGC技术被应用于智能辅导系统,能够根据学生的学习情况生成个性化的学习内容,提高学习效果。
  5. 医疗领域:在医疗影像诊断和疾病预测方面,AIGC技术也发挥着重要作用,能够帮助医生更准确地诊断疾病和制定治疗方案。

不知道你是否能够看出来,对于应用的介绍是使用ChatGPT写出来的。不夸张地说,它确实将AIGC的应用进行了大致的概括,并且较为全面——这也基于我给它提供的几个提示词:简短以序号形式——是的,仅仅是如此简单的几个词,我们就可以对其语言风格以及输出内容进行控制和管理。而这,实际上就是AIGC的最为核心的应用,可以说AIGC技术就是围绕它来展开的——内容创作

1.内容创作

像例如ChatGPT这类的文字创作工具,它们被用于内容创作,服务的对象是整个人类群体——因为人类社会离不开文字。音乐、影像同样是这样。

在生成式AI技术的使用中,又包括以下几个方面:

1) 文本生成

不可否认的是,AI生成的速度相较于人类作者更快、更高效,而生成内容的质量也是基于已有的数据支持,具有一定的权威性和真实性。在文本上的使用通常会有益于作家、博客、代码编写者等等。对于他们来说,AIGC助手的帮助让他们写作的效率大大提高,避免了冗长不必要的内容书写,并且还能帮助他们润色自己的文章,提高代码的可读性和健壮性等。除此之外,由于AI对于数据的收集范围之广,甚至能够轻松地通过各种面向人类的考试,例如心理类,法律类等等,所以它同样也可以勉强担当一个心理治疗师、律师甚至是朋友(当然,只要你可以接受你的朋友只是一个对话框)。

2) 音频生成

包括语音合成、音乐创作和声音设计等等,Suno等音乐创作 AI 程序允许用户使用 AI 创建原创音乐曲目。经过观察,我们会发现AI赋能音乐创作确实能够出现某些效果超群、技术高超的编曲,例如这首原本传统的《春天在哪里》,作为音乐爱好者,不得不说它的爵士乐味道十足,并且似乎还有自己独到的见解。

【suno ai】春天在哪里,但是ai版_哔哩哔哩_bilibili

除了音乐创作之外,语音合成和声音设计等等,也是AIGC技术在音频方面不可忽视的应用。

3) 图像生成

将草图转换为数字绘制的图像,其实本质上起到修饰的作用,但是延伸出了包括视觉艺术、广告设计、游戏场景等等方面的创作协助,这无疑给众多行业带来一个巨大的Pandora’s box,毕竟还有那么多的美术创作者,或许还在为如何塑造好的线条美感而烦恼,而如今AIGC已经较好地解决了这个问题。

4) 视频生成

人工智能生成的视频同样不能忽视,虽然目前仅仅支持无声视频,这实际上并不等同于完整的视频;如今市面上出现的许多由AI独立生成的具有指定风格的视频,让人难以辨认其真假(指是否为人创作);而事实上,这个问题在整个AIGC的应用中都频频出现,这是难以避免的。

5) 跨模式生成

AIGC中的跨模态内容生成是指使用基础AIGC模型跨多种模态生成新内容。它包括文本到图像、图像到文本、文本到代码、文本到视频、文本到音频等。像ChatGPT提供的语音对话助手,它基于文本创作,再结合了人类说话的特点,可以模仿人类的口吻完成对话,甚至连话语之间的吸气声也不会漏掉,这就是文本到音频的跨模式生成的典型例子。

6)虚拟人的诞生

AIGC可以生成具有逼真表情或者动作的虚拟人,而这实际上是集合了上述几乎所有应用综合生成的一大产物,可以想象《银翼杀手2049》中的场景离自己如此之近(相对从前)。

2.其他应用

基于内容创作,衍生出的其他应用实际上可以认为是覆盖到人类生活的各个方面。在医疗方面,通过大数据广泛吸纳各个方面的医学知识,医生可以仅仅通过一句提问就得到专业性的回答,对症下药,当然这只是最浅显的应用。像病情分析,患者医疗方案制定等,更是有分化的不同使用,例如:利用生成式人工智能(AIGC)解决『医疗领域』的痛点和难题 - 知乎 (zhihu.com),这篇文章很好地展示了临床医生和患者之间互动记录的全过程,解决了原本需要消费巨大人工成本的难题以及记录的准确性和完整性。在营销推广方面,广告版面的设计,广告语的修饰,针对用户群体生成个性化的营销方案,博人眼球、吸引用户,颇有成效。
在这里插入图片描述

在教育和服务业方面,AI的赋能可以帮助教师和服务业人员优化他们的教案和服务制定方案,同时像一众的AI软件也是服务业面向AI创作的产物,毕竟,AIGC本身就是为了更好地服务于人,优化人的工作的技术。值得一提的是,随着网购行业和直播流的发展,客服实际上是一个十分重要且需要精确度的岗位,而AI恰好能够较好地解决大部分繁琐、常见、无需人工的问题,这也给服务业带来了巨大的发展。

这仅仅只是AIGC应用的冰山一角,实际上我们人类目前对于AI的探索也仅仅只是管中窥豹,毕竟AI的处理中枢就是由各种数据和算法构成的一个近似人类大脑的集成系统,而我们甚至对自己的大脑都没有彻底探索清楚,那么对于AI的开发之路也就道阻且长了。

AIGC的舆论危机

其实不难看出,AI技术的发展一直都在遭受着舆论的危机,而这也将是决定其发展方向的一重要因素——这是不可避免的。既然我们创造了它,那么我们也可以操控它。这或许是我们创造这门技术的理想方向,也是我们需要努力在其飞速发展的过程中渴望一直秉持的操作。

知识产权的侵犯,无休止的侵权风波

由于AI基于大数据的收集,那么必然避不开任何数据的使用和借鉴,这也就必然会涉及到知识产权的侵犯问题——然而这个界限是模糊的,是无法模棱两可的。你可以说是因为这种行为目前已经泛滥成脏无可休止,也可以说产权持有者对于这种行为的处理的乏力和漠不关心——你甚至可以说这还是一种宣传知识的行为。这种不清晰的界限导致这个问题难以得到清晰的解答。

虚假内容的传播,犯罪的幕后黑手

AI或许不会真正意义的说谎,但人类可以告诉它虚假的事实,而它恰好可以编造更为逼真的事实。大范围的虚假内容传播会导致事实不再那么透明,真相被不明掩盖。更何况它有可能带来犯罪。我国实际上已经有了相关的法律规定:《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》等等,人民法院官方甚至也发表了对有关人工智能法律问题的思考。这些现象无不表明政府正在逐渐重视针对AI的法律体系完善和改进,而这也将成为今后限制AIGC技术发展的一大决定性因素(同时也是必不可少的)。

在这里插入图片描述

隐私问题:数据的收集

我们知道,AIGC技术的可行性在于海量数据的提供,那么它势必会涉及到个人数据的隐私问题。由于人工智能本身对数据的索取之深,再加上人们对大数据决策产生深度依赖,对于自身的数据的丢失的概念不够清晰,那么隐私问题必然是层出不穷的,这实际上是不可避免的,当然你可以认为只要不危害自己的生活,数据的泄露和滥用也就对自己影响不大,虽然话可以这么说,毕竟AI所做的只是数据的收集,而至于对于数据的使用,可能就需要法律来规范了。无论如何,我们还是要尽量保护自己的隐私权不受侵犯,尽量保护自己的基本权利。

道德危机,人类与AI的博弈

这是最为老生常谈的一个问题。人类总是在以高昂的姿态前进,在此之前从未有过超越人类本身的、人类自己创造的产物出现,而如今AI的出现,恰似棋逢对手,虽然是“我诞生了你”,但是“你未必就劣于我”。必然会造成很大的舆论危机和伦理问题的讨论。人类和技术之间实际上是一种共生关系。这是凯文凯利的观点。人类创造了人工智能,但也要学会与其和平共处,它在各方面的渗透之深也表明了——如果不与其保持良好的和谐关系,将会造成的问题是谁也不敢设想的。我们生活在一个高速发展的社会,但同样道德和伦理也限制着我们发展的速度和方向,但AI或许在某些方面的准则与我们人类并不一致,这也就间接导致了我们在与其共生的过程中所要注意的问题和界限。或许我们可以通过技术来告诉AI应该怎么做,应该遵循什么原则,但是要形成一套完整的、不出差错的体系是非常之难的——毕竟我们人类自己都没有形成一套完全相同的道德体系和认知观念。所以,我相信关于这些问题的争论会一直持续,我们只有不断试错和改进,才能朝着完美的方向前进,至于能否达到,一切未知。

AI的未来

如今我们再看文章开头的那个问题:那么针对AIGC对于人类社会的浸入,我们究竟该如何看待呢?

实际上仅凭我一家之言是根本无法回答的,甚至可以夸张地说,没有经历时间的检验,这个问题谁也无法给出准确的答案。毕竟,未来还未来临。所以,既然这门技术已经出现了,我们无法避免不跟随社会不断前进的脚步,否则会脱轨;我们也无法不陷于这个满是AI的世界,毕竟新的时代已经到来,就跟二十年前的互联网时代一般,那个时候人们同样有着针对互联网的疑问:将世界仅通过那么细的网线连接,如此神奇之技术究竟会给人类社会带来什么?

其实,我们现在也只能发出同当年一样的疑问:

现了,我们无法避免不跟随社会不断前进的脚步,否则会脱轨;我们也无法不陷于这个满是AI的世界,毕竟新的时代已经到来,就跟二十年前的互联网时代一般,那个时候人们同样有着针对互联网的疑问:将世界仅通过那么细的网线连接,如此神奇之技术究竟会给人类社会带来什么?

其实,我们现在也只能发出同当年一样的疑问:

AIGC如此神奇之技术究竟会给人类社会带来怎样的发展和变革呢?让我们拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1650057.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【刷题篇】双指针(一)

文章目录 1、移动零2、复写零3、快乐数4、盛最多水的容器 1、移动零 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须在不复制数组的情况下原地对数组进行操作。 class Solution { pub…

【机器学习系统的构建】从模型开发的过程讲清楚K-Fold 交叉验证 (Cross-Validation)的原理和应用

0、前言 最近在学习集成学习的时候了解到了k折交叉验证,其实在之前学习吴恩达老师的课程中也学过交叉验证,但是当时也不是很明白。这次借着自己的疑问以及网上搜找资料,终于把交叉验证给弄明白了。 在弄清楚前,我有这样几个疑问…

Windows系统和unbtun系统连接usb 3.0海康可见MVS和红外艾睿相机

一.海康可见USB3.0工业面阵相机 海康usb相机需要去海康官网上下载对应系统的MVS客户端及SDK开发包 海康机器人-机器视觉-下载中心 选择Windows系统和unbtun(我是linux aarch64,所以选择了对应压缩包解压) Windows系统 1.双击安装包进入安装界面&…

第三节课,前端

一、参考链接; 总 知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具 分 2022-03-18 星球直播笔记-用户中心(下) 语雀 二、登录 2.1登录网址 2.2前端页面修改 2.1 页面修改 2.2 页脚的超链接 网址&am…

机器学习算法--朴素贝叶斯(Naive Bayes)

一、实验环境 1. python3.7 2. numpy > 1.16.4 3. sklearn > 0.23.1 二、朴素贝叶斯的介绍 朴素贝叶斯算法(Naive Bayes, NB) 是应用最为广泛的分类算法之一。它是基于贝叶斯定义和特征条件独立假设的分类器方法。NB模型所需估计的参数很少,对缺…

25考研英语长难句Day02

25考研英语长难句Day02 【a.词组】【b.断句】 如果你是你讲话对象中的一员,你就能了解你们大家共同的经历和问题,你也可以顺便评论一下食堂里难吃的食物或董事长臭名昭著的领带品味。 【a.词组】 单词解释addressv. 演说, 演讲;…

【进程终止】概念理解 | 三种情况 | 退出码

目录 什么是进程终止 进程退出的场景 退出码 0退出码 !0系统退出码 非0自定义退出码 进程的终止从三个方面去谈。清楚进程终止是在做什么?进程终止的3中情况?如何终止?注意进程终止不是进程暂停。 什么是进程终止 ❓进程…

Map集合的实现类~HashMap

存储结构:哈希表 键重复依据是hashCode和equals方法(键不能重复) 添加: 先创建Student类,那么往HashSet添加的就是Student对象作为键值,后面的作为值 删除: 判断: 遍历&#xff1a…

Android 系统启动流程源码分析

一、Init进程启动 是一个由内核启动的用户级进程。内核自行启动之后,就通过启动一个用户级程序init的方式,完成引导进程。 启动的代码init.c中的main函数执行过程:system\core\init.c中: 主要下面两个重要的过程: 1…

每日OJ题_贪心算法三⑤_力扣134. 加油站

目录 力扣134. 加油站 解析代码 力扣134. 加油站 134. 加油站 难度 中等 在一条环路上有 n 个加油站,其中第 i 个加油站有汽油 gas[i] 升。 你有一辆油箱容量无限的的汽车,从第 i 个加油站开往第 i1 个加油站需要消耗汽油 cost[i] 升。你从其中的一…

基于51单片机的ADC0804的电压表设计(仿真+源码+设计资料)

目录 1、前言 2、资料内容 3、仿真图 4、程序 资料下载地址:基于51单片机的ADC0804的电压表设计(仿真源码设计资料) 1、前言 最近看网上有很少的ADC0804的设计了,都由0809代替,但是有个别因为成本原因和学校课…

60、郑州大学附属肿瘤医院 :用于预测胃癌患者术后生存的深度学习模型的开发和验证[同学,我们的人生应当是旷野]

馒头老师要说的话: 我近期看了一下北京的脑机公司,大概是我之前对这一行业太过于乐观,北京的BCI公司和研究所,比上海、深圳、杭州甚至是重庆都要少,门槛也要高很多。也有我自己的原因,有时站的太高&#x…

LM4562NA 直插DIP8双运放 音频hifi运算放大器

LM4562NA是一款高性能音频运算放大器,其应用领域主要集中在音频和声音处理方面,包括但不限于: 1. 专业录音设备:在录音棚、广播电台和电视台等专业环境中,用于信号放大和处理,确保高质量的声音录制和传输…

Deep Learning Part Eight--Attention 24.5.4

01.在翻译、语音识别等将一个时序数据转换为另一个时序数据的任务中,时序数据之间常常存在对应关系 引入了Attention的概念,介绍了Attention的注意力机制: 困难出现,seq2seq的问题引入:固定化长度问题(过于…

LeetCode 面试经典150题 252.会议室

题目:给定一个会议时间安排的数组 intervals ,每个会议时间都会包括开始和结束的时间 intervals[i] [starti, endi] ,请你判断一个人是否能够参加这里面的全部会议。 思路:因为一个人在同一时刻只能参加一个会议,因此…

QGraphicsView实现简易地图10『自适应窗口大小』

前文链接:QGraphicsView实现简易地图9『层级缩放显示底图』 自适应窗口大小 当地图窗口放大或缩小的时候,需要地图能够动态覆盖整个视口。 1、动态演示效果 2、核心代码 注:WHMapView继承自MapViewvoid WHMapView::resize() {if (m_curLev…

Linux\_c输出

第一条Linux_c输出 初界面 : ls # 显示目录下的文件cd # 进入到某个目录 # 比如 我进入了Codels # 发现没有显示, 说明为文件下为空vim cpucdoe.c # 创建一个 .c的源码文件进入到了vim的编辑界面: i # 按i 就可以进行编辑 , 下面显示插入标识在编辑模式下, 可以通…

纯血鸿蒙APP实战开发——底部面板嵌套列表滑动案例

介绍 本示例主要介绍了利用panel实现底部面板内嵌套列表,分阶段滑动效果场景。 效果图预览 使用说明 点击底部“展开”,弹出panel面板。在panel半展开时,手指向上滑动panel高度充满页面,手指向下滑动panel隐藏。在panel完全展开…

netty 高性能架构设计--零拷贝

文章目录 前言一、直接内存1.1 什么是直接内存1.2 代码实现1.3 使用直接内存的优缺点 二、netty 零拷贝设计2.1 netty 直接内存2.2 netty 内存池 三、零拷贝的两种方式 前言 本篇从源码层面剖析 netty 高性能架构设计之零拷贝,并且扩展讲述零拷贝的两种实现方式。 …

免费在线录屏、无需注册、免费可用、无限制

免费在线工具 https://orcc.online/ 在线录屏 https://orcc.online/recorder pdf在线免费转word文档 https://orcc.online/pdf 时间戳转换 https://orcc.online/timestamp Base64 编码解码 https://orcc.online/base64 URL 编码解码 https://orcc.online/url Hash(MD5/SHA…