解析:什么是生成式AI?与其他类型的AI有何不同?

news2025/2/24 12:19:07

原创 | 文 BFT机器人 

图片

快速浏览一下头条新闻,你会发现生成式AI似乎无处不在。事实上,一些新闻标题甚至可能是通过生成式AI编写的,例如OpenAI旗下的ChatGPT,这个聊天机器人已经展现出了生成看起来像人类所写文本的惊人能力。

当人们提到“生成式人工智能”时,他们指的到底是什么?

在生成式AI热潮兴起之前,当人们谈论人工智能时,通常是指那些可以基于数据进行预测的机器学习模型。例如,通过数百万个示例对此类模型进行训练,以预测某种X射线是否显示出肿瘤的迹象,或者某个借款人是否可能拖欠贷款。

图片

生成式 AI 可以被认为是一种另类的机器学习模型,经过训练后可以创建新数据,而不是对特定数据集进行预测。生成式AI系统指的是用来生成类似于其训练数据的更多对象的系统。“当涉及到生成式AI和其他类型的AI背后的技术时,它们之间的界限可能有点模糊。通常相同的算法可以用于两者,“麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola表示。

尽管 ChatGPT 及其同类产品的发布引起了广泛的关注和讨论,但该技术本身并不是全新的。这些强大的机器学习模型是基于超过50年的研究和计算技术进步。

01

复杂性的提升

生成式AI的一个早期实例被称为马尔可夫链。该技术以俄罗斯数学家安德烈·马尔科夫(Andrey Markov)的名字命名,他在1906年引入了这种统计方法来模拟随机过程的行为。在机器学习中,马尔可夫模型长期被用于如电子邮件程序中预测下一个单词的自动填充任务。

图片

在文本预测中,马尔可夫模型能够通过分析前一个或几个单词来生成句子中的下一个单词。但这些模型由于只能回顾有限的信息,因此生成的文本往往不够合理,MIT电气工程与计算机科学Thomas Siebel教授、CSAIL和数据、系统与社会研究所(IDSS)成员Tommi Jaakkola表示。“我们在过去十年之前就开始进行生成式操作,但主要区别在于我们现在能生成的对象的复杂性以及训练这些模型的规模。”他补充道。

在几年前,研究人员倾向于寻找一种能够充分利用特定数据集的机器学习算法。但现在这种焦点已经略有转移,许多研究人员开始利用更大规模的数据集,可能包括数亿甚至数十亿数据点,来训练能够取得卓越成果的模型。

ChatGPT及其类似系统的基础模型在工作方式上与马尔可夫模型大致相同。区别在于,ChatGPT规模更大、更复杂,有数十亿个参数,并且它已经接受了互联网上可公开获取的大量数据的训练。在这个庞大的文本资料库中,单词和句子以具有某些依赖关系的顺序出现,这种重复性有助于模型了解如何将文本切割为具有一定可预测性的统计块。模型通过学习这些文本块的模式,并利用此知识来预测接下来可能出现的内容。

图片

02

更强大的架构

庞大的数据集是推动生成式AI热潮的催化剂之一,重要的研究进展也促成了更为复杂的深度学习架构的发展。

2014年,蒙特利尔大学的研究人员提出了一种名为生成对抗网络(GAN)的机器学习架构。GAN使用两个协同工作的模型:一个学习生成目标输出(如图像),另一个学习从生成器的输出中区分真实数据。生成器试图欺骗鉴别器,并在此过程中学习制作更逼真的输出。图像生成器StyleGAN就是基于此类模型的实例。

此后一年,斯坦福大学和加州大学伯克利分校的研究人员引入了扩散模型,通过迭代优化其输出,这些模型可以学习生成类似于训练数据集中样本的新数据样本,并用于创建逼真的图像。

图片

2017年,谷歌的研究人员推出了transformer架构,该架构已被用于开发大型语言模型,比如驱动ChatGPT的模型。在自然语言处理中,Transformer将文本语料库中的每个词编码为一个令牌,然后生成一个注意力图,该图捕捉每个令牌与所有其他令牌的关系。这个注意力图帮助Transformer在生成新文本时理解上下文。

这些仅仅是可用于生成式AI的众多方法中的一小部分。

03

应用范围广泛

这些方法的共同特点是将输入转换为一组令牌,这些令牌是数据块的数值表示形式。只要数据可以转换为这种标准的令牌格式,理论上可以应用这些方法来生成类似的新数据。“效果会因数据复杂度和信号提取难度而异,但它实际上越来越接近于通用CPU处理任意类型数据的方式,”Isola表示。

这为生成式AI开辟了大量的应用场景:

例如,Isola的团队正在使用生成式AI来创建合成图像数据,这些数据可用于训练另一个智能系统,例如教计算机视觉模型如何识别物体。

Jaakkola的团队正在使用生成式AI来设计新的蛋白质结构或有效的晶体结构以指定新材料。就像生成模型学习语言的依赖性一样,如果展示晶体结构,它也可以学习使结构稳定和可实现的关系。

图片

尽管生成模型可以取得惊人的成果,但它们并非适用于所有类型的数据,对于那些涉及在结构化数据(如电子表格中的表格数据)上进行预测的任务,生成式AI模型往往不如传统的机器学习方法。

04

生成式AI的机遇与风险

生成式AI聊天机器人目前在呼叫中心被用来解答客户的问题,但这一应用凸显了实施这些模型可能带来的一个潜在问题——人类的工作岗位被替代。此外,生成式AI可能会继承和扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。同时这些模型具有抄袭的能力,并且可以生成看起来像是由特定人创作的内容,从而引发潜在的版权纠纷。

但另一方面,麻省理工学院的研究人员提出,生成式AI可能赋能艺术家,他们可以利用生成工具帮助创作他们可能无法用其他方式制作的创意内容。而在其他领域——如制造业,研究人员认为,在未来生成式AI不仅是让模型生成椅子的图像,它也许能生成可实际制造的椅子设计方案,这类应用或将彻底改变许多领域的经济格局。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1215199.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蓝桥杯每日一题2023.11.16

蓝桥杯大赛历届真题 - C 语言 B 组 - 蓝桥云课 (lanqiao.cn) 题目描述 对于此代码&#xff0c; 注释解释如下&#xff1a;答案&#xff1a;f(a,k1,m-j,b)&#xff1b; 在这里插入代码片#include <stdio.h> #define N 6 #define M 5 #define BUF 1024 void f(int a[], in…

市场研究报告:量子计算将颠覆银行业!

&#xff08;图片来源&#xff1a;网络&#xff09; 量子银行将对金融体系产生重大影响&#xff0c;它在量子计算和区块链的基础上建立了一个更快的支付机制&#xff0c;并且通过消除传统点对点支付中常见的中间人&#xff0c;降低了运营成本。 量子计算及其运作机制 中东地区…

【人工智能实验】遗传算法求解旅行商问题 golang

人工智能经典问题旅行商求解 使用遗传算法求解&#xff0c;算法流程如下&#xff1a; 读取所有的城市坐标&#xff0c;记作集合initCitys生成popSize个种群&#xff0c;记为pops取出种群中适应度最高的&#xff0c;记作rank0使用轮盘算法&#xff0c;从rank0中选出eliteSize个…

Redis分布式锁(中)

作者简介&#xff1a;大家好&#xff0c;我是smart哥&#xff0c;前中兴通讯、美团架构师&#xff0c;现某互联网公司CTO 联系qq&#xff1a;184480602&#xff0c;加我进群&#xff0c;大家一起学习&#xff0c;一起进步&#xff0c;一起对抗互联网寒冬 我们在不久前介绍了Spr…

【场景】高并发解决方案

文章目录 1. 硬件2. 缓存2.1 HTTP缓存2.1.1 浏览器缓存2.1.2 Nginx缓存2.1.3 CDN缓存 2.2 应用缓存 3 集群4. 拆分4.1 应用拆分&#xff08;分布式、微服务&#xff09;4.2 数据库拆分 5. 静态化6. 动静分离7. 消息队列8. 池化8.1 对象池8.2 数据库连接池8.3 线程池 9. 数据库优…

酷开系统 酷开科技,将家庭娱乐推向新高潮

在当今数字化时代&#xff0c;家庭娱乐已经成为人们日常生活中不可或缺的一部分。如果你厌倦了传统的家庭娱乐方式&#xff0c;想要一种全新的、充满惊喜的娱乐体验&#xff0c;那么&#xff0c;不妨进入到酷开科技的世界&#xff0c;作为智能电视行业领军企业&#xff0c;酷开…

Git常用操作-MD

文章目录 1. 本地创建分支&#xff0c;编写代码&#xff0c;提交本地分支到远程仓库2. 提交本地代码到本地仓库3. 提交本地代码到本地dev分支4. 提交本地dev分支到远程仓库5. 本地dev分支拉取远程master分支&#xff0c;并将master分支内容合并到本地dev6. 同义命令7. 撤销上次…

Codeforces Round 908 (Div 2——AB)

A. Secret Sport 题目 AB二人玩游戏&#xff0c;每一局&#xff08;plays&#xff09;游戏会有一个获胜者&#xff0c;首先获胜X局&#xff08;play&#xff09;的玩家得一分&#xff08;赢得一轮sets&#xff09;。率先获得Y分的玩家获得最终胜利。 给你整场游戏的每局&…

Spring Boot使用EhCache完成一个缓存集群

在上一篇在SpringBoot中使用EhCache缓存&#xff0c;我们完成了在Spring Boot中完成了对EhCaChe的使用&#xff0c;这篇&#xff0c;我们将对EhCache的进一步了解&#xff0c;也就是搭建一个EhCache的缓存集群。 集群 在搭建一个EhCache的时候&#xff0c;我们需要先了解&…

areadetector ADURL模块应用在面探测控制的初步应用

本章中讨论了使用ADURL控制面探测器Lambda的过程&#xff1a; ADURL的使用请见&#xff1a; EPICS -- areaDetector URL驱动程序-CSDN博客 需要启动一个ADURL的IOC程序&#xff0c;并且设置相关的插件中参数的值&#xff1a; # st.cm < envPaths < st_base.cmddbpf 1…

WorkPlus即时通讯app支持多种信创环境组合运行

在信息技术领域&#xff0c;国产信创技术的快速发展为企业带来了更多的选择和机会。在此背景下&#xff0c;WorkPlus作为一款全方位的移动数字化平台&#xff0c;全面支持国产信创操作系统、芯片和数据库&#xff0c;并且全面兼容鸿蒙操作系统。这一优势使得WorkPlus成为了企业…

企业数据备份应该怎么操作?应该知道的四种备份方法

​企业数据备份对于保护最重要的资产至关重要。在面对不断增加的安全威胁时&#xff0c;很多企业都感到无从下手&#xff0c;不知如何保护关键业务数据。通过采用正确的数据备份方法&#xff0c;可以成为确保企业数据安全的最有效手段。因此&#xff0c;不论您是个人还是在职人…

第二证券:今日投资前瞻:小米汽车引关注 全球风光有望持续高速发展

昨日&#xff0c;两市股指盘中轰动上扬&#xff0c;深成指、创业板指一度涨超1%。到收盘&#xff0c;沪指涨0.55%报3072.83点&#xff0c;深成指涨0.72%报10077.96点&#xff0c;创业板指涨0.53%报2015.36点&#xff0c;北证50指数涨2.64%&#xff1b;两市算计成交9900亿元&…

亚马逊云科技云存储服务指南

文章作者&#xff1a;Libai 高效的云存储服务对于现代软件开发中的数据管理至关重要。亚马逊云科技云存储服务提供了强大的工具&#xff0c;可以简化工作流程并增强数据管理能力。 亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏…

Ubuntu 22.04 LTS ffmpeg mp4 gif 添加图片水印

ffmpeg编译安装6.0.1&#xff0c;参考 Ubuntu 20.04 LTS ffmpeg gif mp4 互转 许编译安装ffmpeg &#xff1b;解决gif转mp4转换后无法播放问题-CSDN博客 准备一个logo MP4添加水印 ffmpeg -i 2.mp4 -vf "movielogo.png[watermark];[in][watermark]overlayx10:y10[out]&…

torch_cluster、torch_scatter、torch_sparse三个包的安装

涉及到下面几个包安装的时候经常会出现问题&#xff0c;这里我使用先下载然后再安装的办法&#xff1a; pip install torch_cluster pip install torch_scatter pip install torch_sparse 1、选择你对应的torch版本&#xff1a;https://data.pyg.org/whl/ 2、点进去然后&…

PowerConsume功耗计算器

嵌入式低功耗产品开发&#xff0c;功耗计算器资源-CSDN文库 PowerConsume使用说明 安装说明 需要安装在无空格等特殊字符的路径&#xff0c;不推荐安装在C盘。 功能说明 已知条件 电池容量 各状态的电流和运行时间 自动计算出设备运行时间 启动界面如下 添加状态 在空白处…

【Python基础篇】运算符

博主&#xff1a;&#x1f44d;不许代码码上红 欢迎&#xff1a;&#x1f40b;点赞、收藏、关注、评论。 格言&#xff1a; 大鹏一日同风起&#xff0c;扶摇直上九万里。 文章目录 一 Python中的运算符二 算术运算符1 Python所有算术运算符的说明2 Python算术运算符的所有操作…

12.Oracle的索引

Oracle11g的索引 一、什么是索引二、索引的分类三、索引的语法四、分析索引四、索引的作用及使用场景 一、什么是索引 在Oracle数据库中&#xff0c;索引是一种特殊的数据结构&#xff0c;用于提高查询性能和加速数据检索。索引存储了表中某列的值和对应的行指针&#xff0c;这…

开源微信小程序源码/校园综合服务平台小程序源码+数据库/包括校园跑腿 快递代取 打印服务等功能

源码简介&#xff1a; 校园综合服务小程序源码&#xff0c;它是基于微信小程序开发&#xff0c;包括快递代取 打印服务 校园跑腿 代替服务 上门维修和其他帮助等功能。它是开源微信小程序源码。 校园综合服务小程序开源源码是一款功能强大的小程序&#xff0c;可用于搭建校园…