通俗易懂生成式人工智能(Generative AI)

news2024/9/20 9:05:25

生成式人工智能(Generative AI)

人工智能是目标,生成式人工智能就是我们的目标之一。

基本概念

什么是生成式人工智能?
生成式人工智能就是让机器产生复杂的、有结构的物件,如:文本、语音、图像等。而这些物件的在计算机中的表现就是数字,如文本就是一堆文字,文字编码成数字;语音就是一堆采样点;图像就是一堆像素点,这些都是数字。

那什么是复杂、有结构呢,要复杂到什么程度呢?
复杂到没有办法穷举。举个例子,让机器写一篇题目为《缝隙的联想》的100字的作文,这是今年的高考题目,假设中文常用字是1000(其实远不止),那么用中文组成这个100字的文章有多少种可能?就是1000^100=10 ^30,你想想有这么多种可能性,而宇宙种的原子总数才10 ^80,所以相当于机器要在近乎无穷种可能中找到最适当的那个组合。

那什么问题不是生成式人工智能问题呢?
如分类问题。这是机器学习中最常见的任务,比如垃圾邮件分类,猫狗分类等等。分类任务是从有限的选项中做选择,而生成任务就是机器创造出新的内容。

在生成式人工智能,我们常常会听到机器学习的概念。
那么什么是机器学习?
机器学习(Machine Learning)就是自动从资料里面找一个方程函数式(函式)。
举个例子,一次函式:y=f(x)=ax+b,对吧,这个是初中就学过的,已知两个点(x,y),就可以计算出这个函式的参数a,b。

在这里插入图片描述
之前我们是人力算出函式里面的参数,而机器学习就是用一系列的方法自动找出参数。那机器是怎么计算出参数的呢?
假设做一个猫狗分类任务,函式表示为:猫 or 狗 = f(输入的图片)
这个函数f(x)可不是只有a,b两个参数这么简单,而是有上万个参数组成,我们把这个上万个参数组成的函式就叫作模型Model。

在这里插入图片描述

我们收集一堆输入、输出的数据,喂给机器,机器学习就可以把这上万个参数个找出来,这个找参数的过程就是机器的学习过程,这个过程也可以叫做训练过程,即learning,traning。找参数时候喂给的数据,就叫做训练资料,找到这些参数以后,我们想测测机器到底学好了没有,这时候输入一张图片,看他输出什么,这些数据就叫作测试资料,这个过程就叫作测试testing,或推理inference。

在这里插入图片描述

有上万个参数的函式长什么样呢?我们很难想象。那今天在
机器学习的领域,是怎么表示这个有上万个参数的函式呢?
表示成一个类神经网络(Neural Network)。有人说类神经网络就是模仿人类大脑的学习,这个说法并不正确,其实一个类神经网络就是一个有大量参数的函式。当你把这个大量参数的函数表示成一个类神经网络,然后把这些大量参数解出来的技术,就叫作深度学习技术。所以,深度学习是机器学习的一种。当然,也有其他方法描述这个函式,但是当你用类神经网络描述它的时候,你做的就是深度学习技术。

在这里插入图片描述

概念之间的关系

人工智能、机器学习、深度学习、生成式等等,这些概念之间是什么关系呢?

机器学习是一种手段,生成式人工智能是目标,它们之间有交集的部分,也有各自独立的部分,比如:生成式人工智能的问题可以用机器学习的技术去解,可以用其他技术去解;机器学习不仅能解生成式人工智能的问题,也能解决其他问题,如分类问题。深度学习是机器学习一种。

在这里插入图片描述

但是今天,我们在网络上看到的它们之间的关系图,是画成这种:
在这里插入图片描述
把生成式人工智能放在机器学习里面,也能接受,因为今天生成式人工智能是一个非常困难的问题,也许除了深度学习,还没有发现更好的技术能够解决这个问题。

ChatGPT

ChatGPT背后就是深度学习技术,那么它是怎样一个原理呢?
ChatGPT也是一个函式,是一个可能有上亿个参数的函式。这个上亿个参数的模型,有个特别的名字,叫作transformer,是众多类神经网络的一种。
在这里插入图片描述

transformer模型(类神经网络的一种)长这样:
在这里插入图片描述

要打造出一个ChatGPT这样的人工智的函式,需要准备一大堆的输入和输出数据,比如:
在这里插入图片描述
然后训练模型,让机器学习把这上亿个参数找出来。这样就的得到了ChatGPT的函式。

那现在流行的其他AI画图工具(Stable Diffusion,Midjourny,DALLE等)是怎么做出来的?
这些AI画图也是一个函式。这些函式的输入就是一段文字,输出就是图片,显然这些函式也非常复杂,可能有上亿个参数。
在这里插入图片描述

然后为了计算出这上亿个参数,也需要准备一堆数据,这堆数据长这样:
在这里插入图片描述
机器学习的分类,回归问题只是机器学习解决的冰山一角,还有更复杂更苦难的问题,比如最近很火的生成问题(Generation),让机器产生有结构的复杂东西,如文本和图片等。用拟人化的说法,这种生成就是创造。这里的创造是指机器产生了它训练时候没有见过的数据,当然有人不认同这种说法,所以我们暂且将这个“创造力”加上引号。

目前生成式AI的挑战是什么?
按刚才的讲的,只要我们能收集足够多的数据资料,就能做生成式AI,但是也许训练资料怎么收集都是不够的,因为人类会问AI任何的问题,机器需要的答案可能训练集中从未出现,机器的“创造力”很重要。

那怎么理解ChatGPT的原理呢?
ChatGPT的核心原理通俗易懂来讲,就像是在做“文字接龙”。它每次只输出一个字,然后把这个字贴到输入的句子上,共同作为输入,模型就会输出下一个字,以此类推,最后模型输出end,意味着答案输出完毕。这个函式就是我们所说的语言模型。
在这里插入图片描述

-那把生成完整答案的这个事情,设计成文字接龙,有什么好处呢?
生成式AI的难点就是可能的答案是无穷无尽的,而文字接龙的答案是有限的(比如中文常用字为三四千个),而这一些列的文字接龙,就是相当于一系列的分类问题,机器回到从有限的选项中选择出答案的问题。本来很困难生成的问题就转换成了一系列的分类问题,变得可以解了。
在这里插入图片描述

再总结来看,语言模型就是生成式人工智能中的其中一个技术,并不是它的全部,因为事实上,生成并不一定用问文字接龙的方式,可以有不同的策略。
在这里插入图片描述

生成文章可以看作生成一系列的文字,生成图片可以看作生成一系列的像素点,语音可以看作生成一系列的采样点。这种把复杂的物件,拆解成较小的单位,再按照某种固定的顺序依次生成,这种生成策略就叫自回归生成策略(Autoregressive Generation),当然还有其他策略,我们日后都会讲到。
在这里插入图片描述

举个图片用像素点进行接龙生成的例子,openAI在很多年前就做过这样的工作,做出了影响版的GPT,但是这个方法并没有火起来,为什么呢?这个往后讲生成策略的时候再讲。
在这里插入图片描述

补充

生成式人工智能的概念是什么时候出现的呢?
生成式人工智能的概念并不是近期才出现的,李宏毅老师在2015年的课程就叫作《机器学习及其深层与结构化》。强调深层学习,是因为当年对deep learning还没有一个统一的翻译,深层学习更符合deep learning做的事情,现在当然统一翻译成深度学习了。强调结构化学习,就是今天的生成式AI,生成具有结构化的东西。
在这里插入图片描述

那过去的机构化学习和今天的生成式学习背后的技术有什么一样的地方吗?
没什么一样的地方。短短不到十年的时间,技术已经有了翻天覆地的变化。

生成式AI的哪些常见的应用呢?
如2006年上线的谷歌翻译
在这里插入图片描述
为什么今天的生成式人工智能比过去这么厉害呢?
下一篇大型语言模型具体介绍。

(学习李宏毅课程)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1963116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

笔试练习day1

目录 数字统计题目解析解法(枚举数字拆分)代码 两个数组的交集题目解析解法哈希表代码 点击消除题目解析解法栈代码 感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接 🐒🐒🐒 个人主页 🥸🥸&#x1f97…

4 款最佳 C# 无头浏览器

摘要: 在当今大数据时代,高效的数据采集成为众多项目的关键一环。对于偏好C#语言的开发者而言,无头浏览器是实现网页自动化交互、数据抓取的强大工具。本文将深入探讨四款顶尖的C#无头浏览器库,分析它们的特性和应用场景&#xf…

No J-Link found

线拔了,重插即可,顺便按按板子上的按钮 这里配置如下图

根据需求修改el-tab的默认样式

根据需求修改el-tab的默认样式 样式代码&#xff1a; <style lang"scss" scoped>//去掉了最下面的那条线:deep(.el-tabs--card > .el-tabs__header){border-bottom: none}//单独给每一项添加下边框、修改背景色:deep(.el-tabs--card > .el-tabs__heade…

多人协作不“撞车”,可道云teamOS网盘的编辑锁功能你知道吗?

在团队协作的世界里&#xff0c;文件编辑就像是一条繁忙的街道&#xff0c;每个人都是驾驶者&#xff0c;试图在文件上留下自己的痕迹。想象一下&#xff0c;如果没有任何规则和秩序&#xff0c;这条街道将会是一片混乱&#xff0c;编辑冲突和版本“撞车”将会频频发生。 今天…

Gartner发布2024年数据安全成熟度曲线:人工智能和量子计算驱动的32项数据安全相关技术发展变化

安全和风险管理领导者正在为当今人工智能和未来量子计算的影响做准备。合成数据、后量子密码学和此技术成熟度曲线上的其他创新可以帮助降低数据安全和隐私风险并实现业务目标。 需要知道的 过去几年&#xff0c;随着人工智能的使用以及隐私和人工智能相关立法的不断加强&…

idea mapper.xml跳转到databse对应的表或字段

idea mapper.xml跳转到databse对应的表或字段 1、安装Database Navigator插件 2、配置数据类型 setting- > language -> sql Dialects中 的选项设为 对应的数据库 3、链接数据库

最新盘点!国内外10款超热门的CRM系统对比!

在数字化时代&#xff0c;企业对于高效、智能的管理系统需求日益增加。无论是RM系统还是其他各类管理工具&#xff0c;都成为了企业提升竞争力的关键。本文将围绕国内外十款超热门的CRM系统展开对比&#xff0c;从公司背景、专业实力、产品核心能力以及解决方案能力四个维度进行…

DNS查询服务器的基本流程以及https的加密过程

DNS查询服务器的基本流程&#xff0c;能画出图更好&#xff0c;并说明为什么DNS查询为什么不直接从单一服务器查询ip&#xff0c;而是要经过多次查询&#xff0c;多次查询不会增加开销么&#xff08;即DNS多级查询的优点&#xff09;&#xff1f; 用户发起请求&#xff1a;用户…

找到/打开pupprteer对应chrome版本

前期提要&#xff1a;导出pdf的时候&#xff0c;会用pupprteer启动一个浏览器实例&#xff0c;再打开指定页面进行打印&#xff0c;页面写成什么样&#xff0c;导出的pdf内容就是什么样&#xff0c;听起来很正常。 但是遇到了调试的时候页面显示很正常&#xff0c;而导出的内容…

echarts柱状图——堆叠、多柱堆叠,并在顶部展示总和

实现的效果 要求 1、堆叠数据 2、可以有多个柱子堆叠 3、要展示每个堆叠柱子的总和 options配置 const xData ["周一", "周二", "周三", "周四", "周五", "周六", "周日"]; const morningIncome …

chrome/edge浏览器插件开发入门与加载使用

同学们可以私信我加入学习群&#xff01; 正文开始 前言一、插件与普通前端项目二、开发插件——manifest.json三、插件使用edge浏览器中使用/加载插件chrome浏览器中使用/加载插件 总结 前言 chrome插件的出现&#xff0c;初衷可能是为了方便用户更好地控制浏览器&#xff0c…

数据结构与算法-二分搜索树

&#x1f49d;&#x1f49d;&#x1f49d;首先&#xff0c;欢迎各位来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里不仅可以有所收获&#xff0c;同时也能感受到一份轻松欢乐的氛围&#xff0c;祝你生活愉快&#xff01; 文章目录 引言一、二分搜…

[ONVIF系列 - 01] 简介 - 设备发现 - 相关工具

1.背景知识 这个事项对我而言是个新知&#xff0c;我从&#xff1a;https://www.cnblogs.com/liwen01/p/17337916.html 跳转到了&#xff1a;ONVIF协议网络摄像机&#xff08;IPC&#xff09;客户端程序开发&#xff08;1&#xff09;&#xff1a;专栏开篇_onvif 许振坪-CSDN…

数字人直播系统搭建能力评测!3招教你快速摸清源码厂商的真实实力?

随着数字人直播的应用场景不断拓展和应用频率的持续升高&#xff0c;其所蕴含着的市场前景和收益潜力逐渐显现&#xff0c;连带着数字人直播系统搭建的热度也迎来了新的高潮。在此背景下&#xff0c;作为非科班和研发资源有限的创业者们主要的入局途径&#xff0c;各大数字人源…

Vatee万腾平台:智能管理领域的稳健前行者

在数字经济飞速发展的今天&#xff0c;企业管理模式正经历着前所未有的变革。智能化管理&#xff0c;作为这场变革的核心驱动力&#xff0c;正逐步渗透到企业的每一个角落。而在这场智能化浪潮中&#xff0c;Vatee万腾平台以其稳健的步伐和前瞻的视野&#xff0c;成为了智能管理…

【LLM大模型】一个小时内快速部署大模型

这个教程有以下几部分构成&#xff1a; 硬件配置概念介绍实操测试结果 1.硬件配置 本文使用的方法配置要求低&#xff0c;没有gpu也可以正常使用(就是有点慢)&#xff0c;不管是windows 还是linux&#xff0c;都可以无障碍使用大模型&#xff0c;有脚就行&#xff0c;废话少…

开放式耳机哪个牌子好?五款热门机型对比pk大揭秘!

作为一名耳机测评师&#xff0c;很多人想要知道如何才能选择一款合适自己的开放式耳机&#xff0c;其实我也非常的犯难&#xff0c;因为问的人实在是太多了&#xff0c;而且每个人的情况都不一样&#xff0c;所以不能说我指定的机型就一定适合你&#xff0c;所以这篇文章就是来…

【python】高数计算题难度大?python带你轻松拿下

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

ansys fluent流道分析得到的质量流率为负数

&#x1f3c6;本文收录于《CSDN问答解惑-专业版》专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收…