你知道ChatGPT里面的G、P、T分别代表什么吗?

news2024/11/23 7:35:35

生成式AI, 在学习归纳数据分布的基础上,创造数据中不存在的新内容。可以生成文本、图片、代码、语音合成、视频和3D模型。

比尔盖茨:ChatGPT是1980年以来最具革命性的科技进步。

身处这个AI变革的时代,唯有躬身入局,脚步跟上。

1、ChatGPT里的GPT,分别代表什么?

GPT,Generative Pre-trained Transformer,生成式预训练变换模型。

什么意思?

Generative,生成式,是指它能自发的生成内容。

Pre-trained,预训练,是不需要你拿到它再训练,它直接给你做好了一个通用的语言模型。

Transformer,变换模型,谷歌提出来的一个很厉害的模型,他可以帮助更好的去处理NLP相关的问题,是非常棒的神经网络结构。
在这里插入图片描述

2、Transformer虽是由谷歌提出的。但是应用最成功的是OpenAI的ChatGPT

因为ChatGPT是站在巨人的肩上走出来的。

ChatGPT是全人类社会的结晶,没有前人的铺垫,ChatGPT不会这么顺利走出来。

后面也会有更多的非常厉害的应用,会基于ChatGPT走出来。

3、Transformer中有一个很重要的概念,注意力机制

什么是注意力机制呢?

就是从你输入的信息中,挑出重要的信息,把注意力集中在这些重要的信息上,忽略不重要的信息。这样就能更好的理解你说的话。

注意力机制能帮助Transformer模型集中注意力在输入信息中最重要的部分。

4、机器学习方式,分为监督学习、无监督学习、强化学习

在这里插入图片描述
监督学习:有标签数据,可以直接反馈,可以预测结果和未来

无监督学习:没有标签和目标,没有反馈,而是它自己去寻找数据中的隐藏结果

强化学习:是一个决策过程,有一系列的奖励机制和惩罚机制,让机器学习如何做到更好

ChatGPT用到的是无监督学习和强化学习。

5、ChatGPT能进行大量的内容生成和创造,其实是靠的猜概率

比如,天气灰蒙蒙的,我的心情很___

经过大量数据训练过的AI,会预测这个空格出现的最高概率的词是「沮丧」。

那么「沮丧」就会被填到这个空格中,所以产生了答案:

天气灰蒙蒙的,我的心情很沮丧

这感觉很不可思议,但事实就是这样。

现阶段所有的NLP(自然语言处理)任务,都不是机器真正理解人类的世界。

他只是在玩文字游戏,进行一次又一次的概率解谜。

6、在这个”猜概率“的文字游戏中,大预言模型(LLM,Large Language Model)演进出了最主流的两个方向:BERT和GPT

BERT是之前最流行的方向,几乎统治了所有NLP领域。

并在自然语言理解类任务中发挥出色(例如文本分类,情感倾向判断等)。

而GPT方向则较为薄弱,最知名的玩家就是OpenAl了。

事实上在GPT3.0发布前,GPT方向一直是弱于BERT的(GPT3.0是ChatGPT背后模型GPT3.5的前身)。

7、BERT和GPT区别是?

BERT,是双向语言模型,联系前后猜中间的字,所以是双向,就像完型填空。

比如:我___20号回家

BERT猜的是「我打算20号回家」,猜的是中间的「打算」。

GPT,是单向语言模型,猜下一个字,所以是单向,像写作文。

比如:我打算20号___

GPT猜的是「我打算20号回家」,猜的是后面「回家」两个字。

8、怎么给GPT提问?

有两种方式:fine-tune和prompt。

fine-tune,调参:需要对模型参数进行更新,来完成生成内容。

fine-tune 专业,门槛高,受众小。但是多样性、准确度高,适合复杂任务。少数玩家的游戏。

prompt,提示词:不需要修改模型和参数,只需要给一些提示和样例,就能完成任务。

prompt更简单,门槛低,受众大。适合处理简单的任务。所有玩家都。

我们在ChatGPT输入框中输入的内容,就是prompt。

9、ChatGPT是生成式AI

在这里插入图片描述
AI从内容产出方式上,分为两种:分析式AI和生成式AI。

分析式AI,主要用于分析,归类。你喂给它多少数据,它就能分析出什么样的内容,它局限于数据本身。

生成式AI, 在学习归纳数据分布的基础上,创造数据中不存在的新内容。可以生成文本、图片、代码、语音合成、视频和3D模型。

ChatGPT是生成式AI,最擅长文本和写代码。

10、最后,从知识获取的角度说,ChatGPT是全新一代的 “知识表示和调用方式”

早期,知识以结构化的方式存储在数据库中。我们通过 SQL获取。

后来,随着互联网的诞生,更多文本、图片、视频等非结构化知识存储在互联网中。我们通过搜索引擎获取。

现在,知识以参数的形式存储在大模型中。我们用自然语言直接调用这些知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/490482.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vcs -libmap

1 libmap的作用 主要两个作用: 解决module名重复问题: 比如有两个IP, IP0和IP1, 它们都例化了一个叫ADD的module, 而且它们的filelist中都包含add.v. 这时会引起编译错误, 这时可以: (1) 指定IP0中的add.v编译到库lib0中, IP1中的add.v编译到库lib1中, (2) 指定IP0中的ADD使用…

超细Redis(二)

五大数据类型 官方文档: 翻译: Redis 是一个开源(BSD 许可)内存数据结构存储系统,用作数据库、缓存、消息代理和流引擎。Redis 提供数据结构,例如字符串、哈希、列表、集、带有范围查询的排序集、位图、超…

MySQL: 运算符使用练习

前言: 练习运算符的使用,加强记忆。 案例目的: 在已建数据库中创建数据表,并对表中数据进行处理,练习运算符(包括数据运算符、逻辑运算符、位运算符)的使用。 操作过程: 创建名…

java基础入门-03-【字符串】

Java基础入门-03-【字符串】 10、字符串10.1.API10.1.1API概述10.1.2如何使用API帮助文档 10.2.String类10.2.1 String类概述10.2.2 String类的特点10.2.3 String类的构造方法10.2.4 创建字符串对象两种方式的区别10.2.5 字符串的比较10.2.5.1 号的作用10.2.5.2 equals方法的作…

清华发布首个最全大模型安全评测系统,ChatGPT登榜首!

夕小瑶科技说 原创作者 | 天于刀刀 Python当前大型语言模型的火爆程度我们不用再进行赘述了,伴随着百度文心一言打响国内商业大模型第一枪,华为盘古,阿里通义千问,智谱ChatGLM,科大讯飞星火等国内公司纷纷开始布局。 另一方面由于…

01-Flink Metrics简介

Flink Metrics简介 Flink Metrics是Flink集群运行中的各项指标,包含机器系统指标,比如:CPU、内存、线程、JVM、网络、IO、GC以及任务运行组件(JM、TM、slot、作业、算子)等相关指标。 Flink Metrics包含两大作用&…

阿里云服务器购买教程(新手入门指南)

阿里云服务器ECS选购指南,阿里云百科分享2023阿里云服务器新手选择流程,选购云服务器有两个入口,一个是选择活动机,只需要选择云服务器地域、系统、带宽即可;另一个是在云服务器页面,自定义选择云服务器配置…

探究C语言数组的奥秘:大小可省略的定义、内存存储、数组名、传参、指针遍历、数组指针和指针数组、柔性数组等

也许你认为,C语言中的数组非常好理解,就是把一组相同类型的元素存储在同一块空间里。但是你可能并没有真正理解数组的本质,不信的话请回答一下下面的几个小问题,如果你能非常清晰的回答这些问题,那么你对C语言中的数组…

【Git】制造冲突以及解决冲突的详细方法

介绍 这里是小编成长之路的历程,也是小编的学习之路。希望和各位大佬们一起成长! 以下为小编最喜欢的两句话: 要有最朴素的生活和最遥远的梦想,即使明天天寒地冻,山高水远,路远马亡。 一个人为什么要努力&a…

CentOS安装Redis数据库流程by阿里云服务器

使用阿里云服务器ECS安装Redis数据库流程,操作系统为CentOS 7.6镜像,在CentOS上安装Redis 4.0.14,云服务器选择的是持久内存型re6p实例,新手站长分享阿里云CentOS服务器安装Redis流程方法: 目录 在CentOS系统中部署R…

2023-05-04 线性DP_力扣练习

线性DP的力扣题目练习 这一章将会介绍线性动态规划的相关概念和经典问题,并给出一些练习题供大家演练。 用动态规划解决问题的过程有以下几个关键点:状态定义,状态的转移,初始化和边界条件。 状态定义 就是定义子问题&#xff…

【IM苹果推iMessage】苹果真机推送自动分配任务,自动分配任务,让您瞄准中高端客户

推荐内容IMESSGAE相关 作者✈️IMEAE推荐内容iMessage苹果推软件 *** 点击即可查看作者要求内容信息作者✈️IMEAE推荐内容1.家庭推内容 *** 点击即可查看作者要求内容信息作者✈️IMEAE推荐内容2.相册推 *** 点击即可查看作者要求内容信息作者✈️IMEAE推荐内容3.日历推 *** …

代码命名规范的套路是真优雅呀,命名如歌,代码如诗

日常编码中,代码的命名是个大的学问。能快速的看懂开源软件的代码结构和意图,也是一项必备的能力。那它们有什么规律呢? Java项目的代码结构,能够体现它的设计理念。Java采用长命名的方式来规范类的命名,能够自己表达…

ansible常用命令

目录 1、列出默认清单文件中的所有受管主机 2. 列出自定义清单文件中的所有受管主机(自定义清单文件:inventory) 3、运行playbook 4、创建需要输入文件密码的加密的文件 5、创建用密码文件的加密的文件 6、查看加密的文件内容 7、向已有…

学会使用Git,看这一篇文章就够了

文章目录 一、背景二、Git的安装2.1 Windows下安装Git:下载安装包安装Git配置Git 2.2 Linux下安装Git:更新系统安装Git配置Git 三、Git 基本使用3.1 初始化 Git 仓库3.2添加文件3.3 提交代码3.4 查看历史记录3.5创建分支3.6 修改文件3.7 查看文件状态3.8…

【实用工具】JSR-269 插入式注解处理器AbstractProcessor

JSR-269原理浅析 初次使用lombok时,都需要在idea安装lombok插件,这让我们怀疑lombok的实现是通过提供自己的编译器实现的,然而实际情况并非如此,在脱离idea使用javac编译时,只要类路径有lombok的jar包,项目…

Android-源码分析-分析手机热点里的AP Band(频段)被隐藏/置灰的原因?

本博文记录寻找手机热点中AP Band(频段)被隐藏/置灰的原因,相似问题同理去查找解决。 先放上一张MTK平台手机-热点-AP Band界面效果图: 很明显,界面中的AP Band选项变灰,无法点击编辑修改内容,如果是AP Band 被隐藏或…

C#,生信软件实践(01)——DNA序列数据库FASTA文件合并工具的源代码

1 生物信息学简介 生物信息学(BioInformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合…

JavaWeb ( 四 ) JavaEE

2.JavaEE 2.1.Java版本 J2SE : 适用于桌面系统的Java 2平台标准版(Java 2 Platform Standard Edition,J2SE) J2EE : 适用于创建服务器应用程序和服务的Java 2平台企业版(Java 2 Platform Enterprise Edition,J2EE&a…

学企业管理

工业社会的代表产品是交通运输设备,如火车/高铁、汽车、飞机/火箭、船舶/航母,其核心是发动机。信息社会的代表产品是计算设备,如大型机小型机、工作站/PC台式机电脑/PC笔记本电脑/PC平板电脑、智能手机。 汽车这个产品,既属于高精…