ChatGPT的狂飙之路

news2024/11/17 7:47:20

ChatGPT的狂飙之路

第一章:AI顶流-闪耀互联网世界的新宠

根据UBS发布的研究报告显示,ChatGPT在1月份的月活跃用户数已达1亿,成为史上用户数增长最快的消费者应用。TikTok在全球上线后花了大约9个月的时间才增加了1亿用户,而Instagram则花了两年半的时间。

[7]

---在线课程供应商Study.com向1000名18岁以上的学生发起一项调查,结果显示美国89%的学生使用ChatGPT完成作业。

---2023年2月2日,微软官方公告表示,旗下所有产品将全线整合ChatGPT,除此前宣布的搜索引擎必应、Office外,微软还将在云计算平台Azure中整合ChatGPT,Azure的OpenAI服务将允许开发者访问AI模型。

---2023年2月4日消息,以色列总统艾萨克·赫尔佐格(Isaac Herzog)发表了部分由人工智能(AI)撰写的演讲,成为首位公开使用ChatGPT的世界领导人。[11]

ChatGPT作为一款现象级自然语言处理(NLP)工具,在全球掀起了人工智能的浪潮。这款由美国OpenAI公司研发的聊天机器人程序,于2022年11月30日发布。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。

那么如此强大的模型,到底是如何诞生又一步步演变而来的呢?

[1]

第二章:GPT家族-从男孩到男人的崛起之路

到底什么是ChatGPT?

我们先来看一下ChatGPT自己的回答:

 

ChatGPT本质是一个大型语言模型(Large Language Models,LLMs),通过输入给LLM合适的数据集,设置相应task的损失函数计算模型的输出与我们期望输出之间的差距,再使用梯度下降策略对模型参数进行更新,从而让模型在测试时可以完成我们需求的任务;

ChatGPT不是一蹴而就的,初代版本是在2018年OpenAI推出的GPT1,而后经过GPT2,GPT3,InstructGPT的发展,才演化出来了今天我们看到的ChatGPT,接下来将详细介绍每个版本的GPT。

GPT1梦开始的地方:2018年OpenAI推出GPT的开山之作Improving Language Understanding by Generative Pre-Training,模型以Transformer的Decoder为基础架构进行堆叠,先在大量语料上进行预训练,再通过不同的下游任务进行微调。

[2]

与谷歌的Bert不同的是,GPT重点利用Decoder中的Masked Self-Attention,使模型只能通过上文信息来预测下文信息,而不是像Bert一样通过上下文信息来做完形填空题,这使得GPT具有更强的生成能力。

 [3], 图左:Bert,图右:GPT

GPT1一经面世就以绝对的performance吊打一众NLP模型,为后续GPT的发展奠定了基础。

[2]

GPT2大力出奇迹:由于微调阶段需要不同任务大量的数据集,造成高昂的标注成本,所以GPT2舍弃了GPT1的微调,只使用更大规模多领域的语料进行预训练,相较于GPT1的1.17亿参数量和5G的预训练数据量,GPT2模型参数增加到15亿,预训练数据量达到40G;

强大的参数规模以及数据量使得GPT2在各种Zero-shot Learning的setting上达到绝对的SOTA.

[4]

GPT3既然追求刺激,那就贯彻到底:在增大网络模型参数和数据量的趋势下,模型效果出奇的好,这使得GPT3更加关注了对“大”的执念。2020年推出的GPT3,拥有100倍于GPT2的1750亿参数,预训练数据量更是达到45TB傲视群雄;

[4]

GPT3也首次使用Prompt学习开启了NLP领域的学习新范式。

传统的Finetune学习是在预训练好的Backbone后加Linear层进行参数的微调,虽然能够取得适应各种任务的效果,但实际上破坏了Backbone内部的参数系统;

而Prompt学习则是通过调整数据输入的形式,让“任务”走向“模型”,充分挖掘了模型本身的能力;

[4]

InstructGPT开启家族新篇章:为了让GPT的回答更像人类一样,对解决任务是有帮助的(Helpful),诚实的不会误导人类(Honest),不带歧视偏见的(Harmless),更强大的InstructGPT诞生了。

InstructGPT的训练过程分为三个阶段:

[5]

  1. 第一阶段:利用人类标注的数据对GPT3进行有监督的微调:

OpenAI通过40个人的标注团队生产了一部分的提示数据(Prompt dataset),并用这部分数据对GPT3进行有监督的微调(Supervised Finetune),使得此时的模型具备一定“人类”的偏向;

  1. 第二阶段:引入RLHF思想,训练奖励模型RM

给第一阶段训练好的模型输入prompt,标注团队将模型输出的k个不同回答按人类的喜好进行排序,再通过以下损失函数训练一个新的GPT3模型作为Reward Model;

[5]

  1. 第三阶段:RM+PPO-ptx=InstructGPT

将prompt输入给第一阶段的模型,输出的回答通过二阶段的RM模型进行打分,最后通过PPO-ptx算法优化一阶段的模型,得到最终的InstructGPT;之所以要再PPO的基础上加ptx项,是为了防止模型在人工标注的数据集上过拟合,所以在其他下游任务上进行一定的微调;

[5]

InstructGPT实际上已经能进行上下文对话了,并且生成的结果也更符合人类期待的反馈,但数据量的限制导致模型的表现仍没有达到一个更类人的效果。

[5]

ChatGPT-GPT集大成者:根据OpenAI的官方说明,ChatGPT的训练方式跟InstructGPT完全一致,只不过ChatGPT在GPT3.5上进行微调(GPT3.5是OpenAI在2021年Q4训练的InstructGPT模型,在自动编写代码方面有较强的能力),另外是数据集不同,具体的标注团队规模与数据集规模目前还并未透露。

[1]

第三章:凛冬中的焰火-掀起资本炒作狂潮

AIGC:AI Generated Content,是指利用人工智能技术来生成内容,AIGC也被认为是继UGC(用户生成内容)、PGC(专家生产内容)之后的新型内容生产方式,AI绘画、AI写作等都属于AIGC的分支。

AIGC上游主要包括数据供给方、算法机构、创作者生态以及底层配合工具等,中游主要是文字、图像、音频和视频处理厂商,其中玩家众多,下游主要是各类内容创作及分发平台以及内容服务机构等。

而ChatGPT在产业链中游起着数字内容智能编辑的角色,可以通过内容设计,内容生成等方式将数字内容或者使用接口释放给下游,从而帮助企业实现盈利。

[6,7]

在ChatGPT猛烈的攻势下,其余各大厂商坐不住了。

[7]

在ChatGPT发布后,谷歌CEO在公司内部发布了“红色警报” (Code Red),敦促团队解决ChatGPT对公司搜索引擎业务构成的威胁,同时批准了在谷歌搜索引擎中加入AI聊天机器人的计划。

2月4日,谷歌注资3亿美元投资ChatGPT竞品——Anthropic,谷歌将获得约10%的股份, Anthropic计划将次轮资金用于购买谷歌云计算部门的计算资源;Anthropic开发了一款名为Claude的智能聊天机器人,据称可与ChatGPT相媲美(仍未发布)。

Anthropic和Open AI渊源颇深,其联合创始人曾担任OpenAI 研究副总裁

 [7,8],图左:Anthropic,图右:聊天机器人Claude

资本的嗅觉永远是最灵敏的,利用 ChatGPT 写稿和发稿的 Buzzfeed,股价在两个交易日内涨超三倍。与此同时,大洋彼岸的东方A股也迎来了ChatGPT情绪炒作的高潮,继2022年底的消费龙头西安饮食以及数字经济龙头恒久科技之后,汉王科技以ChatGPT龙头的身份强势7连板,股价在一周内实现翻倍,占据了A股市场为数不多的短线资金。火热的题材炒作甚至已经从ChatGPT概念炒作到了上游CPO(Co-packagedoptics)算力题材,以及反ChatGPT的数字水印(用于确保数字内容质量和真实性的一种技术)题材;典型代表二波ChatGPT龙头鸿博股份也以5连板的姿态引领市场的资金,强势席卷特斯拉、固态电池、光伏等一众概念;

[9]

第四章:关于ChatGPT+的展望

ChatGPT仍属于GPT3.5系列的作品,未来OpenAI还回推出更为强大的GPT4,据传说GPT4是一个超大规模的跨模态生成模型,虽然OpenAI 尚未发布关于该模型的官方信息,但我们可以预先展望一下:

更大规模的语料训练:既然大模型+大数据的技术路线已被证实有效,那GPT4很有可能继续增加语料训练的规模,GPT4的数据集要比以往GPT大至少一个数量级,也就是说它可能在10万亿个token的数据集上进行训练[10]

更为准确的内容输出:ChatGPT输出的内容仍存在不真实、虚假的缺点现象,GPT4有可能通过更为先进的算法更大规模的模型参数,对输出内容进行进一步的矫正;

强大的跨模态生成能力:目前的ChatGPT仅局限于文本的生成,未来的GPT4有可能整合了文本生成图像、文本生成视频、视频文案生成,文本指导视频编辑,视频续写等一系列功能;

ChatGPT的热度不会戛然而止,但到底是情绪炒作还是基本面的改善,还有待时间的验证;

ChatGPT到底是真的颠覆了以往模型对语言内容理解,还是仅仅因为超大数据+超大模型的加持下,产生了一个特大号版本的“聊天机器”,也仍需要更多的评价标准来验证;

但无论ChatGPT能做到什么程度,在数字经济为大发展方向的今天,在人工智能逐渐能取代低价值劳动力的今天,我们应该成为什么角色,才能不被时代的浪潮抛弃,是面对现在的ChatGPT以及未来更多的‘ChatGPT’最值得思考的问题;

参考文献:

1. https://openai.com/blog/chatgpt/

2. https://www.cs.ubc.ca/~amuham01/LING530/papers/radford2018improving.pdf

3. https://www.bilibili.com/video/BV1Wv411h7kN/?spm_id_from=333.337.search-card.all.click

4. https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf

5. https://arxiv.org/pdf/2203.02155.pdf

6. http://www.caict.ac.cn/

7. https://www.gtja.com/content/business/research/profile.html

8. https://finance.sina.com.cn/

9. https://xueqiu.com/

10. https://www.163.com/dy/article/HQBAUOM3051193U6.html

11. https://baike.baidu.com/item/ChatGPT/62446358?fr=aladdin

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1113412.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

冰箱监控温度需要安装温度采集器需要什么条件

冰箱监控温度需要安装一个温度采集器在冰箱内部,以实时监测冰箱的温度。采集器可以是数字温度传感器、热敏电阻或其他类型的温度传感器。 当然也需要安装信号中继器也就是我们的智能网关,用于接收和记录温度采集器的数据。这一套系统就是温度监控系统&am…

【毕设必备】手把手带你用Python搭建一个简单的后端服务- API的创建,前后端交互的数据传递,GET,POST,JSON,FLASK

目录 Python 介绍Python的特性Python的使用场景python基本语法 FlaskViewModelControlhtmlsimple api连接数据库 跨域 Mojo比python快68000倍相关链接 Python 介绍 Python是一种流行的高级编程语言,具有易于学习和使用的特性,被广泛应用于各种领域。 P…

移动硬盘被格式化了如何恢复数据?四步教你如何恢复

在日常生活中,我们常常会使用各种存储设备来保存和备份我们的重要数据。移动硬盘作为一种便携式的存储设备,被广泛应用于数据的存储和传输。然而,有时候我们会不小心将移动硬盘格式化,从而丢失了里面的数据。本文将介绍移动硬盘格…

如何通过沉浸式投影技术提升文旅夜游的互动体验?

伴随着国民经济的提升,文旅夜游市场也开始通过各类创新设计形式,来吸引更多的游客前来打卡游玩,使其逐渐成为了当下热度较高的一种游玩模式,其中在收集各类用户的体验反馈时,沉浸式投影依靠新颖的视觉体验以及沉浸式观…

安装Apache2.4

二、安装配置Apache: 中文官网:Apache 中文网 官网 (p2hp.com) 我下的是图中那个版本,最新的64位 下载下后解压缩。如解压到D:\Program Files\Apache\Apache24 PS:特别要注意使用的场景和64位还是32位版本 2、修改Apcahe配置文…

2023.10.18

头文件 #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QDebug>QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEclass Widget : public QWidget {Q_OBJECTpublic:Widget(QWidget *parent nullptr);~Widget();private slot…

电商数据采集的10个经典方法

电商数据采集的网页抓取数据、淘宝、天猫、京东等平台的电商数据抓取&#xff0c;网页爬虫、采集网站数据、网页数据采集软件、python爬虫、HTM网页提取、APP数据抓包、APP数据采集、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中的热门技术关键词。那么电…

什么是零拷贝

普通拷贝流程 在实际应用中&#xff0c;如果我们需要把磁盘中的某个文件内容发送到远程服务器上&#xff0c;那么它必须要经过几个拷贝的过程&#xff0c;。从磁盘中读取目标文件内容拷贝到内核缓冲区&#xff0c;CPU 控制器再把内核缓冲区的数据赋值到用户空间的缓冲区中&…

全志R128外设模块配置——ADC按键配置方法

ADC 按键配置方法 FreeRTOS平台上使用的按键为ADC-KEY&#xff0c;采用的ADC模块为GPADC。 按键功能驱动的实现是通过ADC分压&#xff0c;使每个按键检测的电压值不同&#xff0c;从而实现区分不同的按键。按下或者弹起中断之后&#xff0c;通过中断触发&#xff0c;主动检测…

电子技术基础之一(电容和电感)

Electronic Techonolgy 1、电容和电感1.1、电容(Capacitor)1.1.1、滤波功能1.1.2、储能功能 1.2、电感(Inductor)1.2.1、楞次定律1.2.2、储能作用 1、电容和电感 先讲一个概念&#xff0c;电流分为直流电和交流电&#xff0c;其中直流电再分为稳定直流电和脉动直流电。 直流电…

如何使用VSCode将iPad Pro转化为功能强大的开发工具?

文章目录 前言1. 本地环境配置2. 内网穿透2.1 安装cpolar内网穿透(支持一键自动安装脚本)2.2 创建HTTP隧道 3. 测试远程访问4. 配置固定二级子域名4.1 保留二级子域名4.2 配置二级子域名 5. 测试使用固定二级子域名远程访问6. iPad通过软件远程vscode6.1 创建TCP隧道 7. ipad远…

SpringBoot (3) Profiles,外部化配置,自定义starter

目录 1 Profiles 1.1 "组件"环境隔离 1.1.1 标识环境 1.1.2 激活环境 1.2 "配置"环境隔离 1.2.1 添加"副配置文件" 1.2.2 激活环境 2 外部化配置 2.1 配置优先级 2.2 快速部署 3 自定义starter 3.1 基本抽取 3.1.1 导yaml提示包 3…

mac录屏怎么录?看这里,告别繁琐操作!

屏幕录制是mac用户在日常生活中经常需要使用到的功能&#xff0c;无论是记录游戏精彩瞬间、分享在线会议、制作教学视频还是保存重要资料&#xff0c;屏幕录制都可以帮助我们更便捷地实现这些需求。但是很多用户并不知道mac录屏怎么录。在本文中&#xff0c;我们将介绍两种mac录…

TT119电源芯片用什么代替?

根据你提供的信息&#xff0c;Tt119电源芯片的替代选项可以是AH8652芯片。 AH8652芯片采用了SOT23-3封装&#xff0c;与Tt119芯片相同。同时&#xff0c;你提到外围元件也是一模一样的&#xff0c;因此不需要进行任何更改。 AH8652芯片的输入电压范围为45V至265V&#xff0c;…

用好快捷键事半功倍!如何在Excel中快速取消隐藏的行

工作时,我们需要经常取消隐藏Excel中的行。要知道行是否被隐藏,请仔细检查行号。如果缺少某些数字,则意味着行被隐藏。这样做很容易,而且您可以用不同的快捷方式取消隐藏Excel中的行。 在本文中,我将讨论如何在各种情况下取消隐藏Excel中的行的两种快捷方式。这些快捷方式…

【JavaEE】Java的多线程编程基础知识 -- 多线程篇(2)

Java多线程编程基础知识 一、多线程的创建二、Thread类常用的方法和API2.1 Thread 的几个常见的属性2.2 start 启动一个线程2.3 终止一个线程2.4 等待一个线程-join()2.5 线程休眠函数 -sleep() 三、线程状态3.1 观察所有线程的状态3.2 线程状态和线程转移的意义 四、线程安全&…

pytorch 训练可视化

pytorch 训练可视化 1.from torch.utils.tensorboard 1.from torch.utils.tensorboard from torch.utils.tensorboard import SummaryWriter在最新版本的pytorch中官方提供了tensorboard的api。以下是官方教程的链接 https://pytorch.org/tutorials/intermediate/tensorboard…

docker企业单位私有镜像仓库 Harbor 搭建

docker私有镜像仓库 Harbor 搭建 背景说明使用环境安装部署docker安装docker-compose安装 安装 HarborHarbor UI管理docker 登录docker推送镜像和拉取镜像docker推送镜像docker 拉取镜像 背景说明 为了方便管理docker容器镜像&#xff0c;通常使用各大云平台提供的镜像服务&am…

内裤洗衣机到底值不值得买?内衣洗衣机便宜好用的牌子

有很多姐妹上班累爆了&#xff0c;回家洗澡换下的衣物还要区分开来&#xff0c;将内衣裤用来自己手洗&#xff0c;还要专门使用杀菌洗衣液才能安心&#xff0c;而且随着科技的进步&#xff0c;现在市面上拥有了一款专门为女生设计的内衣洗衣机&#xff0c;可以解决日常手洗内衣…

英语 chatGPT分析句子与验证正确性 翻译

有时候我想说的时候&#xff0c;又不确定说的对不对。chatGPT知道。 “as well as” 和 “as good as” 都是英语中常见的短语&#xff0c;但它们有不同的用法和含义。 “As Well As”&#xff08;以及&#xff09;: “As well as” 是一个连接词短语&#xff0c;用来连接两…