4个维度讲透ChatGPT技术原理,揭开ChatGPT神秘技术黑盒!(文末送书)

news2025/1/14 18:29:05

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

前言

一、Tansformer架构模型

二、ChatGPT原理

三、提示学习与大模型能力的涌现 

3.1 提示学习

3.2 上下文学习

3.3 思维链

四、行业参考建议 

4.1 拥抱变化

4.2  定位清晰

4.3  合规可控

4.4  经验沉淀

五、文末推荐与福利


前言

       在2022年11月30日,ChatGPT模型问世后,立即在全球范围内掀起了轩然大波。AI领域的专业人士和普通人都在讨论ChatGPT引人注目的交互体验和惊人的生成内容,重新认识到人工智能的巨大潜力和价值。对于AI从业者而言,ChatGPT模型开拓了新的思路,不再把大型模型看作仅仅是玩弄性能的工具,而是更加关注高质量数据的重要性,坚信“多少数据就有多少智能”。

        ChatGPT模型的出色表现使得许多人在许多任务上转向研究大型模型,即使是零样本或少样本数据,也能达到最先进的效果。

        不仅Google提出了与ChatGPT类似的Bard模型,国内也涌现出了许多中文大型模型,例如百度的“文心一言”、阿里的“通义千问”、商汤的“日日新”、知乎的“知海图AI”、清华智谱的“ChatGLM”、复旦的“MOSS”、Meta的“Llama1&Llama2”等等。

        Alpaca模型的问世证明,尽管它的参数规模达不到ChatGPT的水平,但它显著降低了大型模型的计算成本,使得普通用户和一般企业也能够利用大型模型。此前一直强调的数据问题现在可以通过GPT-3.5或GPT-4接口来获取数据,而且数据质量相当高。如果只需要基本的模型效果,那么是否再次对数据进行精细标注已经不那么重要了(当然,要获得更好的效果,仍然需要更精确的数据)。

一、Tansformer架构模型

        预训练语言模型的本质是通过从海量数据中学到语言的通用表达,使得在下游子任务中可以获得更优异的结果。随着模型参数不断增加,很多预训练语言模型又被称为大型语言模型(Large Language Model,LLM)。不同人对于“大”的定义不同,很难说多少参数量的模型是大型语言模型,通常并不强行区分预训练语言模型和大型语言模型之间的差别。

        预训练语言模型根据底层模型网络结构,一般分为仅Encoder架构模型、仅Decoder架构模型和Encoder-Decoder架构模型。其中,仅Encoder架构模型包括但不限于BERT、RoBerta、Ernie、SpanBert、AlBert等;仅Decoder架构模型包括但不限于GPT、CPM、PaLM、OPT、Bloom、Llama等;Encoder-Decoder架构模型包括但不限于Mass、Bart、T5等。

二、ChatGPT原理

        ChatGPT训练的整体流程主要分为3个阶段,预训练与提示学习阶段,结果评价与奖励建模阶段以及强化学习自我进化阶段;3个阶段分工明确,实现了模型从模仿期、管教期、自主期的阶段转变。

        在模型的第一阶段,也就是模仿期,主要注重于学习各种指令性任务。在这个阶段,模型并没有自我判断或意识,而更多地是在模仿人类行为的过程中学习。它通过不断地学习人类标注的结果,使自己的行为具有一定程度的智能。然而,仅仅进行模仿往往会导致机器学习变得呆板和机械。

        在第二阶段,也就是管教期,优化的重点发生了转变。这个阶段的关注点不再是教导机器如何回答问题,而是教导机器如何判断回答的质量。在第一阶段,我们希望机器可以使用输入X来模仿学习输出Y',并努力使Y'与原始标注的Y相一致。但在第二阶段,我们希望多个模型在对输入X产生多个可能的答案(Y1、Y2、Y3、Y4等)时,能够自行评估这些答案的优劣情况。

        一旦模型具备了一定的判断能力,我们认为它已经完成了第二阶段的学习,可以进入第三阶段,也就是自主期。在自主期,模型需要通过互相交流的方式来自我进化。这意味着它不仅会生成多个可能的输出结果,还会评估这些结果的质量,并基于不同输出的效果来调整模型参数,从而实现自我强化学习的过程。

        综上所述,可以将ChatGPT的这三个阶段类比为人类成长的三个阶段:模仿期的目标是获得基本知识,管教期的目标是培养判断能力,自主期的目标是不断完善自己,逐渐掌握万事万物。

三、提示学习与大模型能力的涌现 

        ChatGPT模型发布后,因其流畅的对话表达、极强的上下文存储、丰富的知识创作及其全面解决问题的能力而风靡全球,刷新了大众对人工智能的认知。提示学习(Prompt Learning)、上下文学习(In-Context Learning)、思维链(Chain of Thought,CoT)等概念也随之进入大众视野。市面上甚至出现了提示工程师这个职业,专门为指定任务编写提示模板。

        提示学习被广大学者认为是自然语言处理在特征工程、深度学习、预训练+微调之后的第四范式。随着语言模型的参数不断增加,模型也涌现了上下文学习、思维链等能力,在不训练语言模型参数的前提下,仅通过几个演示示例就可以在很多自然语言处理任务上取得较好的成绩。

3.1 提示学习

        提示学习是在原始输入文本上附加额外的提示(Prompt)信息作为新的输入,将下游的预测任务转化为语言模型任务,并将语言模型的预测结果转化为原本下游任务的预测结果。

        以情感分析任务为例,原始任务是根据给定输入文本“我爱中国”,判断该段文本的情感极性。提示学习则是在原始输入文本“我爱中国”上增加额外的提示模板,例如:“这句话的情感为{mask}。”得到新的输入文本“我爱中国。这句话的情感为{mask}。”然后利用语言模型的掩码语言模型任务,针对{mask}标记进行预测,再将其预测出的Token映射到情感极性标签上,最终实现情感极性预测。

3.2 上下文学习

        上下文学习可以看作提示学习的一种特殊情况,即演示示例看作提示学习中人工编写提示模板(离散型提示模板)的一部分,并且不进行模型参数的更新。

        上下文学习的核心思想是通过类比来学习。对于一个情感分类任务来说,首先从已存在的情感分析样本库中抽取出部分演示示例,包含一些正向或负向的情感文本及对应标签;然后将其演示示例与待分析的情感文本进行拼接,送入到大型语言模型中;最终通过对演示示例的学习类比得出文本的情感极性。

         这种学习方法也更加贴近人类学习后进行决策过程,通过观察别人对某些事件的处理方法,当自己遇到相同或类似事件时,可以轻松地并很好地解决。

3.3 思维链

        大型语言模型横行的时代,它彻底改变了自然语言处理的模式。随着模型参数的增加,例如:情感分析、主题分类等系统-1任务(人类可以快速直观地完成的任务),即使是在少样本和零样本条件下均可以获得较好的效果。但对于系统-2任务(人类需要缓慢而深思熟虑的思考才能完成的任务),例如:逻辑推理、数学推理和常识推理等任务,即使模型参数增加到数千亿时,效果也并不理想,也就是简单地增加模型参数量并不能带来实质性的性能提升。

        Google于2022年提出了思维链(Chain of thought,CoT)的概念,来提高大型语言模型执行各种推理任务的能力。思维链本质上是一种离散式提示模板,主旨是通过提示模板使得大型语言模型可以模仿人类思考的过程,给出逐步的推理依据,来推导出最终的答案,而每一步的推理依据组成的句子集合就是思维链的内容。

        思维链其实是帮助大型语言模型将一个多步问题分解为多个可以被单独解答的中间步骤,而不是在一次向前传递中解决整个多跳问题。

四、行业参考建议 

4.1 拥抱变化

        与其他领域不同,AIGC领域是当前变化最迅速的领域之一。以2023年3月13日至2023年3月19日这一周为例,我们经历了清华发布ChatGLM 6B开源模型、openAI将GPT4接口发布、百度文心一言举办发布会、微软推出Office同ChatGPT相结合的全新产品Copilot等一系列重大事件。

        这些事件都会影响行业研究方向,并引发更多思考,例如,下一步技术路线是基于开源模型,还是从头预训练新模型,参数量应该设计多少?Copilot已经做好,办公插件AIGC的应用开发者如何应对?

        即便如此,仍建议从业者拥抱变化,快速调整策略,借助前沿资源,以加速实现自身任务。

4.2  定位清晰

        一定要明确自身细分赛道的目标,例如是做应用层还是底座优化层,是做C端市场还是B端市场,是做行业垂类应用还是通用工具软件。千万不要好高骛远,把握住风口,“切准蛋糕”。定位清晰并不是指不撞南墙不回,更多的是明白自身目的及意义所在。

4.3  合规可控

        AIGC最大的问题在于输出的不可控性,如果无法解决这个问题,它的发展将面临很大的瓶颈,无法在B端和C端市场广泛使用。在产品设计过程中,需要关注如何融合规则引擎、强化奖惩机制以及适当的人工介入。从业者应重点关注AIGC生成内容所涉及的版权、道德和法律风险。

4.4  经验沉淀

        经验沉淀的目的是为了建立自身的壁垒。不要将所有的希望寄托于单个模型上,例如我们曾经将产品设计成纯文本格式,以便同ChatGPT无缝结合,但最新的GPT4已经支持多模态输入。我们不应气馁,而是要快速拥抱变化,并利用之前积累的经验(数据维度、Prompt维度、交互设计维度)快速完成产品升级,以更好地应对全新的场景和交互形态。

        虽然AIGC的浪潮下存在不少泡沫,但只要我们怀揣着拥抱变化的决心,始终明确我们要到达的远方,认真面对周围的风险危机,不断在实战中锻炼自身的能力,相信终有一天,会到达我们心中所向往的目的地。

五、文末推荐与福利

《ChatGPT原理与实战:大型语言模型的算法技术和私有化》免费包邮送出3本!

内容简介:

       这是一本系统梳理并深入解析ChatGPT核心技术、算法实现、工作原理、训练方法的著作,也是一本能指导你搭建专属ChatGPT和实现大模型迁移及私有化的著作。本书得到了MOSS系统负责人邱锡鹏等多位专家的高度评价和鼎力推荐。
具体地,通过本书你能了解或掌握以下知识:

  • ChatGPT的工作流程和技术栈
  • ChatGPT的工作原理和算法实现
  • 基于Transformer架构的一系列预训练语言模型的原理
  • 强化学习的基础知识
  • 提示学习与大模型涌现出的上下文学习、思维链
  • 大模型的训练方法及常见的分布式训练框架
  • 抽奖方式:评论区随机抽取3位小伙伴免费送出!
  • 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!
  • 活动截止时间:2023-09-13 20:00:00
  • 购买链接:http://product.dangdang.com/29615266.html

 名单公布时间:2023-09-13 21:00:00   

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/998634.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

要闻 |上海市测绘院一行领导莅临大势智慧考察交流

9月8日,上海市测绘院首席专家、博士后科研工作站站长顾建祥等一行莅临武汉大势智慧科技有限公司(后简称“大势智慧”)考察工作。大势智慧CEO黄先锋博士、CTO张帆博士等人陪同调研,并就新型基础测绘与实景三维上海建设展开座谈。 上…

京东API接口(商品详情页采集+关键词搜索商品列表):开启电商业务的新篇章

随着电子商务的飞速发展,京东作为国内领先的电商平台,提供了丰富的API接口,帮助开发者轻松集成电商功能,扩展业务范围。本文将介绍京东API接口的作用和价值,探讨适用场景,操作步骤,优势分析及应…

基于Linux的智能家居(工厂模式)

目录 1.项目概述 2.程序框架 3.函数准备 3.1需要函数知识点 3.2编码提醒 4.代码 5.注意事项 1.项目概述 控制端有两个,语音串口UART和Tcp通讯。 执行端有IO输出和IO输入。 2.程序框架 程序分为3部分-------------1.输入控制 2.输出设备 3.主函数-多线程…

【文末送书】Matlab科学计算

欢迎关注博主 Mindtechnist 或加入【智能科技社区】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和技术。关…

《Python入门到精通》time模块详解,Python time标准库,time库函数大全

「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:小白零基础《Python入门到精通》 time模块详解 1、获取操作time.time() 获取时间戳(float)time.time_ns() 获取时间戳(int)time.thread_time()…

03JVM_类加载

一、类加载与字节码技术 1.类文件结构 2.字节码指令 3.编译期处理 4.类加载阶段 5.类加载器 6.运行期优化 1.类文件结构 类文件结构 1.1 魔数magic 介绍 每个java class文件的前4个字节是魔数:0x CAFEBABE。魔数作用在于分辨出java class文件和非java clas…

开学了,运营校园跑腿怎么样?

校园跑腿项目是当今市场上备受关注和追捧的一种新兴服务业。随着人们生活节奏的加快和需求多样化,校园跑腿项目在满足大众日常生活需求的同时也为创业者提供了巨大的商机。下面将从市场需求、竞争环境和发展前景三个方面,对校园跑腿项目的现状进行分析&a…

Unity实现2D游戏跟随摄像机(平滑移动)

文章目录 玩家角色脚本字段跟随逻辑 完整代码其他相关文章连接 玩家角色 首先创建一个可用的玩家角色,写好移动逻辑,如果要使用在Unity商店中购买的资源,可以点击Window菜单栏> Package Manager选项,来打开Package Manager窗口…

OSCP系列靶场-Esay-SunsetDecoy保姆级

OSCP系列靶场-Esay-SunsetDecoy保姆级 目录 OSCP系列靶场-Esay-SunsetDecoy保姆级总结准备工作信息收集-端口扫描目标开放端口收集目标端口对应服务探测 信息收集-端口测试22-SSH端口的信息收集22-SSH端口版本信息与MSF利用22-SSH协议支持的登录方式22-SSH手动登录尝试(无)22-S…

离子风蛇是什么?

离子风蛇是一种坐立式静电消除器,可手动将蛇管变形使风蛇指向目标方向,让离子气流直流吹向目标表面,方便移动,适用于工厂车间、电子行业、半导体行业、薄膜、卷料、分切等行业。可安放于各种工作区域,除静电除尘效果好…

【大虾送书第九期】速学Linux:系统应用从入门到精通

目录 🍭写在前面 🍭为什么学习Linux系统 🍭Linux系统的应用领域 🍬1.Linux在服务器的应用 🍬2.嵌入式Linux的应用 🍬3.桌面Linux的应用 🍭Linux的版本选择 &a…

你不能不了解的Java23中设计模式之【抽象工厂模式】

目录 一.介绍抽象工厂模式 1.概念 2.结构: 抽象工厂模式包含以下角色: 3.工作原理: 4.应用场景: 抽象工厂模式适用于以下情况: 5.使用方法: 二.具体实例通过抽象工厂模式实现计算器 1.创建Maven工程…

【C++--类和对象】构造函数析构函数

先来介绍一下类和对象中的六个默认成员函数:构造函数,析构函数,拷贝构造,赋值重载,普通对象取地址重载,const修饰对象取地址重载 这六类函数都是在我们没有显示定义的时候,编译器会自己生成的函…

有什么好用的电容笔?apple pencil替代品推荐

近年来,电容笔越来越成为人们日常生活中常见的数码产品之一。电容笔的便捷性得到了消费者的认可。它逐渐取代无纸化书写。那么到底电容笔哪个品牌好呢,电容笔哪一款最好用呢,今天小编给大家总结几款市面好用的电容笔,让我们一起来…

什么是SPA单页面,优缺点是什么?如何实现?

目录 一、SPA的优点 二、SPA的缺点 三、SPA和MPA的区别 四、如何实现SPA应用 单页面应用程序(SPA)是一种基于Web的软件架构,其中只有一个页面,通过不同的路由和组件来展示不同的内容。SPA的应用非常广泛,例如在网页…

PCB layout在布线上的设计规范有哪些?

PCB Layout是一项技术活,也是经验活,良好的PCB Layout布线可帮助工程师确保最终的电路板性能、可靠性和制造质量,因此是很多电子工程师的学习重点,下面我们来盘点下PCB Layout关于布线的规范有哪些。 1、地管的引脚接地越短越好&a…

YOLO目标检测——路标数据集+已标注voc和yolo格式标签下载分享

实际项目应用:自动驾驶、视频监控和安防、物体识别和分类、城市规划和地理信息系统等等数据集说明:YOLO路标目标检测数据集,真实场景的高质量图片数据,数据场景丰富,图片格式为jpg,共900张图片,…

DPText-DETR: 基于动态点query的场景文本检测,更高更快更鲁棒 | 京东探索研究院

针对场景文本检测任务,近期基于DEtection TRansformer (DETR) 框架预测控制点的研究工作较为活跃。在基于DETR的检测器中,query的构建方式至关重要,现有方法中较为粗糙的位置先验信息构建导致了较低的训练效率以及性能。除此之外,…

Tomcat源码:CoyoteAdapter、Valve#invoke、ApplicationFilterChain

前文: 《Tomcat源码:启动类Bootstrap与Catalina的加载》 《Tomcat源码:容器的生命周期管理与事件监听》 《Tomcat源码:StandardServer与StandardService》 《Tomcat源码:Container接口》 《Tomcat源码&#xff1a…

在32位Windows中,DLL是如何导出的?

32 位 Windows 的设计者不必担心将所有内容压缩到 256KB 的内存中。由于 Win32 中的模块基于需求分页,因此你所要做的就是将整个映像映射到内存中,然后运行访问所需的部分。 DLL中的常驻名(resident name)和非常驻名(non-resident name)之间没有区别&am…