Datawhale X 李宏毅苹果书 AI夏令营 《深度学习详解》第十九章 ChatGPT

news2024/9/23 23:53:15

19.1 ChatGPT 简介和功能

1、对话框可以输入任何东西

2、可以继续追问

19.2 对于 ChatGPT 的误解

1、第一个误解是 ChatGPT 的回答是罐头讯息

2、另外一个常见的误解是 ChatGPT 的答案是网络搜索的结果

3、那 ChatGPT 真正在做的事情是什么呢?一言以蔽之就是做文字“接龙”。ChatGPT 简单来将其本身就是一个函数,输入一些东西,就输出一些东西。可以以一个句子作为输入,它输出这个句子后面应该接的词汇的概率。它会给每一个可能的符号一个概率。ChatGPT 输出的是这样一个概率的分布,那 ChatGPT 输出概率分布以后,接下来会从这个概率分布里面去做采样,根据这个概率分布去采样出一个词汇。所以这就是为什么ChatGPT 每次的答案都是不一样的,因为他每次产生答案的时候是有随机性的,它是从一个概率分布里面去做取样,所以他每次的答案都是不同的。

         其生成句子的方式就是将词汇连续输出

4、那 ChatGPT 怎么考虑过去的对话历史记录呢?如何做出连续的对话呢?其实这里原理是一样的,因为它的输入不是只有现在的输入,还包含同一则对话里面所有过去的互动。所以同一则对话里面,所有过去的互动,也都会一起被输入到这个函数里面,让这个函数决定要接哪一个词汇,那这个函数它显然是非常非常复杂的

5、但是没有联网的 ChatGPT 是如何通过大量网络数据来进行学习的呢?这里我们要分明确训练和测试,要切成两个部分来看,寻找函数的过程,我们叫做训练。寻找函数的时候,ChatGPT 有去搜集网络的数据,来帮助他找到这个可以做文字接龙的函数。但是当这个可以做文字接龙的函数被找出来以后,模型就不需要联网了,就进入下一个阶段了,叫做测试。测试就是使用者给一个输入,ChatGPT 给一个输出,当进入测试的时候,是不需要去网络搜索的。

19.3 ChatGPT 背后的关键技术——预训练

1、G——生成;P——预训练;T——Transformer

2、我们要让机器学会英文翻中文,首先要有人类收集大量中英成对的例句。这种需要成对的东西来学习的技术,叫做监督式的学习。

3、另外,我们知道 ChatGPT 中不只是有监督式的学习,还有加上强化学习,其使用的是强化学习中常见的 PPO 算法

4、所以综上,ChatGPT 的学习基本上就是三个步骤——先做预训练,再做监督学习,然后做强化学习。

19.4 ChatGPT 带来的研究问题

1、第一个是如何精准提出需求

2、如何让机器修改一个错误,不要弄错更多地方,这会是一个新的研究的主题,即神经编辑(neural editing)

3、判断输出的内容是否由 AI 生成

4、ChatGPT 会不会口风不紧,泄露了不该泄露的机密


hahaha都看到这里了,要是觉得有用的话就辛苦动动小手点个赞吧! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2126466.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【F179】基于Springboot+vue实现的幼儿园管理系统

作者主页:Java码库 主营内容:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app等设计与开发。 收藏点赞不迷路 关注作者有好处 文末获取源码 项目描述 系统管理也都将通过计算机进行整体智能化操作&#xff…

Adobe Acrobat DC无法将图片转换成PDF?教你用Python快速解决,最后附上集成小程序!

存在问题 当用Adobe Acrobat DC想将图片转换成PDF的时候,有时候会报错,如下: 多次尝试还是出现这个问题。 解决方案 基于Python代码实现 from PIL import Image import osdef images_to_pdf(input_folder, output_pdf):""&quo…

Emlog程序屏蔽用户IP拉黑名单插件

插件介绍 在很多时候我们需要得到用户的真实IP地址,例如,日志记录,地理定位,将用户信息,网站数据分析等,其实获取IP地址很简单,感兴趣的可以参考一下。 今天给大家带来舍力写的emlog插件:屏蔽…

【办公类】大组工会学习(文心一言+Python批量)

背景需求: 每学期要写一份工会的大组政治学习读后感(9月-1月,共5次) 学习内容 9月、10月、11月、12月、1月的学习内容文字稿 在班级里,我擅长电脑工作,所以这种写的工作都包了。 中2班三位老师一共写3篇&…

社区版IDEA连接MySQL数据库以及使用的详细方法

1、下载插件 由于社区版没有为我们提供DataBase,所有需要我们自己去下载DataBase插件。 步骤如下:1、File->Settings (图片序号标错)2、Plugins->搜索DataBase Navigator,点击install安装,安装…

新火种AI|估值飙升到千亿美元!OpenAI拿什么去支撑这惊人身价?

作者:小岩 编辑:彩云 OpenAI又有大动作了。 近期,有消息曝出,OpenAI正在进行新一轮的融资。此次融资阵仗极大,OpenAI很可能在本轮融资后估值飙升至千亿美元,成为全球范围内的“超级巨头”。 千亿估值的…

【机器学习-监督学习】集成学习与梯度提升决策树

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈Python机器学习 ⌋ ⌋ ⌋ 机器学习是一门人工智能的分支学科,通过算法和模型让计算机从数据中学习,进行模型训练和优化,做出预测、分类和决策支持。Python成为机器学习的首选语言,…

erlang学习: Mnesia Erlang数据库3

Mnesia数据库删除实现和事务处理 -module(test_mnesia). -include_lib("stdlib/include/qlc.hrl").-record(shop, {item, quantity, cost}). %% API -export([insert/3, select/0, select/1, delete/1, transaction/1,start/0, do_this_once/0]). start() ->mnes…

[SAP ABAP] 清空ABAP变量

使用关键字CLEAR将变量中的值设置为默认值 代码结果如下所示

Win10磁盘出现小锁和感叹号的解决办法

很多说在设置-系统安全,但是我的么有,只能上命令了,管理员身份运行powerShell: su 速度比较慢,耐心等待会,每次查看状态加密的百分比都是减少哦 manage-bde -off G: manage-bde -status

JS获取URL参数的几种方法

JS获取URL参数的几种方法 在Web开发中,经常需要从URL中提取参数来进行相应的操作。本文将深度解析在JavaScript中获取URL参数的几种方法,并附带一些扩展与高级技巧。希望对你有所帮助! 一、JS获取URL参数包含哪些方式 1. 使用URL对象 现代浏览…

BCLinux您的授权码是无效的,请获得正确的授权码来注册大云Linux操作系统

更新yum源老弹出这个,很烦人。 [rootlocalhost yum.repos.d]# yum clean all 服务器检查结果: ***信息***您的授权码是无效的,请获得正确的授权码来注册大云Linux操作系统。您可以使用bclinux-license -g命令获得机器码,然后与我们联系帮您产…

JavaScript语言基础知识

文章目录 前言一、JavaScript语言是什么?二、基础知识 1.语法2.关键字3.数据类型4.变量定义及其使用5.运算符的使用总结 前言 JavaScript是Web页面中一种比较流行的脚本语言,它通过客户端浏览器解释执行,可以应用在JSP、PHP、ASP等网站中。随…

编码与实现

1. 程序设计语言 1.1 程序设计语言的概述 程序设计语言是用于书写计算机程序的语言,是一种实现性软件语言。最早的机器语言,到汇编语言,到现在的高级语言。语言的发展越来越规范、简单,代码的复用性越来越高。程序员逐渐从复杂的…

curl和ping

curl获取页面内容,ping测试连通 curl和ping是两个在网络环境中常用的命令行工具,但它们的目的和应用场景有很大的不同。 curl 用途:curl是一个命令行工具,用于传输数据,支持多种协议,包括HTTP、HTTPS、FT…

KaiwuDB 受邀亮相 2024 数博会

8月28-30日,由国家数据局主办,贵州省人民政府承办的 2024 中国国际大数据产业博览会(简称“数博会”)在贵阳启幕。KaiwuDB 受邀携一众产品亮相大会,重点展示了分布式多模数据库 KaiwuDB 2.0 及其在物联网海量异构数据管…

比较stl库的ostringstream与Qt的QString::arg(),QString::number()

需求: 显示一个float或者double类型的数,要求小数点后的数字位数为定值。 考虑STL库的ostringstream或者Qt的QString::arg(), number 对于stringstream,使用比较繁琐,要联合使用std::fixed和std::setprecision才能实现固定小数位数显示&am…

Java并发复习

Java基础 1. 为什么要使用并发编程? 一般我们工作的电脑都有多核,我们创建多个线程,然后操作系统可以将多个线程分配给不同的CPU去执行,每个CPU执行一个线程,这样就提高了CPU使用效率。 在网络购物中,我…

52. 两个链表的第一个公共节点

comments: true difficulty: 简单 edit_url: https://github.com/doocs/leetcode/edit/main/lcof/%E9%9D%A2%E8%AF%95%E9%A2%9852.%20%E4%B8%A4%E4%B8%AA%E9%93%BE%E8%A1%A8%E7%9A%84%E7%AC%AC%E4%B8%80%E4%B8%AA%E5%85%AC%E5%85%B1%E8%8A%82%E7%82%B9/README.md 面试题 52. 两…

逆向基础一阶段检测-2

做题笔记。 前言:只能说,在目前我所打的CTF-reverse,这类题目,第一印象就是它啦。 考查:对混淆代码的识别、反反调试的手段。 下载 查壳。 32ida打开。 还是先用动调的方式去执行。 会发现 程序直接闪退。 切换到汇编窗…