ChatGPT的简单了解

news2024/11/28 11:00:36

ChatGPT 是 InstructGPT 的同级模型,它经过训练可以按照提示中的说明进行操作并提供详细的响应。

InstructGPT论文:https://arxiv.org/pdf/2203.02155.pdf

InstructGPT怎么准备和标记数据集:https://harryliu.blog.csdn.net/article/details/129876367

instructGPT论文阅读笔记:https://harryliu.blog.csdn.net/article/details/129876367

ChatGPT训练方法

        ChatGPT使用与 InstructGPT 相同的方法,使用人类反馈强化学习 (RLHF) 训练该模型,但数据收集设置略有不同。 使用监督微调训练了一个初始模型:Human AI 训练员提供对话,并在对话中扮演两个角色——用户(User)和 AI 助手。 让训练者(trainers)可以访问模型编写的建议,以帮助他们撰写回复。 把这个新的对话数据集与 InstructGPT 数据集混合,并将其转换为对话格式。

        为了创建强化学习的奖励模型,需要收集比较(comparison)数据,其中包含两个或多个按质量排序的模型响应。 为了收集这些数据,收集了 AI 训练者与聊天机器人的对话。 随机选择了一条模型编写的消息,抽取了几个备选的完成方式,并让 AI 训练者对它们进行排名。 使用这些奖励模型,使用 Proximal Policy Optimization.来微调模型。 对这个过程进行了几次迭代。

        ChatGPT 是从 GPT-3.5 系列中的一个模型进行微调的,该模型于 2022 年初完成训练。 ChatGPT 和 GPT-3.5 在 Azure AI 超级计算基础设施上训练的。

Chatgpt的限制

  • ChatGPT 有时会写出看似合理但不正确或荒谬的答案。 解决这个问题具有挑战性,因为:(1)在 RL 训练期间,目前没有真实来源; (2) 训练模型更加谨慎导致它拒绝可以正确回答的问题; (3) 监督训练会误导模型,因为理想的答案取决于模型知道什么,而不是人类演示者知道什么。
  • ChatGPT 对输入措辞的调整或多次尝试相同的提示很敏感。 例如,给定一个问题的措辞,模型可以声称不知道答案,但只要稍作改写,就可以正确回答。
  • 该模型通常过于冗长并过度使用某些短语,例如重申它是 OpenAI 训练的语言模型。 这些问题源于训练数据的偏差(训练者更喜欢看起来更全面的更长答案)和众所周知的过度优化问题。 1,2
  • 理想情况下,当用户提供模棱两可的查询时,模型会提出澄清问题。 相反,我们当前的模型通常会猜测用户的意图。
  • 虽然已努力使模型拒绝不当请求,但它有时会响应有害指令或表现出有偏见的行为。 正在使用 Moderation API 来警告或阻止某些类型的不安全内容,但预计目前它会有一些漏报和漏报。 他们渴望收集用户反馈,以帮助他们正在进行的改进该系统的工作。

ChatGPT 与 InstructGPT 进行示例比较

示例一

示例二

 示例三

ChatGPT访问方法

1. 申请OpenAI的账号

首先你必须有科学上网,你懂得。

而且broker要提供chatgpt的节点不然你有错误“ Sorry, you have been blocked”

访问 chat.OpenAi.com https://chat.openai.com/并使用电子邮件地址或 Google 或 Microsoft 帐户注册一个帐户。 您需要在 OpenAI 网站上创建一个帐户才能登录并访问 ChatGPT。

如果您以前从未创建过帐户,请单击“注册”并按照提示输入您的信息。 OpenAI 确实需要有效的电话号码进行验证才能创建帐户。

ChatGPT的使用

一旦您在网站的 ChatGPT 端登录到您的 OpenAI 帐户,就该了解 AI 工具的窗口了。 以下是您将看到的内容的细分,以下图为例:

  1. New chat button:在屏幕左侧,您会看到一个“新聊天”按钮,您可以随时单击该按钮开始新对话。 这很有用,因为 ChatGPT 模型会记住之前在对话中讨论过的内容,并会根据上下文做出回应,因此开始新的聊天将毫无偏见地清除新的对话。
  2. Chat history:左侧边栏还可以让您访问之前的所有对话,以防您需要返回到某个对话,不过可以选择关闭聊天记录。
  3. Upgrade to PlusChatGPT Plus 是一项付费订阅,让会员可以访问 GPT-4 模型,这是一种来自 OpenAI 的更快、更大的语言模型。 您可以选择升级到 Plus 或继续使用免费版本。
  4. Account:单击屏幕左下角的电子邮件地址或姓名,您将可以访问您的帐户信息,包括设置、注销选项以及来自 OpenAI 的帮助和常见问题解答。
  5. Your prompts:你给 AI 聊天机器人的问题或提示会出现在这里。
  6. ChatGPT's responses::每当 ChatGPT 回复您的查询时,徽标将出现在左侧。
  7. Copy, Thumbs up, Thumbs down:每次 ChatGPT 回复时,您都可以将文本复制到剪贴板以粘贴到其他地方,并提供有关回复是否准确的反馈,此过程有助于微调 AI 工具
  8. Regenerate response:如果您在聊天中遇到问题或没有得到满意的答案,您可以单击重新生成响应以提示 ChatGPT 使用最新答案重试。
  9. Text area:这是您输入提示和问题的地方,只需按回车键即可发送。
  10. ChatGPT version:OpenAI 在文本输入区域下方包含了一些细则,您可以在其中阅读免责声明,指出这是“免费研究预览。ChatGPT 可能会产生有关人物、地点或事实的不准确信息”。 还有您当前使用的 ChatGPT 模型* 的版本。

参考资料

Introducing ChatGPT

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/524431.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【连续介质力学】张量的性质2

张量的代数操作 张量的性质 张量迹 Tensor Trace 定义 e ^ i ⨂ e ^ j \hat e_i \bigotimes \hat e_j e^i​⨂e^j​的迹: T r ( e ^ i ⨂ e ^ j ) e ^ i ⋅ e ^ j δ i j Tr(\hat e_i \bigotimes \hat e_j) \hat e_i \cdot \hat e_j \delta_{ij} Tr(e^i​⨂e^j​)e^i​⋅…

总结如何申请注册 GitHub 教师教育优惠 Benefits for Teachers 来免费使用 copilot

目录 1. GitHub 教师教育优惠有什么2. 如何申请教师教育优惠呢2.1 选择学校2.2 更改个人信息2.3 准备证明材料2.4 提交申请2.5 遇到的问题2.5.1 问题 12.5.2 问题 22.5.3 问题 3 3. 申请免费的 GitHub Copilot 学生注册不在此处赘述了,网上有很多教程可以参考。但是…

软件测试面试面对HR提出的问题,怎么回答才不会被面试官“套路”

面试中,如何回答HR提出的问题很大程度上决定了面试能不能成功。 下面是软件测试人员在面试过程中经常被问到的10个问题,告诉你怎么回答才不会被面试官套路...... 请你做一个自我介绍 误区: 一般人回答这个问题过于平常,只说姓…

JVM学习(一)

一、JVM介绍 1.1基本概念 JVM 是可运行 Java 代码的假想计算机 ,包括一套字节码指令集、一组寄存器、一个栈、 一个垃圾回收,堆 和 一个存储方法域。JVM 是运行在操作系统之上的,它与硬件没有直接 的交互。 1.2 运行过程 我们都知道 Java …

1000W用户1Wqps高并发签到系统的架构和实操

说在前面 在尼恩的(50)读者社群中,经常有小伙伴面试的时候,遇到一个一个高并发 架构方面的问题,比如: (1) 高并发秒杀系统如何架构? (2) 高并发签到系统如何架构? (3) 等等等等… 刚…

【C++】函数高级

目录 🍊一.函数的默认参数🍊 1.默认参数的性质 2.函数默认参数的注意事项 🍎二.函数的占位参数🍎 🍏三.函数的重载 🍏 1.重载的性质和条件 (1)修改参数的个数 &#xff…

go语言中文文档 学习笔记(未完)

这里写目录标题 网络编程互联网协议介绍socket编程socket图解TCP编程服务端客户端 UDP编程TCP黏包 http编程WebSocket编程 网络编程 互联网协议介绍 socket编程 socket图解 Socket是应用层与TCP/IP协议族通信的中间软件抽象层。在设计模式中,Socket其实就是一个门…

12.设计模式之门面模式

前言 门面模式,是指提供一个统一的接口去访问多个子系统的多个不同的接口,它为子系统中的一组接口提供一个统一的高层接口。使得子系统更容易使用。日志框架slf4J是门面模式最经典的应用场景。 本节,我们就门面模式,展开详细介绍…

1.setContentView流程分析

1. setContentView初步分析之继承自Activity 我们创建的MainActivity继承自Activity,在代码中使用setContentView(R.layout.activity_main),查看他在Activity中的源码如下: public void setContentView(LayoutRes int layoutResID) {//这里的getWindow方法获取到一个PhoneWind…

什么是好代码/坏代码?给普通人的图解示例

本文翻译自国外论坛 medium,原文地址:https://medium.com/todbotts.triangles/what-is-good-bad-code-an-illustrated-example-for-non-programmers-1222b600a0f0 我曾经在某个地方读到过一句话,基本上有以下内容: 在现代世界中&a…

算法(一)—— 回溯(3)

文章目录 1 78 子集2 90 子集II3 491 递增子序列 子集问题 1 78 子集 如果把 子集问题、组合问题、分割问题都抽象为一棵树的话,那么组合问题和分割问题是收集树的叶子节点,而子集问题是找树的所有节点! 因为需要找到所有的节点&#xff0…

JavaEE(系列一 )-- 计算机是如何进行工作的

目录 1. 操作系统 2. 进程/任务(Process/Task) 2.1 进程 2.2 进程管理 2.2.1 进程的结构体 2.2.2 进程调度 2.3 并行 和 并发 2.4 内存分配 -- 内存管理(Memory Manage) 2.5 进程间通信 3. 线程 1. 操作系统 操作系统是一组做计算机资源管理的软件的…

谷歌I/O大会重磅发布:Bard编码能力优化后仍不支持中文,开发者选择CodeGeeX更佳

谷歌I/O大会今天凌晨发布,打出系列AI组合拳。除了发布升级版语言模型PaLM2之外,Bard能力也要起飞。 凭借改进的数学、逻辑和推理技能,Bard 现在可以帮助生成、解释和调试 20 多种编程语言的代码,开发者们需要输入prompt&#xff0…

C#从入门到入坟(原创不易,转载请注明出处)

文章目录 C# 基础篇0 环境部署1 Hello world1.1 两种框架1.2 创建项目的过程1.3 项目组成结构1.3.1 解决方案和项目1.3.2 程序集信息1.3.3 引用1.3.4 配置文件1.3.5 程序入口类 1.4 解决方案1.5 Debug 和 Release1.6 CSharp虚拟机初始1.7 .Net Framework混合语言开发1.8 托管代…

上下文感知的体素对比学习用于标签高效的多器官分割

文章目录 Context-Aware Voxel-Wise Contrastive Learning for Label Efficient Multi-organ Segmentation摘要本文方法有监督损失Context-Aware Contrastive Learning Loss for Unlabeled Voxels 实验结果 Context-Aware Voxel-Wise Contrastive Learning for Label Efficient…

GSMA-eSIM-官网规范说明

GSMA | eSIM Consumer and IoT Specifications - eSIM GSMA | eSIM Consumer and IoT Specifications - eSIMhttps://www.gsma.com/esim/esim-specification/ 架构、测试、技术规范 3.0版本 测试套件 EID的定义和分配 GSMA EID Definition and Assignment 合规性规范 自我评…

第十四届蓝桥杯青少组模拟赛Python真题 (2023年2月12日),包含答案

第十四届蓝桥杯青少组模拟赛Python真题 (2023年2月12日) 一、选择题 第 1 题 单选题 关于Python3.10,下列选项描述正确的是 ( )。 答案:B 第 2 题 单选题 下列数据类型中,哪一个是不可变的?() 答案:B 第 3 题 单选题 以下关于函数参数描述正确的是 ()。 答案:D 第 …

【JAVAEE】文件操作——IO

目录 💋1. 冯诺伊曼体系 🐷2. 内存与外存的区别 ✨3. 文件 🎁3.1 认识文件 ✌3.2 文件的管理 🍳3.3 文件路径 🎃3.4 文件的保存 👑3.4.1 文本文件 📷3.4.2 二进制文件 🎀3.5 文件系…

Python基本数据类型之一——set(集合)

Python基本数据类型之一——set(集合) 一、python集合定义 集合(set)是一个无序不重复元素的序列。基本功能是进行成员关系测试和删除重复元素。 二、创建方式 在Python中,创建集合有两种方式: 一种是用一对大括号将多个用逗号分隔的数据括起来。 另一种…

Vue3-黑马(九)

目录: (1)vue3-antdv-删除选中 (2)vue3-进阶-antdv-增改 (3)vue3-进阶-antdv-增改2 (1)vue3-antdv-删除选中 我们在表格中在加一列,做一个复选框&#xff…