〖ChatGPT实践指南 - 零基础扫盲篇⑧〗- OpenAI 的 模型(Model) 介绍

news2024/11/27 2:47:47

文章目录

  • ⭐ OpenAI 模型列表
  • ⭐ GPT 模型
    • 🌟 GPT-3 模型
    • 🌟 GPT-3.5 模型
    • 🌟 GPT-4 模型
  • ⭐ 特定功能的模型
    • 🌟 DALL·E 模型
    • 🌟 Whisper模型
    • 🌟 Embeddings 模型
    • 🌟 Codex 模型
    • 🌟 Moderation 审核模型
  • ⭐ 持续的模型升级

小伙伴们大家好,该章节我们来了解一下 ChatGPT 一个关键概念 - 模型(Model)。主要是为大家介绍一下在 OpenAI 中,究竟有哪些模型可以使用。

在后续的章节,我们会分单独的小章节逐一的为大家介绍各个不同模型的调用以及接口参数的一些说明,该章节我们先来做一个大概得了解即可。


⭐ OpenAI 模型列表

模型描述
GPT3一种基于人工智能的自然语言处理模型,可以实现自然语言理解和自然语言生成等任务。
GPT-3.5基于 GPT-3 改进的模型,更加强大和智能,可以理解并生成自然语言或代码。
GPT-4一组在 GPT-3.5 上改进的模型,可以理解并生成自然语言或代码
DALL·E可以将自然语言描述转换为高质量图像的图像生成模型。
Whisper一种基于语音识别和自然语言处理技术的智能语音助手,可以实现高质量的语音识别和语音转换。
Embeddings一种自然语言处理技术,可以将自然语言文本转换为向量表示的模型。
Codex一种可以将自然语言描述转换为代码,从而实现快速编写和自动化编程的模型。
Moderation一种内容审核模型,可以自动检测和过滤出不良内容,从而保护用户的权益和利益。

除此之外,OpenAI还发布了一些开源模型, Point-E、Jukebox 和 CLIP,接下来就为大家分别介绍一下这些模型的作用。


⭐ GPT 模型

ChatGPT的GPT模型是一种强大的自然语言处理模型,可以自动产生自然流畅的文本。随着模型的不断升级,GPT模型的语言生成能力和应用场景也在不断扩展,为多个领域提供更加智能、高效和便捷的解决方案。

  • GPT-1:是最早的GPT模型,采用了基于Transformer的模型架构。它在多个自然语言处理任务上取得了良好的表现,但是生成的文本质量相对较低。
  • GPT-2:是GPT模型的升级版,拥有更多的参数和更强大的语言生成能力。可以自动产生高质量、连贯、自然的文本,同时也可以应用于多个领域,如智能客服、智能问答等。
  • GPT-3:是目前最先进的GPT模型,拥有数十亿个参数和强大的语言生成能力。它可以自动产生高质量、连贯、自然的文本,同时还可以完成更加复杂的自然语言任务,如机器翻译、自动摘要等,比 GPT-2 更加强大。
  • GPT-3.5:是基于 GPT-3 改进的模型,更加强大和智能,可以理解并生成自然语言或代码。
  • GPT4:目前处于有限测试阶段,只有获得访问权限的人才能访问。请加入候补名单,以便在容量可用时获得访问权限。

🌟 GPT-3 模型

GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。然而,最初的 GPT-3 基础模型(davinci、curie、ada 和 babbage)是目前唯一可用于微调的模型。


最新模型描述最大 TOKENS训练日期
text-curie-001非常有能力,比 Davinci 更快,成本更低。2,049 tokensUp to Oct 2019
text-babbage-001能够执行简单的任务,速度非常快,成本更低。2,049 tokensUp to Oct 2019
text-ada-001能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。2,049 tokensUp to Oct 2019
davinci功能最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务,而且通常质量更高。2,049 tokensUp to Oct 2019
curie能力很强,但比 Davinci 更快,成本更低。2,049 tokensUp to Oct 2019
babbage能够执行简单的任务,速度非常快,成本更低。2,049 tokensUp to Oct 2019
ada能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。2,049 tokensUp to Oct 2019

🌟 GPT-3.5 模型

建议在试验时使用gpt-3.5-turbo,因为它会产生最佳结果。一旦一切正常,可以尝试其他模型,看看是否能以更低的延迟或成本获得相同的结果。

GPT-3.5 模型可以理解并生成自然语言或代码。OpenAI 在 GPT-3.5 系列中功能最强大且最具成本效益的模型是 gpt-3.5-turbo,它已针对聊天进行了优化,但也适用于传统的完成任务。


最新模型描述最大tokens训练日期

gpt-3.5-turbo
功能最强大的 GPT-3.5 模型并针对聊天进行了优化,
成本仅为 text-davinci-003 的 1/10,
将使用最新的模型迭代进行更新。

4,096 tokens

Up to Sep 2021

gpt-3.5-turbo-0301
2023 年 3 月 1 日的 gpt-3.5-turbo 快照,
与 gpt-3.5-turbo 不同,此模型不会收到更新,
并且仅在 2023 年 6 月 1 日结束的三个月内提供支持。

4,096 tokens

Up to Sep 2021

text-davinci-003
可以比 curie、babbage 或 ada 模型
更好的质量、更长的输出,和一致的指令
遵循来完成任何语言任务。还支持在文本中插入补全。

4,097 tokens

Up to Jun 2021

ext-davinci-002
与 text-davinci-003 类似的功能,
但使用supervised fine-tuning
而不是强化学习进行训练

4,097 tokens

Up to Jun 2021
code-davinci-002针对代码完成任务进行了优化8,001 tokensUp to Jun 2021

🌟 GPT-4 模型

GPT-4 目前处于有限测试阶段,只有获得访问权限的人才能访问。请加入候补名单,以便在容量可用时获得访问权限。

GPT-4 是一个大型多模态模型(今天接受文本输入并发出文本输出,将来会出现图像输入),由于其更广泛的常识和高级推理,它可以比以前的任何模型更准确地解决难题能力。与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于传统的补全任务。

最新模型描述最大 TOKENS训练日期

gpt-4
比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,

并针对聊天进行了优化。将使用最新的模型迭代进行更新。

8,192 tokens

Up to Sep 2021

gpt-4-0314
2023 年 3 月 14 日的 gpt-4 快照。与 gpt-4 不同,

该模型不会收到更新,并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。

8,192 tokens

Up to Sep 2021

gpt-4-32k
与基本 gpt-4 模式相同的功能,

但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。

32,768 tokens

Up to Sep 2021

gpt-4-32k-0314
2023 年 3 月 14 日的 gpt-4-32 快照。
与 gpt-4-32k 不同,此模型不会收到更新,
并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。

32,768 tokens

Up to Sep 2021

对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比之前的任何模型都更有能力。


⭐ 特定功能的模型

虽然目前最新的 gpt-3.5-turbo 模型针对聊天对话进行了优化,但是这个模型只适合适合传统的完成任务。原始 GPT-3.5 模型针对文本补全进行了优化。

试用 gpt-3.5-turbo 是了解 API 功能的好方法。在了解要完成的任务后,我们可以继续使用 gpt-3.5-turbo 或其他模型并尝试围绕其功能进行优化。


🌟 DALL·E 模型

DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。

DALL·E模型可以生成与文本描述相符的高质量图像,包括人物、动物、物体、场景等。与传统的图像生成模型相比,DALL·E模型可以生成更加丰富和多样化的图像,同时还可以生成符合逻辑和语义的图像。

DALL·E模型的训练数据来自于多个来源,包括网络上的图像、图像数据库以及自然语言描述。模型使用这些数据来学习如何将语言描述转换为图像,并在训练过程中不断优化模型的性能。

DALL·E模型可以应用于多个场景,如图像生成、视觉效果、设计和创意等领域。它可以为设计师、艺术家、广告公司等提供更加高效和创新的图像生成工具,同时也可以为普通用户提供更加丰富和多样化的图像内容。

可以通过实验室的界面或API进行试用,DALL·E室验室地址: https://labs.openai.com/ 可以在线体验DALLE的功能。


🌟 Whisper模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过 OpenAI 的 API 使用 whisper-1 模型名称获得。

目前,Whisper 的开源版本与通过 OpenAI 的 API 提供的版本之间没有区别。ChatGPT的Whisper模型是一种基于语音识别和自然语言处理技术的智能语音助手,可以帮助用户实现语音控制、智能问答和语音交互等功能。

Whisper模型采用了深度神经网络和语音识别技术,可以实现高质量的语音识别和语音转换。同时,模型还采用了自然语言处理技术,可以将语音转换为文本,并进行语义分析和理解,从而实现智能问答和语音交互。

Whisper模型可以应用于多个场景,如智能家居、智能客服、语音搜索等领域。它可以为用户提供更加便捷和高效的语音控制和交互方式,同时也可以为企业提供更加智能和人性化的客服和搜索服务。

提示:可以使用Whiper这种模型,为语音生成文本,这在视频生成字幕方面,语音识别等领域将会有很多相关应用。


🌟 Embeddings 模型

ChatGPT的Embeddings模型是一种自然语言处理技术,可以将自然语言文本转换为向量表示,从而实现自然语言文本的语义分析和文本分类等任务。

Embeddings模型采用了深度学习和神经网络技术,通过学习自然语言文本的上下文关系,将文本转换为向量表示。这种向量表示可以捕捉文本的语义信息和上下文关系,从而实现文本的语义分析和文本分类等任务。

Embeddings模型可以应用于多个场景,如文本分类、情感分析、实体识别等领域。它可以为企业提供更加精准和智能的文本分类和情感分析服务,同时也可以为用户提供更加个性化和智能的文本推荐和搜索服务。

总之,ChatGPT的Embeddings模型是一种强大的自然语言处理技术,可以将自然语言文本转换为向量表示,为文本分类、情感分析和实体识别等任务提供更加精准和智能的解决方案。


🌟 Codex 模型

Codex 模型是可以自然语言理解的和生成代码的 GPT-3 模型的后代。他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。

他们最擅长 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。

OpenAI目前提供两种 Codex 型号:

最新模型描述最大 TOKENS训练日期
code-davinci-002功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。
除了补全代码,还支持在代码中插入补全。
8001 tokensUp to Jun 2021
code-cushman-001几乎与 Davinci Codex 一样强大,但速度稍快。
这种速度优势可能使其成为实时应用程序的首选。
Up to 2048 tokensUp to Jun 2021

Codex 模型在有限的测试版期间可以免费使用,并且会降低速率限制。

在此期间,只要符合 OpenAI 的使用政策,OPenAI非常欢迎也非常乐意为这些模型时提供任何反馈,并期待能与官方社区进行更多的互动。


🌟 Moderation 审核模型

还有一种特殊的模型,那就是 “审核模型” 。"审核模型"旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供了查找以下类别内容的分类功能:仇恨/威胁、自残、性/未成年人、暴力图片。

审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

模型描述
text-moderation-latest最有能力的审核模型。精度会比稳定模型略高
text-moderation-stable几乎与最新型号一样强大,但稍旧一些。

⭐ 持续的模型升级

随着 gpt-3.5-turbo 的发布,OpenAI 的一些模型现在正在不断更新。为了减少模型更改以意外方式影响我们用户的可能性,官方将提供在 3 个月内保持静态的模型版本。随着模型更新的新节奏,OPenAI官方还希望人们能够贡献更多的评估,以帮助他们针对不同的用例改进模型。

以下模型是将在指定日期弃用的临时快照。如果想使用最新的模型版本,请使用标准模型名称,如 gpt-4 或 gpt-3.5-turbo。

模型名称弃用日期
gpt-3.5-turbo-0301June 1st,2023
gpt-4-0314June 14th,2023
gpt-4-32k-0314June 14th,2023

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/471397.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python Node.js安装和配置

一、Node.js简介 简单的说 Node.js 就是运行在服务端的 JavaScript。Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境。Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型,使其轻量又高效。Node.js 的包管理器 npm,是全球最大的开源库生态系统…

嘉明的数据结构学习Day5——作栈和队列以及它们的顺序存储与链式存储的实现

栈与队列是什么 栈和队列其实就是操作受限制的线性表。 下面来复习一下线性表的概念 具有n个相同类型元素的有限序列 有的人就会问,那么它们受限在哪里呢? 栈:只允许一段插入和删除。 队列:只允许一端插入一端删除。 栈 前面说…

巧用千寻位置GNSS软件| 桥台锥坡放样操作技巧

桥台锥坡放样是针对道路施工中,路桥结合部桥台圆锥形斜坡面进行放样设计的专用程序。本期将给大家介绍如何使用千寻位置GNSS软件实现快速完成桥台锥坡放样。 点击【测量】->【桥台锥坡放样】,从线路库中选择桥台经过的线路或是单独增加桥台 锥坡放样&…

利用sampleini库实现c/c++操作ini配置文件

github sampleini库下载链接: https://github.com/brofield/simpleini 下载后只需一下三个文件即可: 配置文件格式:采用以下格式; 1. 加载配置文件前重要设置 /*设置是否使用utf8编码作为加载/保存; 在ini数据被加载后不可设置; 默认true;*/ void SetUnicode(bool a_bIsUtf8 …

【C++】18.哈希

1.unordered_set和unordered_map 使用与set和map的用法一样 #include <iostream> #include <unordered_map> #include <unordered_set> #include <map> #include <set> #include <string> #include <vector> #include <time.h&…

QImage 如何设置图片的透明度

最近遇到了一些这样的需求&#xff0c;在窗口可以调节显示图片的透明度&#xff0c;但是不能影响其他图片。一个窗口显示的图片并不是一张&#xff0c;而是多张通过绘制的形式叠加起来的。可以理解为类似图层。 就像下面这个组合一样&#xff0c;想法是在拖动右侧透明度的滑条…

ACM MM23 Workshop|多媒体+无人机

摘要&#xff1a; 无人驾驶飞行器 (UAV)&#xff0c;也称为无人机&#xff0c;由于能够从空中捕获高质量的多媒体数据&#xff0c;近年来变得越来越流行。 随着航空摄影、电影摄影和测绘等多媒体应用的兴起&#xff0c;无人机已成为收集丰富多样的多媒体内容的强大工具。 本次…

elasticsearch结构化查询

在上一篇中我们介绍了DSL相关的知识&#xff0c;接下来我们将会学习elasticsearch的结构化查询&#xff0c;同时也实践一下上一篇的DSL的查询用法 什么是结构化搜索? 从《Elasticsearch权威指南》上摘取部分解释如下: 结构化搜索是指查询包含内部结构的数据。日期&#xff0…

当我们在谈论ChatGPT时,我们在谈论什么?

当我们在谈论ChatGPT时&#xff0c;我们在谈论什么&#xff1f; 文章目录 当我们在谈论ChatGPT时&#xff0c;我们在谈论什么&#xff1f;一、介绍GPT-4相比GPT-3.5有何不同呢1.交谈能力2.多语言翻译精确度3.视觉输入 二、应用领域1.小镇做题家 (学术研究)2.Cosplay&#xff0c…

优思学院|质量大师的那些名言(三)【质量是一种习惯】

格言是一种简洁明了、简练有力的表达方式&#xff0c;通常蕴含着深刻的哲理和智慧&#xff0c;能够为我们提供指导和启示。 在《质量大师的那些名言》系列中&#xff0c;优思学院将透过这些名言&#xff0c;用最简单、直接、深刻的方式教授质量和六西格玛管理。 概述 在现代商…

ChatGPT 目前到底能帮助我们程序员做什么?

&#x1f680; 个人主页 极客小俊 ✍&#x1f3fb; 作者简介&#xff1a;web开发者、设计师、技术分享博主 &#x1f40b; 希望大家多多支持一下, 我们一起进步&#xff01;&#x1f604; &#x1f3c5; 如果文章对你有帮助的话&#xff0c;欢迎评论 &#x1f4ac;点赞&#x1…

异常中断处理

异常或中断是用户程序中最基本的一种执行流程或形态。这部分主要对ARM架构下的异常中断做详细说明。 ARM一共有7种类型的异常&#xff0c;按优先级从高到低的排列如下&#xff1a; 复位异常&#xff08;Reset&#xff09;、数据异常&#xff08;Data Abort&#xff09;、快速…

工业和信息化部发布《关于电信设备进网许可制度若干改革举措的通告》

按照《国务院办公厅关于深化电子电器行业管理制度改革的意见》&#xff08;国办发〔2022〕31号&#xff09;要求&#xff0c;工业和信息化部发布《关于电信设备进网许可制度若干改革举措的通告》&#xff08;工信部信管函〔2023〕14号&#xff09;&#xff0c;集中公布动态调整…

2023,你了解Kafka吗?深入详解

- 消息队列的核心价值 - 解耦合。 异步处理 例如电商平台&#xff0c;秒杀活动。一般流程会分为&#xff1a;1: 风险控制、2&#xff1a;库存锁定、3&#xff1a;生成订单、4&#xff1a;短信通知、5&#xff1a;更新数据。 通过消息系统将秒杀活动业务拆分开&#x…

**MySQL关联查询七种方式详解与应用实例**,你的掌握了吗

当我们需要从多个表中查询数据时&#xff0c;就需要使用关联查询了。MySQL支持七种不同类型的关联查询&#xff1a;内连接、左连接、右连接、全外连接、交叉连接、自连接和自然连接。本文将讲解这七种关联查询的SQL语句、示例以及应用场景。 一、 前言 关联查询是数据库操作中…

Leetcode 37 解数独

Leetcode解数独 题目描述题解1(按Board行列回溯&#xff1a;较直接) 题目描述 编写一个程序&#xff0c;通过填充空格来解决数独问题。 数独的解法需 遵循如下规则&#xff1a; 数字 1-9 在每一行只能出现一次数字 1-9 在每一列只能出现一次数字 1-9 在每一个以粗实线分隔的…

postgresql|数据库|批量执行SQL脚本文件的shell脚本

前言&#xff1a; 对于数据库的维护而言&#xff0c;肯定是有SQL脚本的执行&#xff0c;例如&#xff0c;某个项目需要更新&#xff0c;那么&#xff0c;可能会有很多的SQL脚本需要执行&#xff0c;SQL脚本可能会包含有建表&#xff0c;插入数据&#xff0c;索引建立&#xff…

Vue项目的性能优化

前言 Vue 框架通过数据双向绑定和虚拟 DOM 技术&#xff0c;帮我们处理了前端开发中最脏最累的 DOM 操作部分&#xff0c; 我们不再需要去考虑如何操作 DOM 以及如何最高效地操作 DOM&#xff1b;但 Vue 项目中仍然存在项目首屏优化、Webpack 编译配置优化等问题&#xff0c;所…

Towards Principled Disentanglement for Domain Generalization

本文用大量的理论论述了基于解纠缠约束优化的域泛化问题。 这篇文章认为以往的文章在解决域泛化问题时所用的方法都是non-trivial的&#xff0c;也就是说没有作严格的证明&#xff0c;是不可解释的&#xff0c;而本文用到大量的定理和推论证明了方法的有效性。 动机 因为域泛…

客户管理系统的作用有哪些?

阅读本文您将了解&#xff1a;1.客户管理系统的作用&#xff1b;2.客户管理系统软件怎么用&#xff1b;3.客户管理的注意事项。 一、客户管理系统的作用 客户是企业的重要财富&#xff0c;因此客户管理是企业发展过程中至关重要的一部分&#xff0c;那么客户管理怎么做&#…