文章目录

⭐ OpenAI 模型列表
⭐ GPT 模型
- 🌟 GPT-3 模型
- 🌟 GPT-3.5 模型
- 🌟 GPT-4 模型
⭐ 特定功能的模型
- 🌟 DALL·E 模型
- 🌟 Whisper模型
- 🌟 Embeddings 模型
- 🌟 Codex 模型
- 🌟 Moderation 审核模型
⭐ 持续的模型升级

小伙伴们大家好，该章节我们来了解一下 ChatGPT 一个关键概念 - 模型(Model)。主要是为大家介绍一下在 OpenAI 中，究竟有哪些模型可以使用。

在后续的章节，我们会分单独的小章节逐一的为大家介绍各个不同模型的调用以及接口参数的一些说明，该章节我们先来做一个大概得了解即可。

⭐ OpenAI 模型列表

模型	描述
GPT3	一种基于人工智能的自然语言处理模型，可以实现自然语言理解和自然语言生成等任务。
GPT-3.5	基于 GPT-3 改进的模型，更加强大和智能，可以理解并生成自然语言或代码。
GPT-4	一组在 GPT-3.5 上改进的模型，可以理解并生成自然语言或代码
DALL·E	可以将自然语言描述转换为高质量图像的图像生成模型。
Whisper	一种基于语音识别和自然语言处理技术的智能语音助手，可以实现高质量的语音识别和语音转换。
Embeddings	一种自然语言处理技术，可以将自然语言文本转换为向量表示的模型。
Codex	一种可以将自然语言描述转换为代码，从而实现快速编写和自动化编程的模型。
Moderation	一种内容审核模型，可以自动检测和过滤出不良内容，从而保护用户的权益和利益。

除此之外，OpenAI还发布了一些开源模型， Point-E、Jukebox 和 CLIP，接下来就为大家分别介绍一下这些模型的作用。

⭐ GPT 模型

ChatGPT的GPT模型是一种强大的自然语言处理模型，可以自动产生自然流畅的文本。随着模型的不断升级，GPT模型的语言生成能力和应用场景也在不断扩展，为多个领域提供更加智能、高效和便捷的解决方案。

GPT-1：是最早的GPT模型，采用了基于Transformer的模型架构。它在多个自然语言处理任务上取得了良好的表现，但是生成的文本质量相对较低。
GPT-2：是GPT模型的升级版，拥有更多的参数和更强大的语言生成能力。可以自动产生高质量、连贯、自然的文本，同时也可以应用于多个领域，如智能客服、智能问答等。
GPT-3：是目前最先进的GPT模型，拥有数十亿个参数和强大的语言生成能力。它可以自动产生高质量、连贯、自然的文本，同时还可以完成更加复杂的自然语言任务，如机器翻译、自动摘要等，比 GPT-2 更加强大。
GPT-3.5：是基于 GPT-3 改进的模型，更加强大和智能，可以理解并生成自然语言或代码。
GPT4：目前处于有限测试阶段，只有获得访问权限的人才能访问。请加入候补名单，以便在容量可用时获得访问权限。

🌟 GPT-3 模型

GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。然而，最初的 GPT-3 基础模型（davinci、curie、ada 和 babbage）是目前唯一可用于微调的模型。

最新模型	描述	最大 TOKENS	训练日期
text-curie-001	非常有能力，比 Davinci 更快，成本更低。	2,049 tokens	Up to Oct 2019
text-babbage-001	能够执行简单的任务，速度非常快，成本更低。	2,049 tokens	Up to Oct 2019
text-ada-001	能够执行非常简单的任务，通常是 GPT-3 系列中最快的型号，而且成本最低。	2,049 tokens	Up to Oct 2019
davinci	功能最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务，而且通常质量更高。	2,049 tokens	Up to Oct 2019
curie	能力很强，但比 Davinci 更快，成本更低。	2,049 tokens	Up to Oct 2019
babbage	能够执行简单的任务，速度非常快，成本更低。	2,049 tokens	Up to Oct 2019
ada	能够执行非常简单的任务，通常是 GPT-3 系列中最快的型号，而且成本最低。	2,049 tokens	Up to Oct 2019

🌟 GPT-3.5 模型

建议在试验时使用gpt-3.5-turbo,因为它会产生最佳结果。一旦一切正常，可以尝试其他模型，看看是否能以更低的延迟或成本获得相同的结果。

GPT-3.5 模型可以理解并生成自然语言或代码。OpenAI 在 GPT-3.5 系列中功能最强大且最具成本效益的模型是 gpt-3.5-turbo，它已针对聊天进行了优化，但也适用于传统的完成任务。

最新模型	描述	最大tokens	训练日期
gpt-3.5-turbo	功能最强大的 GPT-3.5 模型并针对聊天进行了优化，成本仅为 text-davinci-003 的 1/10，将使用最新的模型迭代进行更新。	4,096 tokens	Up to Sep 2021
gpt-3.5-turbo-0301	2023 年 3 月 1 日的 gpt-3.5-turbo 快照，与 gpt-3.5-turbo 不同，此模型不会收到更新，并且仅在 2023 年 6 月 1 日结束的三个月内提供支持。	4,096 tokens	Up to Sep 2021
text-davinci-003	可以比 curie、babbage 或 ada 模型更好的质量、更长的输出，和一致的指令遵循来完成任何语言任务。还支持在文本中插入补全。	4,097 tokens	Up to Jun 2021
ext-davinci-002	与 text-davinci-003 类似的功能，但使用supervised fine-tuning 而不是强化学习进行训练	4,097 tokens	Up to Jun 2021
code-davinci-002	针对代码完成任务进行了优化	8,001 tokens	Up to Jun 2021

🌟 GPT-4 模型

GPT-4 目前处于有限测试阶段，只有获得访问权限的人才能访问。请加入候补名单，以便在容量可用时获得访问权限。

GPT-4 是一个大型多模态模型（今天接受文本输入并发出文本输出，将来会出现图像输入），由于其更广泛的常识和高级推理，它可以比以前的任何模型更准确地解决难题能力。与 gpt-3.5-turbo 一样，GPT-4 针对聊天进行了优化，但也适用于传统的补全任务。

最新模型	描述	最大 TOKENS	训练日期
gpt-4	比任何 GPT-3.5 模型都更强大，能够执行更复杂的任务，并针对聊天进行了优化。将使用最新的模型迭代进行更新。	8,192 tokens	Up to Sep 2021
gpt-4-0314	2023 年 3 月 14 日的 gpt-4 快照。与 gpt-4 不同，该模型不会收到更新，并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。	8,192 tokens	Up to Sep 2021
gpt-4-32k	与基本 gpt-4 模式相同的功能，但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。	32,768 tokens	Up to Sep 2021
gpt-4-32k-0314	2023 年 3 月 14 日的 gpt-4-32 快照。与 gpt-4-32k 不同，此模型不会收到更新，并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。	32,768 tokens	Up to Sep 2021

对于许多基本任务，GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而，在更复杂的推理情况下，GPT-4 比之前的任何模型都更有能力。

⭐ 特定功能的模型

虽然目前最新的 gpt-3.5-turbo 模型针对聊天对话进行了优化，但是这个模型只适合适合传统的完成任务。原始 GPT-3.5 模型针对文本补全进行了优化。

试用 gpt-3.5-turbo 是了解 API 功能的好方法。在了解要完成的任务后，我们可以继续使用 gpt-3.5-turbo 或其他模型并尝试围绕其功能进行优化。

🌟 DALL·E 模型

DALL·E 是一个人工智能系统，可以根据自然语言的描述创建逼真的图像和艺术作品。目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代，具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。

DALL·E模型可以生成与文本描述相符的高质量图像，包括人物、动物、物体、场景等。与传统的图像生成模型相比，DALL·E模型可以生成更加丰富和多样化的图像，同时还可以生成符合逻辑和语义的图像。

DALL·E模型的训练数据来自于多个来源，包括网络上的图像、图像数据库以及自然语言描述。模型使用这些数据来学习如何将语言描述转换为图像，并在训练过程中不断优化模型的性能。

DALL·E模型可以应用于多个场景，如图像生成、视觉效果、设计和创意等领域。它可以为设计师、艺术家、广告公司等提供更加高效和创新的图像生成工具，同时也可以为普通用户提供更加丰富和多样化的图像内容。

可以通过实验室的界面或API进行试用，DALL·E室验室地址: https://labs.openai.com/ 可以在线体验DALLE的功能。

🌟 Whisper模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过 OpenAI 的 API 使用 whisper-1 模型名称获得。

目前，Whisper 的开源版本与通过 OpenAI 的 API 提供的版本之间没有区别。ChatGPT的Whisper模型是一种基于语音识别和自然语言处理技术的智能语音助手，可以帮助用户实现语音控制、智能问答和语音交互等功能。

Whisper模型采用了深度神经网络和语音识别技术，可以实现高质量的语音识别和语音转换。同时，模型还采用了自然语言处理技术，可以将语音转换为文本，并进行语义分析和理解，从而实现智能问答和语音交互。

Whisper模型可以应用于多个场景，如智能家居、智能客服、语音搜索等领域。它可以为用户提供更加便捷和高效的语音控制和交互方式，同时也可以为企业提供更加智能和人性化的客服和搜索服务。

提示:可以使用Whiper这种模型，为语音生成文本，这在视频生成字幕方面，语音识别等领域将会有很多相关应用。

🌟 Embeddings 模型

ChatGPT的Embeddings模型是一种自然语言处理技术，可以将自然语言文本转换为向量表示，从而实现自然语言文本的语义分析和文本分类等任务。

Embeddings模型采用了深度学习和神经网络技术，通过学习自然语言文本的上下文关系，将文本转换为向量表示。这种向量表示可以捕捉文本的语义信息和上下文关系，从而实现文本的语义分析和文本分类等任务。

Embeddings模型可以应用于多个场景，如文本分类、情感分析、实体识别等领域。它可以为企业提供更加精准和智能的文本分类和情感分析服务，同时也可以为用户提供更加个性化和智能的文本推荐和搜索服务。

总之，ChatGPT的Embeddings模型是一种强大的自然语言处理技术，可以将自然语言文本转换为向量表示，为文本分类、情感分析和实体识别等任务提供更加精准和智能的解决方案。

🌟 Codex 模型

Codex 模型是可以自然语言理解的和生成代码的 GPT-3 模型的后代。他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。

他们最擅长 Python，精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL，甚至 Shell 等十几种语言。

OpenAI目前提供两种 Codex 型号：

最新模型	描述	最大 TOKENS	训练日期
code-davinci-002	功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。除了补全代码，还支持在代码中插入补全。	8001 tokens	Up to Jun 2021
code-cushman-001	几乎与 Davinci Codex 一样强大，但速度稍快。这种速度优势可能使其成为实时应用程序的首选。	Up to 2048 tokens	Up to Jun 2021

Codex 模型在有限的测试版期间可以免费使用，并且会降低速率限制。

在此期间，只要符合 OpenAI 的使用政策，OPenAI非常欢迎也非常乐意为这些模型时提供任何反馈，并期待能与官方社区进行更多的互动。

🌟 Moderation 审核模型

还有一种特殊的模型，那就是 “审核模型” 。"审核模型"旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供了查找以下类别内容的分类功能：仇恨/威胁、自残、性/未成年人、暴力图片。

审核模型接受任意大小的输入，该输入会自动分解以修复模型特定的上下文窗口。

模型	描述
text-moderation-latest	最有能力的审核模型。精度会比稳定模型略高
text-moderation-stable	几乎与最新型号一样强大，但稍旧一些。