三、OpenAI所有模型介绍

news2024/11/18 19:31:33

在这里插入图片描述

1. 综述

OpenAI API开发了具有各种能力的模型。可以根据不同的需求选择不同的模型并进行精调。

模型描述
GPT-4、GPT-4 Turbo一组从GPT-3.5升级后的模型,能够生成自然语言和代码
GPT-3.5 Turbo一组从GPT-3.5升级后的模型,能够生成自然语言和代码
DALL.E能够根据自然语言提示词生成和编辑图片的模型
TTS一组可以将文本转换成自然语音语言的模型
Whisper可以将语音转换成文本的模型
Embeddings一组可以将文件转换成数字形式的模型
Moderation检测文本是否敏感或安全的审核模型
GPT base一组没有指令的情况下也能生成自然语言和代码的模型

其它开源模型:Point_E, Whisper, Jukebox, CLIP

gpt-3.5-turbo, gpt-4, gpt-4-turbo-preview是目前最新版本。可以通过调用API,响应中可获得版本信息。

2. GPT-4 GPT-4-Turbo

GPT-4是1个多模态的大语言模型(可以接受文本或图片,然后输出文本),对于解决相对较困难的问题超过之前所有的模型。并对聊天进行了优化。

模型描述上下文令牌
gpt-4-0125-preview最新的GPT-4模型旨在减少模型
无法完成任务的“偷懒”情况,返回最大4096令牌
128,000 tokens
gpt-4-turbo-preview当前指向gpt-4-0125-preview128,000 tokens
gpt-4-1106-previewGPT-4 Turbo模型的主要特征:改进指令跟随,JSON模式,
重复输出,并行函数调用等功能。返回最多4,096个输出令牌。
这个预览模型不适合应用于生产。
128,000 tokens
gpt-4-vision-preview除了具有GPT-4 Turbo功能外,GPT-4还具有理解图像的能力。
返回最多4,096个输出令牌。
这个预览模型不适合应用于生产。
128,000 tokens
gpt-4当前指向gpt-4-06138192tokens
gpt-4-0613gpt-4从2023年6月13日起的快照,改进了函数调用支持8192tokens

对于基本的任务,GPT-4和GPT-3.5模型没有显著的区别。然而,在更复杂的推理情况下,GPT-4超过以往的模型

多语言能力:
GPT-4比之前的大语言模型和到2023年为止最优秀的系统都要强(通常有特定的基准训练或手工工程)。在MMLU(Multi-Modal Large-scale Language Understanding)基准测试中,GPT-4不仅在英文方面大大优于现有的模型,而且在其他语言方面也表现出色。MMLU是一套涵盖57个科目的英文多选题

3. GPT-3.5-Turbo

GPT-3.5 Turbo模型可以理解和生成自然语言或代码,并且使用”聊天补全“API对聊天进行了优化,但也能很好地应用于非聊天任务。

模型描述上下文令牌
gpt-3.5-turbo-0125最新的GPT-3.5 Turbo模型在响应请求格式时具有更高的准确性,并修复了导致非英语语言函数调用的文本编码问题的错误。返回最多4,096个输出令牌16,385 tokens
gpt-3.5-turbo目前指向gpt-3.5-turbo-0613。gpt-3.5-turbo模型别名将于2月16日自动从gpt-3.5-turbo-0613升级为gpt-3.5-turbo-01254096 tokens
gpt-3.5-turbo-1106GPT-3.5 Turbo模型特点:改进指令跟随,JSON模式,可重复输出,并行函数调用等。返回最多4,096个输出令牌。16,385 tokens
gpt-3.5-turbo-instruct类似于GPT-3时代模型的功能。兼容旧的补全端点,但不是聊天补全4096 tokens

4. DALL·E

DALL·E是一个AI系统,可以通过自然语言的描述创造逼真的图像和艺术。目前提供3个功能:通过提示词生成指定大小的图片;编辑现有图片;生成同用户提供图片的关联图片
DALL·e3可通过图像API与DALL·e2一起使用

模型描述
dall-e-3最新的DALL·E型号于2023年11月发布
dall-e-2上一款DALL·E车型于2022年11月发布。DALL·E的第二次迭代,
具有比原始模型更真实,更准确,分辨率提高4倍的图像。

TTS(Text to Speech)

TTS是一种基于AI模型的技术,能够将文本转换成自然流畅的口语音频。我们提供两种不同的模型:ts-1针对实时文本到语音场景进行了优化,ts-1-hd则专注于提升语音质量。这些模型可以与Speech端点在Audio API中配合使用。

模型描述
tts-1最新的文本转语音模型,对速度进行了优化
tts-1-hd最新的文本转语音模型,对质量进行了优化

Whisper

Whisper是一个通用的语音识别模型。它由一个包含多种音频的大数据集训练而成,也是一种多任务模型,能够进行多语言语音识别、语音翻译和语言识别。Whisper v2大型模型目前可通过我们的API使用Whisper -1模型。

当前,开源的Whisper版本和通过API调用的版本没有区别。但调用进行了推理优化的、开放的API,比其它调用方式会更快。

Embeddings

Embedding是文本用数字表示,可用于衡量两段文本之间的相关性。Embedding对于搜索、聚类、推荐、异常检测和分类任务非常有用。

模型描述
text-embedding-3-large最强大的英语和非英语任务嵌入模型
text-embedding-3-small在第二代ada嵌入模型的基础上提高了性能
text-embedding-ada-002最强大的第二代嵌入模型,取代16个第一代模型

Moderation

内容审核模型(Moderation models)旨在检查内容是否符合OpenAI的使用政策。这些模型提供分类功能,用于查找以下类别的内容:仇恨、仇恨/威胁、自残、色情、色情/未成年人、暴力和暴力/血腥。
内容审核模型可以接受任意大小的输入,该输入会自动被切分为大小为4,096个token的块。当输入超过32,768个token时,会使用截断技术,这可能会罕见地导致一小部分token在审核检查中被省略。

向内容审核端点发送的每个请求的最终结果,显示为每个类别的最大值。例如,如果一个4K token的块在某个类别的得分为0.9901,而另一个块的得分为0.1901,那么API响应中将显示0.9901,因为它更高。

模型描述最大tokens
text-moderation-latest当前指向 text-moderation-007.32,768
text-moderation-stabletext-moderation-007.32,768
text-moderation-007所有类别中最强大的审核模型。32,768

GPT base

GPT基座模型可以理解并生成自然语言或代码,但不需要按照指令进行训练。这些模型可以替代原有的GPT-3基座模型,并使用传统的补全API。大多数客户应该使用GPT-3.5或GPT-4。

模型描述最大tokens
babbage-002替换GPT-3 ada和babbage基础模型16,384
davinci-002替换GPT-3居里和达芬奇基础模型16,384

模型数据使用

你的数据就是你的数据。
截至2023年3月1日,发送到OpenAI API的数据将不会用于训练或改进OpenAI模型(除非您明确选择加入)。选择加入的一个好处是,随着时间的推移,模型可能会在您的用例中变得更好。
为了帮助识别滥用,API数据可能会保留最多30天,之后将被删除(除非法律另有要求)。对于具有敏感应用程序的受信任客户,可以使用零数据保留。在零数据保留的情况下,请求和响应体不会被持久化到任何日志机制中,只按顺序存在于内存中。
请注意,此数据策略不适用于OpenAI的非api消费者服务,如ChatGPT或DALL·E 实验室。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1443109.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

搭建yum仓库服务器

安装 1.安装linux 1.1安装依赖 yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel 1.2下载 cd /opt/nginx wget http://nginx.org/download/nginx-1.25.3.tar.gz 1.3解压 tar -xvf nginx-1.25.3.tar.gz 1.4配置 cd nginx-1.25.3 ./configure --pre…

python高校实验室管理系统的django设计与实现81txp

技术栈 后端:python 前端:vue.jselementui 框架:django Python版本:python3.7 数据库:mysql5.7 数据库工具:Navicat 开发软件:PyCharm .本高校实验室管理系统采用python语言、MySQL数据库&…

python 爬虫篇(3)---->Beautiful Soup 网页解析库的使用(包含实例代码)

Beautiful Soup 网页解析库的使用 文章目录 Beautiful Soup 网页解析库的使用前言一、安装Beautiful Soup 和 lxml二、Beautiful Soup基本使用方法标签选择器1 .string --获取文本内容2 .name --获取标签本身名称3 .attrs[] --通过属性拿属性的值标准选择器find_all( name , at…

ad18学习笔记十八:如何放置丝印层敷铜?

我画板的时候,需要把板卡顶面丝印层的一个矩形区域,画成白色,但是这个区域内有好几个焊盘,丝印涂色的地方需要避开这几个焊盘,我觉得不能简单的在丝印层画一个矩形完事,最好让丝印层的这个区域,…

会声会影绿幕抠图操作方法 会声会影绿幕抠图有绿色残边 绿幕抠图视频有绿边怎么处理 抖音怎么剪辑视频 视频剪辑软件推荐

科幻片里真的存在怪兽吗?外太空的画面是直接将演员放入太空拍摄的吗?其实这些不切实际的画面是通过绿幕拍摄实现的。你只需要在绿幕前拍一段太空漫步的视频,再利用会声会影的抠图功能就能实现!如果你还不会绿幕抠图,我今天就手把…

【从Python基础到深度学习】6. IPython使用PyCharm代码调试与使用PEP

一、IPython交互式shell Python的解释器如今有多个语言的实现,包括: CPython ——官方版本的c语言实现 ython ——可以运行在Java平台 IronPython ——可以运行在.NET和Mono平台PyPy —— Python实现的,支持JIT即时编译 1.PyCharm中 2.Ubuntu终端中 s…

NSB_Login

1.访问界面 2.查看源码,发现提示爆破字典 3.下载字典 https://github.com/brannondorsey/naive-hashcat/releases/download/data/rockyou.txt4.burp进行爆破。(字典有点大,直接裂开。) 5.爆破成功,密码 scream &am…

C++入门篇(4)—— 类与对象(1)

目录 1.类的引入 2.类的定义 3.类的访问限定符 4.类的作用域 5. 类对象的存储方式 6. this指针 6.1 this指针的引入 6.2 this指针的特性 6.3有意思的面试题 1.类的引入 C语言struct 结构体中只能定义变量,而C中可以定义函数。 struct Date {void Init(int…

XSS-Lab

1.关于20关的payload合集。 <script>alert(1)</script> "><script>alert(1)</script> onclickalert(1) " onclick"alert(1) "><a href"javascript:alert(1)"> "><a HrEf"javascript:alert…

古典密码(5)

一、Porta密码--替换密码 1.介绍&#xff1a;Porta密码(Porta Cipher)是一个由意大利那不勒斯的医生Giovanni Battista della Porta发明的多表代换密码&#xff0c;Porta密码加密解密过程的是相同的。Vigenere 密码是具有 26 个字母的多字母密码&#xff0c;而 Porta 除了仅使…

Linux应用程序几种参数传递方式

大家好&#xff0c;今天给大家介绍Linux应用程序几种参数传递方式&#xff0c;文章末尾附有分享大家一个资料包&#xff0c;差不多150多G。里面学习内容、面经、项目都比较新也比较全&#xff01;可进群免费领取。 在Linux中&#xff0c;应用程序可以通过多种方式接收参数。以下…

JavaScript综合练习4

JavaScript 综合练习 4 1. 案例演示 2. 代码实现 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title&…

从源码学习访问控制符使用

从源码学习访问控制符使用 Java中的访问控制符 ​ 在Java中&#xff0c;有四个访问控制符&#xff1a;public、protected、default&#xff08;默认或缺省&#xff0c;不使用关键字&#xff09;和private。 ​ 它们的访问范围如下&#xff1a; public&#xff1a;公共访问权…

【数据分享】1901~2022中国1km逐月潜在蒸散发数据集

大家新年好啊&#xff01;今天给大伙儿分享的是1901~2022中国1km逐月潜在蒸散发数据集&#xff0c;收藏一下&#xff0c;过完年再看&#xff01;当然了&#xff0c;如果有问题的朋友&#xff0c;可以添加俺微信交流。 1 数据简介 数据集为中国逐月潜在蒸散发&#xff0c;空间分…

Redis核心技术与实战【学习笔记】 - 24.Redis 脑裂

简述 所谓脑裂&#xff0c;就是指在主从集群中&#xff0c;同时有两个主节点&#xff0c;它们都能接收写请求。而脑裂最直接的影响就是客户端不知道该往哪个主节点写入数据&#xff0c;结果就是不同的客户端会往不同的主机诶点上写入数据。而且&#xff0c;严重的话&#xff0…

尝新果未熟,探新途未尽。寒冬凝锐气,雷鸣蓄神力——小康师兄的2023年度总结

文章目录 一、前言二、工作总结2.1 我期望的&#xff0c;而公司想要的2.2 公司利益VS员工利益2.3 这个问题问得很有问题 三、生活总结3.1 一胎3.2 二胎 四、其他总结4.1 博客4.2 无人自助台球馆4.3 我要出书了 五、OKR 一、前言 又是一年除夕夜&#xff0c;万家灯火同团圆。 老…

15.3 Redis入门(❤❤❤❤)

15.3 Redis入门❤❤❤❤ 1. redis简介与配置1.1 简介1.2 Windows安装1.3 Linux安装1.4 守护进程方式启动1.5 客户端启动与使用1.6 指定生成日志 2. 使用2.1 客户端redis使用命令2.2 redis存储的数据类型1. String字符串类型2. Hash键值类型3. List列表类型4. Set与Zset集合类型…

力扣刷题之旅:进阶篇(四)—— 滑动窗口问题

力扣&#xff08;LeetCode&#xff09;是一个在线编程平台&#xff0c;主要用于帮助程序员提升算法和数据结构方面的能力。以下是一些力扣上的入门题目&#xff0c;以及它们的解题代码。 --点击进入刷题地址 引言&#xff1a; 在编程的世界里&#xff0c;滑动窗口问题是一种…

python 自我检测题--part 1

1. Which way among them is used to create an event loop ? Window.mainloop() 2. Suppose we have a set a {10,9,8,7}, and we execute a.remove(14) what will happen ? Key error is raised. The remove() method removes the specified element from the set. Th…

Python算法题集_两两交换链表中的节点

Python算法题集_两两交换链表中的节点 题24&#xff1a;两两交换链表中的节点1. 示例说明2. 题目解析- 题意分解- 优化思路- 测量工具 3. 代码展开1) 标准求解【四节点法】2) 改进版一【列表操作】3) 改进版二【三指针法】4) 改进版三【递归大法】 4. 最优算法 本文为Python算法…