LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

news2025/1/11 21:06:52

LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

导读:2023年8月22日,OpenAI官方发布,开发者现在可以使用自己的数据定制适用于其用例的GPT-3.5 Turbo模型。GPT-3.5 Turbo的微调现在已经可用,GPT-4的微调将在今年秋季推出。此更新使开发者能够定制模型,以便为其用例提供更好的性能,并在规模上运行这些定制模型。初步测试显示,经过微调的GPT-3.5 Turbo版本在某些狭窄任务上可以与基础GPT-4水平的能力相匹配,甚至表现更好。与我们所有的API一样,发送到微调API的数据由客户拥有,不会被OpenAI或任何其他组织用于训练其他模型。

目录

微调用例

微调步骤

步骤1,准备您的数据

步骤2,上传文件

步骤3,创建微调作业

步骤4,使用经过微调的模型

安全性

定价

更新后的GPT-3模型


博客文章地址:GPT-3.5 Turbo fine-tuning and API updates

微调指南地址:https://platform.openai.com/docs/guides/fine-tuning

微调用例

自GPT-3.5 Turbo发布以来,开发者和企业一直在寻求将模型定制为为其用户创建独特和差异化的体验的能力。通过此发布,开发者现在可以运行监督式微调,以使该模型在其用例中表现更佳。

在我们的私人测试版中,微调客户已经能够在常见用例中显著提高模型性能,例如:
>> 改进的可控性:微调使企业能够更好地遵循指示,例如使输出更简洁或始终以给定语言回复。例如,开发者可以使用微调来确保模型在使用德语提示时始终以德语回复。
>> 可靠的输出格式:微调提高了模型一致格式化响应的能力 - 这对于需要特定响应格式的应用程序(如代码补全或组合API调用)来说是至关重要的。开发者可以使用微调来更可靠地将用户提示转换为可与其自己的系统一起使用的高质量JSON片段。
>> 定制音调:微调是磨练模型输出的定性感觉(如其音调)的好方法,使其更符合企业品牌的声音。具有可辨识品牌声音的企业可以使用微调使模型更符合其音调的一致性。

除了提高性能外,微调还使企业能够在确保类似性能的情况下缩短提示。使用GPT-3.5 Turbo进行微调还可以处理4k个标记 - 是我们先前微调模型的两倍。早期测试者通过将指令微调为模型本身,将提示大小缩小了高达90%,加快了每个API调用的速度并降低了成本。

当与提示工程,信息检索和函数调用等其他技术结合使用时,微调效果最佳。请查看我们的微调指南以了解更多信息。对于使用函数调用和gpt-3.5-turbo-16k进行微调的支持将在今年秋季后期推出。

微调步骤

步骤1,准备您的数据

{
  "messages": [
    { "role": "system", "content": "You are an assistant that occasionally misspells words" },
    { "role": "user", "content": "Tell me a story." },
    { "role": "assistant", "content": "One day a student went to schoool." }
  ]
}

步骤2,上传文件

curl https://api.openai.com/v1/files \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F "purpose=fine-tune" \
  -F "file=@path_to_your_file" 

步骤3,创建微调作业

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "training_file": "TRAINING_FILE_ID",
  "model": "gpt-3.5-turbo-0613"
}'

一旦模型完成微调过程,它就可以立即在生产中使用,并具有与基础模型相同的共享速率限制。

步骤4,使用经过微调的模型

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "model": "ft:gpt-3.5-turbo:org_id",
  "messages": [
    {
      "role": "system",
      "content": "You are an assistant that occasionally misspells words"
    },
    {
      "role": "user",
      "content": "Hello! What is fine-tuning?"
    }
  ]
}'

我们还将在不久的将来推出微调用户界面,开发者可以更轻松地访问有关进行中的微调作业,已完成的模型快照等信息。

安全性

对我们来说,微调的部署非常重要。为了通过微调过程保留默认模型的安全功能,微调训练数据会通过我们的Moderation API和由GPT-4提供支持的调节系统进行传递,以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两部分:初始培训成本和使用成本:
>> 训练:$0.008 / 1K个标记
>> 使用输入:$0.012 / 1K个标记
>> 使用输出:$0.016 / 1K个标记

例如,对于一个训练文件为100,000个标记的gpt-3.5-turbo微调作业,经过3轮训练,预期成本为$2.40

更新后的GPT-3模型

在7月份,我们宣布原始的GPT-3基础模型(ada,babbage,curie和davinci)将于2024年1月4日关闭。今天,我们将babbage-002和davinci-002作为这些模型的替代品提供,可以作为基础模型或微调模型。客户可以通过查询Completions API来访问这些模型。

这些模型可以使用我们的新API端点/v1/fine_tuning/jobs进行微调。此新端点提供分页和更多的可扩展性,以支持微调API的未来发展。从/v1/fine-tunes转换为更新的端点非常简单,更多详细信息可以在我们的新微调指南中找到。这会停用旧的/v1/fine-tunes端点,将在2024年1月4日关闭。

基础模型和微调GPT-3模型的定价如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/945509.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图的四种存储方式

图片来源:王道数据结构第六章 目录 邻接矩阵法 不带权的 带权的图 邻接矩阵法的性能分析 链接 对阵矩阵的压缩存储 邻接矩阵法的性质 邻接表法 链接 树的孩子表示法 性能分析 对比邻接矩阵 十字链表法 性能分析 邻接多重表 邻接多重表存储无向图 四种…

后端Windows软件环境安装配置大全[JDK、Redis、RedisDesktopManager、Mysql、navicat、VMWare、finalshell、MongoDB...持续更新中]

文章目录 前言1. 安装 JDK2. 安装 Redis3. 安装 RedisDesktopManager(Redis可视化工具)4. 安装 Mysql5. 安装 navicat (Mysql可视化工具)6. 安装 VMWare7. 安装 finalshell (VMWare可视化工具)8. 安装 MongodDB9. 安装 maven 总结 前言 为了巩固所学的知…

WIFI模块8121N-UH的应用

随着科技的不断发展,无人机的应用领域正不断扩展并变得异常广泛。无论是无人机的起飞、航行、悬停还是返航等各个阶段,都依赖于高度精准的无线遥控技术。同时,无人机在飞行过程中需要实现无线视频传输,因此,如何确保无…

暴力递归转动态规划(二)

上一篇已经简单的介绍了暴力递归如何转动态规划,如果在暴力递归的过程中发现子过程中有重复解的情况,则证明这个暴力递归可以转化成动态规划。 这篇帖子会继续暴力递归转化动态规划的练习,这道题有点难度。 题目 给定一个整型数组arr[]&…

C#2010 .NET4 解析 json 字符串

下载Newtonsoft.Json.dll using System; using System.Collections.Generic; using System.Linq; using System.Text;using Newtonsoft.Json; using Newtonsoft.Json.Linq; using System; namespace ConsoleApplication1 {class Program{static void Main(string[] args){strin…

C++编辑修改PDF

PDFWriter是一个易于使用的C创建、修改PDF文档的库 1.创建一个PDF文件 #include #include “PDFWriter.h” int main() { std::cout << “Hello World!\n”; PDFWriter pdfWriter; int retpdfWriter.StartPDF(“D:\mytestwriterpdf.pdf”, ePDFVersion13); if (ret eS…

DC/DC开关电源学习笔记(二)开关电源的分类

&#xff08;二&#xff09;开关电源的分类 1.DC/DC类开关电源2.AC/DC变换器3.电路结构分类4.功率开关管分类5.电路拓扑分类 开关电源可分为 AC/DC和DC/DC两大类。 作为二次电源的DC/DC变换器现已实现模块化&#xff0c; 且设计技术及生产工艺在国内外均已成熟和标准化&#xf…

【USRP】调制解调系列6:16APSK、32APSK 、基于labview的实现

APSK APSK是&#xff0c;与传统方型星座QAM&#xff08;如16QAM、64QAM&#xff09;相比&#xff0c;其分布呈中心向外沿半径发散&#xff0c;所以又名星型QAM。与QAM相比&#xff0c;APSK便于实现变速率调制&#xff0c;因而很适合目前根据信道及业务需要分级传输的情况。当然…

基于白冠鸡算法优化的BP神经网络(预测应用) - 附代码

基于白冠鸡算法优化的BP神经网络&#xff08;预测应用&#xff09; - 附代码 文章目录 基于白冠鸡算法优化的BP神经网络&#xff08;预测应用&#xff09; - 附代码1.数据介绍2.白冠鸡优化BP神经网络2.1 BP神经网络参数设置2.2 白冠鸡算法应用 4.测试结果&#xff1a;5.Matlab代…

【ES6】Getter和Setter

JavaScript中的getter和setter方法可以用于访问和修改对象的属性。这些方法可以通过使用对象字面量或Object.defineProperty()方法来定义。 以下是使用getter和setter方法的示例&#xff1a; <!DOCTYPE html> <script>const cart {_wheels: 4,get wheels(){retu…

1239. 串联字符串的最大长度;2826. 将三个组排序;2563. 统计公平数对的数目

1239. 串联字符串的最大长度 核心思想&#xff1a;递归&#xff0c;选或者不选&#xff0c;定义dfs(i&#xff0c;pre)表示从i-n的满足要求的arr中选择字符串串联所能获得的最大长度为dfs(i,pre)&#xff0c;pre表示已经选过的字符串所组成的集合。然后就有两种情况选&#xf…

2023年天津市大学软件学院专升本报名考试人数

2023年天津市大学软件学院专升本科五校联合招生考试报名人数、参加考试人数、录取人数和录取率多少&#xff0c;请看下图详细说明

腾讯云学生服务器申请、学生认证入口及学生机价格表

腾讯云学生服务器申请、学生认证入口及学生机价格表&#xff0c;学生机申请流程&#xff0c;腾讯云学生服务器优惠活动&#xff1a;轻量应用服务器2核2G学生价30元3个月、58元6个月、112元一年&#xff0c;轻量应用服务器4核8G配置191.1元3个月、352.8元6个月、646.8元一年&…

Linux知识点 -- 网络基础(一)

Linux知识点 – 网络基础&#xff08;一&#xff09; 文章目录 Linux知识点 -- 网络基础&#xff08;一&#xff09;一、网络发展二、协议1.OSI七层模型2.TCP/IP五层&#xff08;或四层&#xff09;模型 三、网络传输基本流程1.局域网中的两台主机通信流程2.跨网段的两台主机间…

JOJO的奇妙冒险

JOJO,我不想再做人了。 推荐一部动漫 JOJO的奇妙冒险 荒木飞吕彦创作的漫画 《JOJO的奇妙冒险》是由日本漫画家荒木飞吕彦所著漫画。漫画于1987年至2004年在集英社的少年漫画杂志少年JUMP上连载&#xff08;1987年12号刊-2004年47号刊&#xff09;&#xff0c;2005年后在集英…

盖革计数管——核辐射测量仪核心部件

一&#xff1a;外形尺寸(最大值) 1、直径6.2mm 2、长度56mm 二&#xff1a;参数 1、起始计数电压:≦350V 2、坪区范围&#xff1a;380—480V 3、坪区范围斜率&#xff1a;≦15&#xff05;/100V 4、工作温度范围:-40℃—55℃ 5、放电电压:550V 6、死时间:20us 7、推荐工作电压4…

信息系统项目管理师(第四版)教材精读思维导图-第六章项目管理理论

请参阅我的另一篇文章&#xff0c;综合介绍软考高项&#xff1a; 信息系统项目管理师&#xff08;软考高项&#xff09;备考总结_计算机技术与软件专业技术_铭记北宸的博客-CSDN博客 本章思维导图PDF格式 本章思维导图XMind源文件 目录 6.1 PMBOK的发展 6.2 项目基本要素 6.3…

51社区滑块验证码

url aHR0cHM6Ly9wYXNzcG9ydC41MS5jb20vP2dvdXJsPWh0dHBzOi8vd2FuLjUxLmNvbS92dWUvaW5kZXg 接口分析 圈起来的两个接口&#xff0c;一个拿滑块&#xff0c;一个验证。 参数分析 没用特别难的加密 验证识别 需要注意的是&#xff0c;我们先拿到的图片是混乱的&#xff0c;需…

人员闯入检测告警算法

人员闯入检测告警算法通过yolov5网络模型识别检测算法&#xff0c;人员闯入检测告警算法对未经许可或非法进入的人员进行及时识别告警&#xff0c;确保对危险区域的安全管理和保护。YOLO系列算法是一类典型的one-stage目标检测算法&#xff0c;其利用anchor box将分类与目标定位…