OpenAI又更新,自定义AI模型上线

news2024/11/28 6:48:03

OpenAI 4日表示,他们正在为fine-tuning API引入新的改进功能,以帮助开发者更好地控制fine-tuning的过程,并且宣布了利用OpenAI构建自定义模型的新途径。

为了减少延迟、提高准确性和降低成本,开发者可以使用各种技术来提高模型性能。无论是通过检索增强生成(RAG)扩展模型知识、通过微调定制模型行为,还是利用新的领域特定知识构建自定义训练模型,他们已经开发了一系列选项来支持客户的AI实现。今天,他们推出了新功能,以便开发者更好地控制API中的微调,并介绍更多与他们的AI专家团队和研究人员合作构建自定义模型的方法。

新的微调API功

他们在2023年8月推出了GPT-3.5的自助微调API。自那时起,成千上万的组织已经使用他们的API训练了数十万个模型。微调可以帮助模型深度理解内容,并增强模型对特定任务的现有知识和能力。他们的微调API还支持比单个提示中可以容纳的更多示例,以实现更高质量的结果,同时降低成本和延迟。微调的一些常见用例包括训练模型以在特定编程语言中生成更好的代码,以特定格式总结文本,或者根据用户行为制作个性化内容。

例如,全球招聘和匹配平台Indeed希望简化招聘流程。作为其中一部分,Indeed推出了一个功能,向求职者发送个性化推荐,根据他们的技能、经验和偏好突出显示相关职位。他们对GPT-3.5 Turbo进行了微调,以生成更高质量和更准确的解释。结果,Indeed能够通过减少提示中的令牌数量80%来改善成本和延迟。这使他们的规模从每月不到一百万条消息扩展到大约2000万条。

今天,他们推出了新功能,以便开发者更好地控制他们的微调作业,包括:

1.基于Epoch的检查点创建:在每个训练时期自动产生一个完整的微调模型检查点,从而减少后续重新训练的需求,特别是在过度拟合的情况下。

2.对比游乐场:一个新的并排游乐场用户界面,用于比较模型质量和性能,允许人类评估多个模型或微调快照对单个提示的输出。

3.第三方集成:支持与第三方平台的集成(本周开始与Weights and Biases),以让开发者将详细的微调数据分享到其余的堆栈中。

4.全面的验证指标:能够在整个验证数据集上计算像损失和准确性这样的指标,而不仅仅是一个样本批次,提供更好的模型质量洞察。

5.超参数配置:能够从仪表板中配置可用的超参数(而不仅仅是通过API或SDK)。

6.微调仪表板改进:包括配置超参数的能力,查看更详细的训练指标,并从先前的配置重新运行作业。

5ade9dc5a5095e29e29b73e3d4da2690.jpeg

扩展他们的定制模型计划

辅助微调

在去年十一月的DevDay上,他们宣布了一个定制模型计划,旨在与一组专门的OpenAI研究人员合作,为特定领域训练和优化模型。自那时以来,他们与数十个客户会面,评估他们的定制模型需求,并将他们的计划进化到进一步最大化性能的程度。

今天,他们正式宣布他们的辅助微调服务作为定制模型计划的一部分。辅助微调是与他们的技术团队共同努力,利用超出微调API的技术,例如更多的超参数和更多规模的各种参数高效微调(PEFT)方法。对于需要支持设置高效训练数据管道、评估系统以及定制参数和方法以最大化模型性能的组织来说,这将特别有帮助。例如,为了定制一个专家级的电信领域模型,初始重点是客户服务,韩国服务超过3000万订户的电信运营商SK Telecom与OpenAI合作微调了GPT-4,以提高其在韩语电信相关对话中的性能。在几个星期的过程中,SKT和OpenAI在电信客户服务任务中取得了有意义的性能改进——对话摘要质量提高了35%,意图识别准确性提高了33%,将微调模型与GPT-4进行比较,满意度得分从3.6提高到4.5(满分5分)。

定制训练模型

在某些情况下,组织需要从头开始训练一个定制的、理解他们业务、行业或领域的专用模型。完全定制训练的模型通过使用新的中间训练和后训练技术修改模型训练过程的关键步骤,从而从特定领域获得新知识。成功使用完全定制训练模型的组织通常拥有大量专有数据,即数百万个示例或数十亿个令牌,他们希望使用这些数据来教模型新的知识或复杂、独特的行为,以满足高度具体的用例需求。

例如,一家为律师提供的AI原生法律工具Harvey与OpenAI合作,为案例法创建了一个定制的大型语言模型。虽然基础模型在推理方面表现出色,但它们缺乏法律案例历史和其他法律工作所需的广泛知识。在测试了提示工程、RAG和微调之后,Harvey与他们的团队合作,为模型添加了所需的上下文深度,相当于价值100亿个令牌的数据。他们的团队修改了模型训练过程的每一个步骤,从领域特定的中间训练到定制后训练过程,并结合专家律师的反馈。结果模型在事实性回答方面实现了83%的增长,律师们在97%的情况下更喜欢定制模型的输出,而不是GPT-4。8a8dcb75ecfda3c5be003f2dd4139356.jpeg模型定制的未来展望

他们相信,未来绝大多数组织都将开发定制化模型,以满足其所在行业、业务或特定用例的需求。通过各种可用的技术构建定制模型,各种规模的组织都可以开发个性化模型,从而实现更有意义、更具体的AI实施影响。关键在于清晰地界定用例范围,设计和实施评估系统,选择正确的技术,并准备好随着时间的推移进行迭代,使模型达到最佳性能。

在OpenAI,大多数组织可以通过自助微调API快速看到有意义的结果。对于任何需要更深入微调其模型或为模型注入新的领域特定知识的组织,他们的定制模型计划可以提供帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1577875.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

特别详细的Spring Cloud 系列教程2:微服务网关gateway的启动

继上一篇:特别详细的Spring Cloud 系列教程1:服务注册中心Eureka的启动 在比较多的教程和书籍里,spring cloud的微服务网关用的Zuul。然而,zuul已经不被官方提倡,现在提倡用的是spring cloud gateway。因为gateway的整…

安达发|五金加工业生产计划与排产常见问题及解决方法

五金加工业生产计划与排产是确保制造流程顺畅、高效的关键。在实际操作中,企业可能会遇到多种问题,影响生产效率和产品质量。以下是一些常见问题及其解决方法: 1. 需求预测不准确: - 建立更为精确的需求预测模型,结…

uni-app项目创建方式

原生小程序与uni-app的区别 创建uni-app的方式 1.通过HBuilderX创建 2.通过命令行创建 vue3ts版:npx degit dcloudio/uni-preset-vue#vite-ts 项目名称 用vscode开发uni-app项目 安装命令:npm i -D types/wechat-miniprogram uni-helper/uni-app-typ…

软件设计师-基础知识科目-数据结构3

三、 数据结构: 时间复杂度: 背复杂度对应的代码。Tips:时间复杂度估算看最内层循环,如若没有循环和递归则为O(1)。 空间复杂度: 需要单独空间存储数据时使用。考点:非递归的空间…

希亦、石头、添可洗地机哪个更好用?资深家电测评师多角度横评

作为一个测评了许多洗地机的家电测评师,有很多人问我,他想入手一款适合自己的家用洗地机,不知道怎么购买到自己合适的,结果自己跑去搜索后发现为什么有的洗地机几百块钱就能入手,而有的又得几千元,买贵的怕…

CSS实现热门创作者排行榜(毛玻璃效果)

CSS实现热门创作者排行榜&#xff08;毛玻璃效果&#xff09; 效果展示 CSS 知识点 CSS 基础知识回顾filter 属性运用回顾 整体页面布局实现 <div class"container"><h3>Popular Creator Rank List</h3><!-- 用户列表容器 --><div cl…

NetSuite Saved Search-当前库存快照查询报表(二)

之前第一篇文章我们说明了&#xff0c;如何利用Saved Search来制作一个能够显示批次物料与非批次物料的Lot信息以及On Hand在手数量的“当前库存快照查询报表”&#xff0c;但是当用户提出“我们能否再加上批次物料的效期”需求时&#xff0c;我们原有的Saved Search并不能达到…

k8s知识

k8s是用于容器编排和管理的&#xff0c;docker或者ctr是k8s的运行时&#xff0c;k8s通过容器运行时来启动容器&#xff0c;容器启动需要镜像&#xff0c;镜像可以用docker构建&#xff0c;dockerfile就是用于自定义如何构建镜像&#xff0c;所以上面那套流水线就是先用dockerfi…

苍穹外卖Day10——总结10

前期文章 文章标题地址苍穹外卖Day01——总结1https://lushimeng.blog.csdn.net/article/details/135466359苍穹外卖Day02——总结2https://lushimeng.blog.csdn.net/article/details/135484126苍穹外卖Day03——总结3https://blog.csdn.net/qq_43751200/article/details/1363…

突破编程_前端_SVG(基础元素介绍)

1 rect 矩形 在 SVG 中&#xff0c;<rect> 元素用于创建圆形。 &#xff08;1&#xff09;基本语法 <rectx"x坐标"y"y坐标"width"宽度"height"高度"rx"可选&#xff1a;圆角x半径"ry"可选&#xff1a;圆角…

.net框架和c#程序设计第二次测试

一、实验内容 1、设计一个用户登录页面webform1.aspx&#xff0c;效果如下图所示&#xff1a; 2、点击webform1.aspx中“还未注册”连接进入register.aspx&#xff0c;注册页面效果如下图所示&#xff1a;点击用户注册信息到usershow.aspx页面&#xff0c;并显示注册的用户信息…

蓝牙学习十(扫描)

一、简介 从之前的文章中我们知道&#xff0c;蓝牙GAP层定义了四种角色&#xff0c;广播者&#xff08;Broadcaster&#xff09;、观察者&#xff08;Observer&#xff09;、外围设备&#xff08;Peripheral&#xff09;、中央设备&#xff08;Central&#xff09;。 之前的学习…

什么是LPO?

近年来&#xff0c;光通信产业的发展势头很猛。 在5G、宽带中国、东数西算等国家战略的持续刺激下&#xff0c;国内光通信技术取得了巨大突破&#xff0c;光基础设施也有了质的飞跃。 特别是今年&#xff0c;AIGC大模型爆火&#xff0c;智算和超算崛起&#xff0c;更是带动了…

VueDraggablePlus 支持 Vue2 和 Vue3 的拖拽组件

官网&#xff1a;https://alfred-skyblue.github.io/vue-draggable-plus/

Day 34:贪心 LeedCode 1005.K次取反后最大化的数组和 134. 加油站 135. 分发糖果

1005. K 次取反后最大化的数组和 给你一个整数数组 nums 和一个整数 k &#xff0c;按以下方法修改该数组&#xff1a; 选择某个下标 i 并将 nums[i] 替换为 -nums[i] 。 重复这个过程恰好 k 次。可以多次选择同一个下标 i 。 以这种方式修改数组后&#xff0c;返回数组 可…

rac数据库默认网关不通导致集群异常

集群CSSD进程reconfiguration完成&#xff0c;显示2个节点都在线。但ora.net1.network服务启动失败&#xff0c;且有依赖关系的资源随后启动失败并且已经达到上限。 查看两个节点的网络信息&#xff0c;发现两个节点的默认网关是不一致的。 修改故障节点网关 在RAC中&#xff0…

图表分析网页模版大数据可视化大屏电子沙盘合集

图表分析网页模版 大数据可视化大屏电子沙盘合集&#xff0c;项目基于html/css/js&#xff0c;包含行业&#xff1a; 智慧政务 智慧社区 金融行业 智慧交通 智慧门店 智慧大厅 智慧物流 智慧医疗 通用模板 大数据分析平台 项目包含功能 (部分)&am…

MongoDB快照(LVM)业务场景应用实战

MongoDB和LVM快照概述 MongoDB的重要性&#xff1a;MongoDB支持的灵活的文档模型&#xff0c;使其成为处理大量分散数据的理想选择&#xff0c;特别是在需要快速迭代和频繁更改数据结构的应用中。 LVM&#xff08;逻辑卷管理&#xff09;快照技术基本概念&#xff1a;LVM允许…

基于springboot+vue+Mysql的滴答拍摄影项目

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…

vue3前端加载动画 lottie-web 的简单使用案例

什么是 Lottie Lottie 是 Airbnb 发布的一款开源动画库&#xff0c;它适用于 Android、iOS、Web 和 Windows 的库。 它提供了一套从设计师使用 AE&#xff08;Adobe After Effects&#xff09;到各端开发者实现动画的工具流。 UED 提供动画 json 文件即可&#xff0c; 开发者就…