【GPT-4 Turbo】、功能融合:OpenAI 首个开发者大会回顾

news2024/10/7 10:11:22

GPT-4 Turbo、功能融合:OpenAI 首个开发者大会回顾

就在昨天 2023 年 11 月 6 日,OpenAI 举行了首个开发者大会 DevDay,即使作为目前大语言模型行业的领军者,OpenAI 卷起来可一点都不比同行差。

OpenAI 在大会上不仅公布了新的 GPT-4 Turbo 模型,还推出了几项从业务角度看可能冲击其他 AI 公司市场份额的服务,并对现有功能进行了升级和融合,基本上很多做着类似功能的第三方项目和公司都能感受到来自 OpenAI 的威胁。

接下来我就给大家总结一下这次 OpenAI 开发者大会的主要内容,每项内容还会根据我自己的经验给大家进行一些简单的解读。

新的模型:GPT-4 Turbo

首先,大会最重磅的内容自然是发布新的模型 GPT-4 Turbo。不同于 GPT-3.5 到 GPT-4 更新换代般的升级,OpenAI 最近专注于打磨现有的功能,GPT-4 Turbo 的主要更新还是将之前截止 2022 年的知识库更新到现在的 2023 年 4 月,以及支持最大 128K Token 的输入。

新的 API 价格

按照 OpenAI 的说法,现在的 GPT-4 Turbo 不仅更新了知识库,而且最高支持 300 页文档作为输入,是之前 8K Token 限制的 16 倍,而且超长文档输入内容处理的准确性也会比前辈有所提高。之前各类大语言模型最热门的第三方项目就是花式处理超长文档类的应用服务,甚至另一个热门大模型 Claude2.0 最大的卖点就是能够输入 100K Token 的超长文档。

GPT-4 能够处理更长内容的 Advanced Data Analysis(高级数据分析,效果可以查看我之前的文章)功能推出后,这些项目已经明显受到影响,现在 GPT-4 Turbo 一出,这些模型和项目剩下能够与其竞争的点就只剩下更低的价格或者直接免费了。

除此以外,GPT-4 Turbo 性能和处理速度比起前辈也有所提升,所以 OpenAI 也放宽了每分钟输入和输出的 Token 限制,由于性能的提升 API 调用价格也随之下降,输入和输出价格分别只有之前的 1/3 和 1/2(包括即将推出的 gpt-4-1106-preview 模型),虽然比起 GPT-3.5 还是要贵上不少,但对于必须调用的商业项目或者第三方项目来讲还是一个很大的利好,毕竟 GPT-4 的效果比起 GPT-3.5 要好上太多。

更低的 API 价格,连 GPT 3.5 都更便宜了

可重现的输出

另外这次 GPT-4 Turbo 模型还有一个值得关注的新特性,那就是在一定时间之内可以实现可重现输出 —— 也就是相同的问题每次都会得到一模一样的答案。

之前阻碍很多人把 GPT 真正用于自己的工作或者项目里面的一大因素就是它随心所欲的输出,即使是相同的问题,每次都有可能得到不同的答案,不同的格式也很难将 GPT 融入到工作流程或者程序里面,现在 GPT-4 Turbo 有了一定程度的复现能力(虽然目前还是 Beta 中的 Beta),还能返回某段时间内不同生成内容的概率,这个特性对于商业用户开发人员来讲要比其他更新来的更加实用。

功能融合

最后是一个用户体验上的改进,也能极大增加 ChatGPT 的能力,那就是将目前分开的功能融合在一起。目前 GPT-4 有高级数据分析、联网搜索、AI 画图和插件等功能,但是用户每次只能选择其中的一个,不同功能之间也无法互相调用。

现在 OpenAI 宣布即将把这些功能都整合到一起,用户只需要在使用的时候用自然语言说出自己想要调用的功能,或者直接说出自己的需求,ChatGPT 就会根据需求或者在合适的时候自动调用对应的功能,这极大拓宽了用户使用 ChatGPT 的使用场景和灵活度,像是之前没有办法实现的「搜索信息然后生成图片」或者「在代码解释器中的库能够联网」等需求现在都可以轻松实现。

功能融合后的界面

JSON 模式和函数调用(Function Calling)优化

JSON 是一种特定格式表示的数据结构,用来方便开发者和程序传递与处理数据,形式如 {"项目 A 的名称": "项目 A 的内容", "项目 B 的名称": "项目 B 的内容"}

对于想要用 GPT 进行正儿八经项目和需求的公司和个人,这次 OpenAI 宣布的更新也是十分实用。首先新模型在必须遵守指令的任务上表现会更好更稳定,比如能够比之前输出更加固定的指定内容(如 JSON 和特殊排版),接着 OpenAI 还在 API 调用的参数上添加了新的 JSON 模式,能够保证 GPT 始终会按要求返回格式正确的 JSON,这让更多用户能够更放心地选择使用 GPT 执行任务,也不用每次都在 Prompt 里面反复提醒 GPT 一定要返回 JSON 格式了。JSON 模式在 GPT-4 和 GPT-3.5 上都可以启用(包括未来发布的 1106 版本模型)。

JSON 模式

另外 OpenAI 在另一个常见的大语言模型与项目结合方式 —— Function Calling 上也做出了优化,Function Calling 函数调用可以让用户把自己项目上的功能和特性「介绍」给 GPT,接着 GPT 就能在合适的时机调用这些功能并从用户自己的项目上获取到返回信息。

目前 GPT-4 的插件商店里面的插件就是使用这个特性。本次 GPT-4 Turbo 不仅优化了准确性,提高调用函数的正确率以及调用时机的正确率,而且能够在一次对话中同时调用多个函数(目前每次只能调用一个),这极大节省了每次运行的时间和资源。之后即使普通用户也能感受到调用插件时明显更快错误率更低。

函数调用优化

这两个功能更新明显是面向更加专业的用户,让 GPT 在第三方项目和商业产品上表现更好更稳定,这样也能极大提升普通用户和公司在自己的项目里面使用大语言模型的动力,顺便把第三方的工具框架干掉(微软:???)。

自定义模型和文档库

OpenAI 给专业用户和商业公司的惊喜还不止这些,这次发布会还发布了一卡车的工具,一个新的 Assistants API 以及微调模型的权限来帮助有更高需求的用户和公司打造专属于它们的模型。

首先是现在使用 Assistants API 能够调用 GPT 上几乎所有的新功能,Assistants API 本身就是一个特别训练的 AI,可以让你用自然语言调用包括高级数据分析、函数调用、AI 画图、图片识别、语音生成和插件等等几乎所有 OpenAI 目前能够提供的功能。

用户还可以调用 Assistants API 直接来检索自己的数据库和文档库,甚至不需要将数据库和文档库矢量化就可以将自己的数据转化为 GPT 的知识库。当然,OpenAI 反复强调所有的用户数据都不会用于训练自己的模型,并且会定时删除。这项功能不用等,现在你就可以直接进入 OpenAI Assistants Playground 进行试用。

用户可以把自己的文档投喂给 Assistants API

数据安全声明

修改甚至完全定制模型

OpenAI 还宣布会制作一个新的微调界面,让开发者可以微调 GPT-3.5 甚至 GPT-4 模型。另外大佬公司们如果有特别大的项目(几十亿 Token 以上)OpenAI 也不介意多赚点钱,针对金主的特定领域和需求训练定制的 GPT-4,包括修改模型训练过程的每个步骤,从执行额外的特定领域预训练,到运行为特定领域量身定制的自定义 RL 后训练过程。

客户将拥有对其自定义模型的独占访问权限。根据 OpenAI 现有的企业隐私政策,自定义模型不会提供给其他客户或与其他客户共享,也不会用于训练其他模型,提供给 OpenAI 用于训练自定义模型的专有数据也不会在任何其他对话中重复使用。

按照 OpenAI 的说法,这个功能只会开放给很有限的公司和组织,而且非常昂贵。低情商说法就是不是真正的富哥和大佬就不要点这个申请链接。

GPTs:属于每个人的模型

当然,普通用户也可以在某种程度上定制模型。OpenAI 在现有插件开发的基础上升级为 GPTs,插件商店也会升级为像是苹果应用商店一样的平台。

用户可以使用自然语言对 GPT 进行编程,给 GPT 指定一个特定的指令,或者特殊的知识,以及像是上面函数调用类似的与自己项目或者第三方服务结合的能力,这些编程是在模型之上的额外数据,所以不会像上面微调甚至定制模型那样深入。

好处是上手难度同样很低,加上 GPT 用自然语言就可以进行编程,OpenAI 还提供了专门负责创建插件的 AI 让用户使用自然语言创建自定义 GPT。未来可以想象每个用户都可以拥有一个专属于自己的 GPT,甚至能像是现在 Steam 创意工坊和虚幻引擎商店一样成为一个新产业。

版权盾

为了让用户和公司更加放心使用生成型人工智能产品,Google、Microsoft、Amazon 和 Adobe 这些拥有 AI 服务的大厂,都相继宣布为「陷入人工智能生成产品纠纷」的客户提供法律援助和相关费用报销。

虽然各家政策背后都有不少的条件和限制,比如:必须是企业用户、用途必须「商业上合理」、还有必须是大厂认为合理的情况下等等,但这已经成为一个趋势。

作为 AI 领域最大的大厂,OpenAI 现在也宣布跟进这个政策,推出 Copyright Shield—— 如果用户面临有关版权侵权的法律索赔,OpenAI 现在将介入保护客户并支付由此产生的费用,当然条件是仅适用于 ChatGPT Enterprise 和开发人员平台的正式发布功能。


通过虚拟卡 WildCard 的方式来升级 GPT 4.0 最快了,大概2分钟就可以升级完成, 而且升级 GPT 4.0 价钱也不贵,虚拟卡一年10美元,GPT4 每个月也才 20美元。如果你觉得 GPT 4.0 对你可能有帮助,那就赶快来升级吧!

ChatGPT4.0升级教程

所有功能都提供 API

现在 GPT-4 很多惊艳的功能都是只能在官方网页版或者客户端中体验,现在 OpenAI 给它们都做了对应的 API,包括视觉识别 GPT-4 Turbo With Vision,DALL·E 3 AI 画图以及谁听谁震惊的下一代语音合成框架 TTS。

提供 API 的功能

虽然目前这些 API 还要付费,价格比起同类产品往往也要贵一点。但也能看出 OpenAI 横扫 AI 领域的野望,而且目前看来它也有这个能力,这些功能绝大部分都比肩同类最好的产品,甚至视觉识别和语音合成这两方面在我体验后可以称之为「次世代」。

我认为不考虑价格的话,很可能其他产品甚至连和它对比的意义都没有。我强烈建议大家自己亲自体验一次,特别是语音合成效果特别惊艳,各种功能的体验也可以查看我之前的文章。

各种项目的价格

另外 OpenAI 还在不断进步,不仅要推出下一代的语音识别框架 WhisperV3,而且 DALL·E 3 还即将采用和 Stable Diffusion 一致的解释器 —— 这意味着两家的模型能够通用。这些 API 的提供和改进基本上能够影响到 AI 行业的每一家公司,这也是好事,更强更激烈的竞争最终还是能够带来更快的进步,以及对消费者来讲更高的性价比。

总结

以上就是 OpenAI 在首次开发者大会上发布的主要内容了,这次推出的所有更新和新功能基本上都在推进 GPT 在聊天以外的实际应用,并且以 GPT 为核心,打造更加丰富的生态和能力。可以看出 OpenAI 是非常想成为不仅是大语言模型,而是 AI 领域的 Top1,也非常想让 GPT 真正融入到这个领域的实际项目里,而不是只能作为一个聊天机器人。

AI 目前已经过了夺人眼球的阶段,现在 OpenAI 走在一条非常正确的道路上,放弃追求每代都必须有巨大提升,而是专注于让 GPT 更加可用,更加实用,更多能用,满足更多人的需求,让更多人真正能利用 AI 帮到自己,提升自己,才能在未来将人工智能变成如水电网般自然的基础设施。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1573239.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于单片机多模式多样式跑马灯系统仿真设计

**单片机设计介绍,基于单片机多模式多样式跑马灯系统仿真设计 文章目录 一 概要二、功能设计三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机多模式多样式跑马灯系统仿真设计是一个集硬件仿真、软件编程和灯光控制于一体的综合性项目。以下是对该设…

Quantinuum与微软携手突破:开创容错量子计算新纪元

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

SystemC入门之测试平台编写完整示例:带同步输出的多路选择器

内容&#xff1a;SystemC入门书中的简单测试平台编写示例。 模块文件编写 带锁存输出的4选1多路器模型。输出在信号clock的正跳变沿时刻被锁存。 sync_mux41.h文件 #include <systemc.h>SC_MODULE(sync_mux41) {sc_in<bool> clock, reset;sc_in<sc_uint<…

【开源语音项目OpenVoice](一)——实操演示

目录 一、前菜 1、Python选择 2、pip源切换 3、ffmpeg配置问题 4、VSCode添加Jupyter扩展 二、配置虚拟环境 1、下载源码 方法一 直接下载源码压缩包 方法二 使用git 1&#xff09;git加入鼠标右键 2&#xff09;git clone源码 2、VSCode出场 1&#xff09;创建pyth…

C#操作MySQL从入门到精通(5)——查询数据

前言 在和MySql数据库交互的过程中,查询数据是使用最频繁的操作,本文详细介绍了查询数据的各种操作,包括查询一列数据、 查询两列数据、查询所有列数据、查询不重复的数据、查询指定行数据,绝对是C#操作MySql数据库史上最详细教程,能够帮助小白快速入门以及将这些功能迅速…

闪站侠洗护管理系统,洗衣洗鞋小程序软件定制,干洗连锁店软件系统搭建;

闪站侠洗护管理系统&#xff0c;洗衣洗鞋小程序软件定制&#xff0c;干洗连锁店软件系统搭建&#xff1b; 为了让每一个洗衣洗鞋工厂与门店的连接更加高效便捷&#xff0c;送洗流程更加简单轻松&#xff0c;拽牛科技倾心打造洗衣洗鞋管理软件。我们的目标是通过高效和优质的服务…

栈的详解和例题(力扣有效括号)

感谢各位大佬的光临&#xff0c;希望和大家一起进步&#xff0c;望得到你的三连&#xff0c;互三支持&#xff0c;一起进步 个人主页&#xff1a;LaNzikinh-CSDN博客 收入专栏:初阶数据结构_LaNzikinh篮子的博客-CSDN博客 文章目录 前言一.什么是栈二.栈的实现三.例题&#xff…

爬取学习强国视频小示例

因为需要爬取的视频数量并不是很大&#xff0c;总共需要将131个视频下载下来&#xff0c;所以就直接去手动找找视频的地址和名称保存下来的。由于页面是动态加载的&#xff0c;所以我们无法在网站源码中直接找到视频的超链接。设想是可以用Selenium模拟浏览器点击进行动态加载获…

excel统计分析——多项式回归

参考资料&#xff1a;生物统计学 多项式回归属于单变量曲线回归&#xff0c;但其形式和求解方法与多元线性回归相似。多项式回归的数学模型为&#xff1a; 令&#xff0c;&#xff0c;&#xff0c;&#xff0c;则 由于X不可逆&#xff0c;两边同时乘以X得&#xff0c;&#xff…

《QT实用小工具·十五》多种样式的开关控件

1、概述 源码放在文章末尾 目前实现了三种样式的开关控件按钮&#xff0c;如下所示&#xff1a; 项目部分代码如下所示&#xff1a; #ifndef IMAGESWITCH_H #define IMAGESWITCH_H/*** 图片开关控件 * 1. 自带三种开关按钮样式。* 2. 可自定义开关图片。*/#include <QWid…

使用Android完成案例教学

目录 题目&#xff1a;完成在Android平台下2个玩家分别利用2个手机连接在同一局域网下通过滑动摇杆分别使红飞机和黄飞机移动的开发。&#xff08;全代码解析&#xff09; 题目&#xff1a;完成在Android平台下2个玩家分别利用2个手机连接在同一局域网下通过滑动摇杆分别使红飞…

利用native的方式实现跨线程调用

简介 在OpenHarmony应用开发实践中&#xff0c;经常会遇到一些耗时的任务&#xff0c;如I/O操作、域名解析以及复杂计算等。这些任务如果直接在主线程中执行&#xff0c;将会严重阻塞主线程&#xff0c;影响后续任务的正常流程&#xff0c;进而导致用户界面响应延迟甚至卡顿。…

基于沙漏 Tokenizer 的高效三维人体姿态估计框架HoT

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 摘要Abstract文献阅读&#xff1a;基于沙漏 Tokenizer 的高效三维人体姿态估计框架HoT1、研究背景2、提出方法3、模块详细3.1、什么是HoT3.2、HoT 框架3.3、Token 剪…

JS 利用 webcam访问摄像头 上传到服务器

webcam JS 较为详细的指南 定义标题 <!doctype html> <html> <head><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>How to capture picture from webcam with Webcam.js</title></…

【UnityRPG游戏制作】Unity_RPG项目之界面面板分离和搭建

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 秩沅 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a;Uni…

计算机视觉——基于傅里叶幅度谱文档倾斜度检测与校正

概述 在计算机视觉领域&#xff0c;处理文档数据时&#xff0c;OCR算法的性能往往会受到文档的倾斜度影响。如果文档在输入到模型之前没有经过恰当的校正&#xff0c;模型就无法期待模型能够提供准确的预测结果&#xff0c;或者模型预测的精度会降低。例如&#xff0c;在信息提…

python上传以及下载AWS S3上的文件

​ 免死金牌 由于本人平常是做NodeJS开发的&#xff0c;本次做的任务含有 Scheduled Job &#xff0c;所以选择了使用Python作为这次开发的语言&#xff0c;毕竟跑脚本还是这玩意适合。 其中有一个任务是要从S3上拉下一些文件来处理&#xff0c;处理完成后再push 上去的需求…

深入浅出 -- 系统架构之负载均衡Nginx动静分离

一、Nginx动静分离 动静分离应该是听的次数较多的性能优化方案&#xff0c;那先思考一个问题&#xff1a;为什么需要做动静分离呢&#xff1f;它带来的好处是什么&#xff1f; 其实这个问题也并不难回答&#xff0c;当你搞懂了网站的本质后&#xff0c;自然就理解了动静分离的重…

【学习分享】小白写算法之选择排序篇

【学习分享】小白写算法之选择排序篇 前言一、什么是选择排序算法二、选择排序算法如何实现三、C语言实现算法四、复杂度计算五、算法稳定性六、小结 前言 简单排序有三种&#xff0c;冒泡排序&#xff0c;插入排序和选择排序。这三种排序的算法算是入门级别的&#xff0c;打好…

torchvision中的数据集使用

torchvision中的数据集使用 使用和下载CIFAR10数据集 输出测试集中的第一个元素&#xff08;输出img信息和target&#xff09; 查看分类classes 打断点–>右键Debug–>找到classes 代码 import torchvisiontrain_set torchvision.datasets.CIFAR10(root"./data…