价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

news2024/12/25 9:24:39

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

OpenAI 今日推出了一款名为 GPT-4o Mini 的新模型,这款模型较轻便且成本更低,旨在为开发者提供一个经济实惠的选择。与完整版模型相比,GPT-4o mini 在成本效益方面表现卓越,价格仅为每百万输入 tokens 15 美分和每百万输出 tokens 60 美分,比之前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜超过 60%。这种经济实惠的定价使得更多的应用程序能够负担得起 AI 技术,预计将大大扩展 AI 应用的范围。

使用 OpenAI 的模型构建应用程序可能会产生巨额费用,许多开发者因此望而却步,转而选择谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 等更便宜的模型。为此,OpenAI 进入了轻量级模型市场。OpenAI 的 API 平台产品负责人 Olivier Godement 在接受媒体采访时表示:“我认为 GPT-4o Mini 真正体现了 OpenAI 使 AI 更广泛可及的使命。如果我们希望 AI 能惠及世界的每一个角落、每一个行业、每一个应用,我们就必须让 AI 更加实惠。”

从今天开始,ChatGPT 免费版、Plus 版和团队计划的用户可以使用 GPT-4o Mini 代替 GPT-3.5 Turbo,企业用户将在下周获得访问权限。这意味着 ChatGPT 用户将不再能使用 GPT-3.5,但开发者仍可以通过 API 使用它,如果他们不想切换到 GPT-4o Mini。Godement 表示,GPT-3.5 将在某个时间点从 API 中退役,具体时间尚未确定。

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

具有卓越文本智能和多模态推理的小型模型

新模型不仅支持文本,还支持 API 中的视觉功能,未来还将处理视频和音频等多模态输入和输出。凭借这些能力,GPT-4o Mini 可以用于理解旅行行程并提供建议等更复杂的虚拟助手功能。然而,该模型主要用于简单任务,因此没有人会真正用它来廉价地构建类似 Siri 的助手。

GPT-4o mini 在学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,无论在文本智能还是多模态推理方面都表现出色,并支持与 GPT-4o 相同的语言范围。它在函数调用方面表现优异,能让开发者构建从外部系统获取数据或采取行动的应用程序,并且相比 GPT-3.5 Turbo,长上下文性能有所提升。

在测量大规模多任务语言理解(MMLU)测试中,GPT-4o Mini 取得了 82% 的得分。这项基准考试包括 57 个学科的约 16000 道选择题。相比之下,GPT-3.5 的得分为 70%,GPT-4o 为 88.7%,而谷歌声称其 Gemini Ultra 创下了 90% 的最高得分。竞争模型 Claude 3 Haiku 和 Gemini 1.5 Flash 分别得分 75.2% 和 78.9%。然而,研究人员对这些基准测试持谨慎态度,因为各家公司进行测试的方式略有不同,分数难以直接比较。此外,AI 可能会在其数据集中包含这些答案,从而让它“作弊”。

对于渴望以低成本构建 AI 应用的开发者来说,GPT-4o Mini 的推出为他们提供了另一种工具。OpenAI 让金融科技初创公司 Ramp 测试了该模型,使用它构建了一个提取收据费用数据的工具,用户可以上传收据的照片,模型会自动整理信息。电子邮件客户端 Superhuman 也测试了 GPT-4o Mini,并用它创建了电子邮件回复的自动建议功能。

这款新模型的目标是为开发者提供一种轻量级且廉价的工具,帮助他们创建无法负担更大、更昂贵模型的应用和工具。许多开发者会选择 Claude 3 Haiku 或 Gemini 1.5 Flash,而不是支付运行最强大模型之一所需的高昂计算成本。

至于为什么 OpenAI 花了这么久的时间才推出这个模型,Godement 表示,这是“纯粹的优先级问题”,因为公司专注于创建更大更好的模型,如 GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI 发现开发者渴望使用更小的模型,因此公司决定现在是投资资源构建 GPT-4o Mini 的时机。

内置安全措施

GPT-4o mini 继承了 GPT-4o 的安全措施,确保在开发过程中的每一步都强化安全性。从预训练阶段开始,OpenAI 就过滤掉仇恨言论、成人内容和垃圾信息等不希望模型学习或输出的内容。在后训练阶段,通过人类反馈强化学习(RLHF)等技术,使模型的行为与政策保持一致,提高模型响应的准确性和可靠性。

GPT-4o mini 具有与 GPT-4o 相同的安全缓解措施,这些措施通过自动和人工评估进行了仔细评估。来自社会心理学和虚假信息等领域的 70 多位外部专家测试了 GPT-4o,以识别潜在风险,OpenAI 已经解决了这些问题,并计划在即将发布的 GPT-4o 系统卡和准备得分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

此外,GPT-4o mini 还首次在 API 中应用了指令层级方法,增强了模型抵御越狱、提示注入和系统提示提取的能力,确保模型响应的可靠性和安全性。

可用性和未来展望

GPT-4o mini 现已在 Assistants API、Chat Completions API 和 Batch API 中上线。开发者可以通过支付每百万输入 tokens 15 美分和每百万输出 tokens 60 美分的费用,使用这一新型模型。在 ChatGPT 平台上,Free、Plus 和 Team 用户今天起可以使用 GPT-4o mini,取代 GPT-3.5,企业用户也将在下周开始访问。

OpenAI 承诺在未来继续推动 AI 技术的普及和成本降低。自 2022 年推出能力较低的 text-davinci-003 模型以来,GPT-4o mini 的每个 token 成本已下降了 99%。OpenAI 设想未来模型将无缝集成到每个应用程序和网站中,推动 AI 应用更高效、更经济地发展。​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1936715.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

喜报!极限科技再获国家发明专利:《一种超大规模分布式集群架构的数据处理方法》,引领大数据处理技术创新

近日,极限数据(北京)科技有限公司(简称:极限科技)传来喜讯,公司再次斩获国家发明专利授权。这项名为"一种超大规模分布式集群架构的数据处理方法"的专利(专利号&#xff1…

html+canvas 实现签名功能-手机触摸

手机上的效果图 需要注意&#xff0c;手机触摸和鼠标不是一个事件&#xff0c;不能通用&#xff0c;上一篇是关于使用鼠标的样例 相关代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewpo…

[Vulnhub] MERCY SMB+RIPS-LFI+Tomcat+Ports-Knocking+Timeclock权限提升

信息收集 IP AddressOpening Ports192.168.101.151TCP:80,22,53, 110, 139, 143, 445, 993, 995, 8080 $ $ nmap -p- 192.168.101.151 --min-rate 1000 -sC -sV PORT STATE SERVICE VERSION 53/tcp open domain ISC BIND 9.9.5-3ubuntu0.17 (Ubuntu Linux) …

主从复制 哨兵服务 数据类型 持久化

配置主从复制 一主多从结构 配置一主一从结构 修改配置文件 配置salve服务器 配置带验证的主从复制 查看密码&#xff0c;默认redis服务没有密码 192.168.88.61:6379> config get requirepass 设置密码 192.168.88.61:6379> config set requirepass 123456 输入密码…

分享一个 .NET EF 6 扩展 Where 的方法

前言 Entity Framework 6&#xff08;EF 6&#xff09;中的 Where 方法用于筛选数据库中的数据并返回符合条件的结果&#xff0c;但 Where 方法只能进行简单的筛选条件&#xff0c;例如相等、大于、小于等简单条件&#xff0c;如果需要处理更复杂的逻辑条件&#xff0c;则需要…

【Linux服务器Java环境搭建】011在linux中安装Nginx,以及停止或启动Nginx服务

系列文章目录 【Linux服务器Java环境搭建】 前言 又到了周五晚上了&#xff0c;最近工作上有些忙&#xff0c;忙于一个需求频繁变更的项目&#xff0c;都快吐血了&#xff0c;懂得都懂&#xff0c;哈哈&#xff0c;正好有时间了&#xff0c;继续写系列【Linux服务器Java环境搭…

我去,怎么http全变https了

项目场景&#xff1a; 在公司做的一个某地可视化项目。 部署采用的是前后端分离部署&#xff0c;图片等静态资源请求一台minio服务器。 项目平台用的是http 图片资源的服务器用的是https 问题描述 在以https请求图片资源时&#xff0c;图片请求成功报200。 【现象1】: 继图…

设计模式11-原型模式

设计模式11-原型模式 写在前面对象创建模式典型模式原型模式动机结构代码推导应用特点要点总结 原型模式与工厂方法模式对比工厂方法模式原型模式什么时候用什么模式 写在前面 对象创建模式 通过对象创建模式绕开动态内存分配来避免创建过程中所导致的耦合过紧的问题。从而支…

【devops】gitlab 实现cicd 实践

本站以分享各种运维经验和运维所需要的技能为主 《python零基础入门》&#xff1a;python零基础入门学习 《python运维脚本》&#xff1a; python运维脚本实践 《shell》&#xff1a;shell学习 《terraform》持续更新中&#xff1a;terraform_Aws学习零基础入门到最佳实战 《k8…

AWS服务器购买:如何选择合适的AWS云服务器

在当今数字化时代,云计算已成为企业IT基础设施的重要组成部分。作为全球领先的云服务提供商之一,亚马逊网络服务(AWS)提供了丰富多样的云服务器选项。然而,面对众多选择,如何为您的业务需求挑选最合适的AWS云服务器呢?我们结合九河云的分析来给你解答。 1. 明确业务需求 首先…

前端Vue项目中腾讯地图SDK集成:经纬度与地址信息解析的实践

在前端开发中&#xff0c;我们经常需要将经纬度信息转化为具体的地址信息&#xff0c;这对于定位、地图展示等功能至关重要。Vue作为现代前端框架的代表&#xff0c;其组件化开发的特性使得我们能够更高效地实现这一功能。本文将介绍如何在Vue项目中集成腾讯地图SDK&#xff0c…

vue3 + antd vue 纯前端 基于xlsx 实现导入excel 转 json,将json数据转换XLSX并下载(下载模版)

一、导入 0、关键代码 // 安装插件 npm i xlsx/yarn add xlsx // 导入xlsx import * as XLSX from xlsx; 点击提交的时候才整理数据。上传的时候文件保存在 state.form.file[0] 中的 // 定义字段映射关系 const fieldMap {sheet2json: {技能名称: skill_name,技能等级: …

【中项】系统集成项目管理工程师-第2章 信息技术发展-2.2新一代信息技术及应用-2.2.1物联网与2.2.2云计算

前言&#xff1a;系统集成项目管理工程师专业&#xff0c;现分享一些教材知识点。觉得文章还不错的喜欢点赞收藏的同时帮忙点点关注。 软考同样是国家人社部和工信部组织的国家级考试&#xff0c;全称为“全国计算机与软件专业技术资格&#xff08;水平&#xff09;考试”&…

iPhone手机上备忘录怎么设置字数显示

在日常生活和工作中&#xff0c;我经常会使用iPhone的备忘录功能来记录一些重要的想法、待办事项或临时笔记。备忘录的便捷性让我可以随时捕捉灵感&#xff0c;但有时候&#xff0c;我也会苦恼于不知道自己记录了多少内容&#xff0c;尤其是在需要控制字数的时候。 想象一下&a…

mysql的B+树索引结构介绍

一、B树 特性&#xff1a; 所有的叶子结点中包含了全部关键字的信息&#xff0c;非叶子节点只存储键值信息&#xff0c;及指向含有这些关键字记录的指针&#xff0c;且叶子结点本身依关键字的大小自小而大的顺序链接&#xff0c;所有的非终端结点可以看成是索引部分&#xff0…

达梦数据库 MPP集群搭建(带主备)

MPP集群搭建&#xff08;带主备&#xff09; 1.背景2.操作内容和要求3. 具体步骤3.1 搭建过程3.1.1 集群搭建3.1.2 准备工作3.1.2.1 初始化3.1.2.2 备份数据库 3.1.3 配置主库EP013.1.3.1 配置dm.ini3.1.3.2 配置dmmal.ini3.1.3.3 配置dmarch.ini3.1.3.4 配置dmmpp.ctl3.1.3.5 …

Linux NFS服务搭建及使用

一、NFS 服务器介绍 nfs &#xff08; Network File System &#xff09;即网络文件系统&#xff0c;其基于 UDP/IP使用 nfs 能够在不同计算机之间通过网络进行文件共享&#xff0c;能使使用者访问网络上其它计算机中的文件就像在访问自己的计算机一样。 二、NFS 服务器的特点 …

【Java】用队列实现栈 力扣

文章目录 题目链接题目描述思路代码 题目链接 225.用队列实现栈 题目描述 思路 一个队列在模拟栈弹出元素的时候只要将队列头部的元素&#xff08;除了最后一个元素外&#xff09; 重新添加到队列尾部&#xff0c;此时再去弹出元素就是栈的顺序了。 代码 class MyStack {Q…

C++那些事之依赖注入

C那些事之依赖注入 最近星球里面有个小伙伴让更新一下依赖注入&#xff0c;于是写出了这篇文章&#xff0c;来从实际的例子讲解&#xff0c;本文会讲解一些原理与实现&#xff0c;完整的实现代码懒人版放在星球中&#xff0c;我们开始正文。 大纲&#xff1a; 直接依赖接口依赖…

什么是长效住宅IP?

长效住宅IP的定义 长效住宅IP&#xff0c;简而言之&#xff0c;是指长期稳定、非动态更换的住宅网络IP地址。这类IP地址通常由互联网服务提供商&#xff08;ISP&#xff09;分配给居民家庭用户&#xff0c;用于上网、网络通信等日常网络活动。与传统的动态IP相比&#xff0c;长…