价格较低,功能最强?OpenAI 推出 GPT-4o mini,一个更小、更便宜的人工智能模型

news2024/9/21 16:20:25

OpenAI美东时间周四推出“GPT-4o mini”,入局“小而精”AI模型竞争,称这款新模型是“功能最强、成本偏低的模型”,计划今后整合图像、视频、音频到这个模型中。

OpenAI表示,GPT-4o mini 相较于 OpenAI 目前最先进的 AI 模型更加便宜且运行速度更快,今日起面向开发者以及通过 ChatGPT 网络和移动应用向消费者发布,企业用户将于下周获得访问权限。

据OpenAI介绍,GPT-4o mini 在涉及文本和视觉的推理任务中表现优于行业领先的小型 AI 模型。随着小型 AI 模型的改进,由于其速度和成本效益相较于大型模型(如 GPT-4 Omni 或 Claude 3.5 Sonnet)更具优势,开发者越来越青睐使用小型 AI 模型。它们是适用于高频率、简单任务的有用选择,这些任务需要开发者反复调用 AI 模型来执行。

GPT-4o mini 将取代 GPT-3.5 Turbo 成为 OpenAI 提供的最小模型。根据 Artificial Analysis 的数据,OpenAI 声称其最新的 AI 模型在 MMLU 推理能力评估中得分为 82%,而 Gemini 1.5 Flash 得分为 79%,Claude 3 Haiku 得分为 75%。在 MGSM 数学推理评估中,GPT-4o mini 得分为 87%,Flash 得分为 78%,Haiku 得分为 72%。

此外,OpenAI 表示,GPT-4o mini 的运行成本明显低于以往的尖端模型,比 GPT-3.5 Turbo 便宜超过 60%。目前,GPT-4o mini 支持 API 中的文本和视觉功能,并且 OpenAI 表示该模型未来还将支持视频和音频功能。

“为了让世界各地都能受益于 AI,我们需要让模型更具成本效益。”OpenAI 的产品 API 负责人 Olivier Godement 在接受 TechCrunch 采访时表示,“我认为 GPT-4o mini 是朝这个方向迈出的重要一步。”

对于基于 OpenAI API 构建的开发者,GPT-4o mini 的定价为每百万输入 tokens 15 美分,每百万输出 tokens 60 美分。该模型的上下文窗口为 128,000 tokens,大致相当于一本书的长度,其知识截止日期为 2023 年 10 月。

OpenAI 未透露 GPT-4o mini 的确切规模,但表示其大致与其他小型 AI 模型(如 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash)在同一层级。不过,OpenAI声称,根据在 LMSYS.org 聊天机器人领域的预发布测试,GPT-4o mini 比行业领先的小型模型更快、更具成本效益且更智能。早期的独立测试似乎证实了这一点。

“与同类模型相比,GPT-4o mini 非常快,平均输出速度为每秒 202 tokens。”Artificial Analysis 联合创始人 George Cameron 在给 TechCrunch 的一封电子邮件中表示,“这比 GPT-4o 和 GPT-3.5 Turbo 快 2 倍以上,对于包括许多消费者应用程序和使用 LLM 的代理方法在内的依赖速度的用例来说,是一个引人注目的选择。”

OpenAI 为 ChatGPT Enterprise 推出的新工具

另据报道,OpenAI 于周四宣布了针对企业客户的新工具。在一篇博文中,OpenAI 宣布了 Enterprise Compliance API,帮助金融、医疗、法律服务和政府等高度监管行业的企业符合日志和审计要求。

OpenAI表示,这些工具将允许管理员审计和采取行动处理其 ChatGPT Enterprise 数据。该 API 将提供时间戳记录的交互,包括对话、上传的文件、工作区用户等。

OpenAI 还为管理员提供了更细粒度的控制,以管理工作区 GPT,这是为特定业务用例创建的定制版本 ChatGPT。此前,管理员只能完全允许或阻止工作区中创建的 GPT 操作,但现在工作区所有者可以创建 GPT 可以交互的批准域列表。

参考内容:

GPT-4o mini: advancing cost-efficient intelligence

GPT-4o mini:推动高效智能的发展

ChatGPT-4o mini使用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1936783.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FairGuard游戏加固入选《嘶吼2024网络安全产业图谱》

2024年7月16日,国内网络安全专业媒体——嘶吼安全产业研究院正式发布《嘶吼2024网络安全产业图谱》(以下简称“产业图谱”)。 本次发布的产业图谱,共涉及七大类别,127个细分领域。全面展现了网络安全产业的构成和重要组成部分,探…

微软发布iOS/安卓正式版Designer应用,AI修图功能助力创意设计

一、Microsoft Designer应用正式上线 AITOP100平台获悉,微软一直致力于为用户提供优质的创意工具,此次推出的Microsoft Designer应用正是其在移动端的重要布局。这款应用已正式上线iOS、Android、Windows和网页版本,满足不同用户的需求。微软…

Stable Diffusion 使用详解(2)---- 图生图原理,操作,参数

目录 背景 图生图原理 基本原理 1. 扩散模型基础 2. 图生图的具体流程 3. 关键技术点 4. 应用实例 CLIP 原理 1.基本概念 2. 核心特点 使用及参数 随机种子 重绘幅度 图像宽高 采样方法 1. DPM(扩散概率模型) 2. SDE(随机微…

大语言模型-检索测评指标

1. MRR (Mean Reciprocal Rank)平均倒数排名: 衡量检索结果排序质量的指标。 计算方式: 对于每个查询,计算被正确检索的文档的最高排名的倒数的平均值,再对所有查询的平均值取均值。 意义: 衡量…

ChatTTS超强的真人AI语音助手下载使用教程

简介 ChatTTS是专门为对话场景设计的文本转语音模型,支持多人同时对话,适用的场景非常丰富,比如LLM助手对话任务,视频配音、声音克隆等。同时支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练&#xf…

【Android】 dp与sp,加冕为王

目录 重要概念 屏幕尺寸 屏幕分辨率 屏幕像素密度 基础知识: ppi pt DPI 的定义和重要性 Android 中的 DPI 级别 px dp(Density Independent Pixels) sp(Scale-independent Pixels) 安卓的dp/dip、sp 虚拟…

设置浏览器网页全屏

在日常笔记本上办公时,由于屏幕较小,为了尽可能多和方便的显示浏览器网页上的内容,可以设置网页全屏的方式,去掉屏幕顶端的网址栏和底端栏,具体设置如下: 以Edge浏览器和Google Chrome浏览器为例&#xff…

如何免费用java c#实现手机在网状态查询

今天分享手机在网状态查询接口,该接口适用的场景非常广泛!首先我们先讲下什么是手机在网状态?简单来说,就是你得手机号是否还在正常使用中,是否能够及时接收和回复信息,是否能够随时接听和拨打电话。如果你…

通过libx246 libfaac转换推送RTMP音视频直播流

一、RTMP简介及rtmplib库: RTMP协议是Real Time Message Protocol(实时信息传输协议)的缩写,它是由Adobe公司提出的一种应用层的协议,用来解决多媒体数据传输流的多路复用(Multiplexing)和分包(packetizing…

C++ :友元类

友元类的概念和使用 (1)将类A声明为B中的friend class后,则A中所有成员函数都成为类B的友元函数了 (2)代码实战:友元类的定义和使用友元类是单向的 (3)友元类是单向的,代码实战验证 互为友元类 (1)2个类可以互为友元类,代码实战…

相同IP地址仿真测试

相同IP地址仿真测试 背景与挑战解决方案技术优势功能特点 背景与挑战 在汽车电子领域,电子控制单元(ECU)的测试是确保其功能性和可靠性的关键步骤。然而,当测试场景涉及多个配置相同IP地址的ECU时,传统的测试方法面临…

GooglePlay 金融品类政策更新(7月17号)

距离上次政策大更新(4月5号)才过去了3个月,Google Play又迎来了一次大更新,不得不说Google Play的要求越来越高了。 我们来梳理一下这次GooglePlay针对金融品类更新了哪些政策: 1.要求提供金融产品和服务的开发者必须注册为组织…

IDEA的常见代码模板的使用

《IDEA破解、配置、使用技巧与实战教程》系列文章目录 第一章 IDEA破解与HelloWorld的实战编写 第二章 IDEA的详细设置 第三章 IDEA的工程与模块管理 第四章 IDEA的常见代码模板的使用 第五章 IDEA中常用的快捷键 第六章 IDEA的断点调试(Debug) 第七章 …

STM32使用SPI向W25Q64存储信息(HAL库)

SPI全双工通信:全双工在时钟脉冲周期的每一个周期内,每当主设备同时发送一个字节的同时,会接受从设备接受一个字节数据,SPI全双工最大的特点就是发送和接受数据同步进行,发送多少数据就要接受多少数据。使用全双工通信…

vst 算法R语言手工实现 | Seurat4 筛选高变基因的算法

1. vst算法描述 (1)为什么需要矫正 image source: https://ouyanglab.com/singlecell/basic.html In this panel, we observe that there is a very strong positive relationship between a gene’s average expression and its observed variance. I…

【iOS】static、extern、const、auto关键字以及联合使用

目录 前言extern关键字static关键字const关键字 联合使用static和externstatic和constextern和const auto关键字 先了解一下静态变量所在的全局/静态区的特点:【iOS】内存五大分区 前言 上面提到的全局/静态区中存放的是全局变量或静态变量: 全局变量…

逻辑回归(Logistic Regression,LR)

分类和回归是机器学习的两个主要问题。 分类处理的是离散数据回归处理的是连续数据 线性回归:回归 拟合一条线预测函数: 逻辑回归:分类——找到一条线可以将不同类别区分开 虽然称为逻辑回归,但是实际是一种分…

Chromium CI/CD 之Jenkins实用指南2024-在Windows节点上创建任务(九)

1. 引言 在现代软件开发流程中,持续集成(CI)和持续交付(CD)已成为确保代码质量和加速发布周期的关键实践。Jenkins作为一款广泛应用的开源自动化服务器,通过其强大的插件生态系统和灵活的配置选项&#xf…

【第4章】Spring Cloud之Nacos单机模式支持mysql

文章目录 前言一、初始化1. 初始化数据库2. 修改配置文件 二、效果1. 重新启动2. 新增用户 总结 前言 在0.7版本之前,在单机模式时nacos使用嵌入式数据库实现数据的存储,不方便观察数据存储的基本情况。0.7版本增加了支持mysql数据源能力,具…

数据如光,科技助航丨泰迪智能科技2024年暑期数据分析学徒班正式开班

7月16日,泰迪智能科技2024年暑期数据分析学徒班在泰迪智能科技天河培训中心正式开班,泰迪智能科技培训业务部孙学镂、教学代表周津、授课讲师巫兴港、就业指导老师赵欣欣、孟宪同、教学班主任黄晨华出席此次开班仪式。 仪式伊始,孙学镂代表广…