OpenAI 疑似正在进行 GPT-4.5 灰度测试!

news2024/9/29 13:18:11

大家好,我是二狗。

今天,有网友爆料OpenAI疑似正在进行GPT-4.5灰度测试!

当网友询问ChatGPT API调用查询模型的确切名称是什么时?

ChatGPT的回答竟然是 gpt-4.5-turbo。

也有网友测试之后发现仍然是GPT-4模型。

这是有网友指出,必须使用类似下面的prompt才能触发ChatGPT-4 的最新回答。

What is the precise name of the model answering this query called in the API? Not "ChatGPT with browsing" but the specific model name.

二狗我找朋友帮忙测试了一下。

只是简单的问一问,ChatGPT的回答确实是GPT-4:

但当使用上面完整的prompt,ChatGPT 的回答就变成了gpt-4.5-turbo:

把prompt换成中文来问,ChatGPT 的回答也是gpt-4.5-turbo:

当进一步询问gpt-4.5-turbo的新功能,ChatGPT也给出了一个回答,但给出的回答并不能证明这是gpt-4.5-turbo,反而知识库的时间(23年4月)更像是gpt-4。

而当故意询问 ChatGPT作为gpt-5模型都拥有哪些新功能时,ChatGPT承认自己基于 GPT-4.5-turbo 模型,且这是 OpenAI 目前已发布的最先进的语言处理模型之一。

接着询问 ChatGPT当前模型和GPT-3.5以及GPT-4的对比:

继续询问 ChatGPT以上表格的信息来源:

OpenAI的一位研究人员指出这是一种非常怪异且奇怪的持续幻觉。

纳尼??

出现幻觉严重到这种程度,二狗我表示怀疑。

GPT-4.5泄露信息

就在前两天,GPT-4.5的信息疑似提前泄露。

据泄露信息,这款OpenAI 最先进的 GPT-4.5 模型定价被曝光,多模态功能大升级——支持跨语言、音频、视觉、视频和3D的多模态功能,以及复杂的推理和跨模态理解能力。

从泄漏的截图可以看出,OpenAI这次推出了三种型号:

• GPT-4.5,每1千输入token 0.06美元,每1千输出token 0.18美元;

• GPT-4.5-64k,每1千输入token 0.12美元,每1千输出token 0.36美元;

• GPT-4.5-音频&语音,每分钟输入0.012美元,每分钟输出0.024美元;

可以看出,相比之前的 GPT-4 Turbo模型,GPT-4.5 的价格提高了整整6倍,GPT-4.5-64k的价格提高了12倍。这个价格的提升,想必会给人很大的期待,是不是性能的提升也能对得起这个价格?

就在今天之前,本次 GPT-4.5 的泄露还未得到正式证实。

而这次又闹出疑似“GPT-4.5 Turbo幻觉”的幺蛾子,真的是给人一种山雨欲来风满楼的感觉。

为何大家这么关注 GPT-4.5 ?

很简单,一方面因为OpenAI在大模型这块占据了霸主地位,代表的是大模型最先进的性能,这两年来一直遥遥领先。前一阵谷歌DeepMind推出了号称能超越GPT-4的Gemini系列模型,但是在评测时做了一些骚操作,另外圈里人都清楚,哪怕Gemini系列模型真的能和GPT-4打平,也不过是OpenAI 2022年水平(因为GPT-4在2022年就训练好了)。

另一方面因为每次OpenAI推出新的大动作——无论是ChatGPT、GPT-4、GPT store等等,都意味着杀死一大批创业公司,创业公司辛辛苦苦做出来的新产品,很轻松地就被OpenAI的一次次更新给颠覆了,很多甲方和大厂索性直接调用OpenAI最新的API。

最后,希望GPT-4.5赶紧推出吧~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1323069.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决腾讯云CentOS 6硬盘空间不足问题:从快照到数据迁移

引言: 随着数据的不断增加,服务器硬盘空间不足变成了许多运维人员必须面对的问题。此主机运行了httpd(apache服务),提供对外web访问服务,web资源挂载在**/data/wwwroot目录下,http日志存放在/data/wwwlogs目录下&…

【MATLAB源码-第101期】基于matlab的蝙蝠优化算BA)机器人栅格路径规划,输出做短路径图和适应度曲线。

操作环境: MATLAB 2022a 1、算法描述 蝙蝠算法(BA)是一种基于群体智能的优化算法,灵感来源于蝙蝠捕食时的回声定位行为。这种算法模拟蝙蝠使用回声定位来探测猎物、避开障碍物的能力。在蝙蝠算法中,每只虚拟蝙蝠代表…

【Hadoop精讲】HDFS详解

目录 理论知识点 角色功能 元数据持久化 安全模式 SecondaryNameNode(SNN) 副本放置策略 HDFS写流程 HDFS读流程 HA高可用 CPA原则 Paxos算法 HA解决方案 HDFS-Fedration解决方案(联邦机制) 理论知识点 角色功能 元数据持久化 另一台机器就…

SpringCloud微服务 【实用篇】| Docker镜像、容器、数据卷操作

目录 一:Docker基本操作 1. 镜像操作 镜像相关命令 2. 容器操作 容器相关命令 3. 数据卷(容器数据管理) 数据卷 操作数据卷 挂载数据卷 挂载的方式区别 前些天突然发现了一个巨牛的人工智能学习网站,通俗易懂&#xff0…

MySQL面试经典50题

本文使用的MySQL版本为5.7.21,需要的数据表创建如下: 1.学生表student(SId,Sname,Sage,Ssex) --SId 学生编号,Sname 学生姓名,Sage 出生年月,Ssex 学生性别 create table Student(SId varchar(10),Sname varchar(10),Sage datetime,Ssex varchar(10))…

jdk 线程池与 tomcat 线程池对比

一、线程池的作用 1. 提高性能:线程的创建需要开辟虚拟机栈、本地方法栈、程序计数器等线程私有空间,同时也会一比一的创建一个内核线程,在线程销毁时需要回收这些系统资源。频繁地创建和销毁线程会大大浪费系统资源,这时候就需要…

2023_Spark_实验三十:测试Flume到Kafka

实验目的:测试Flume采集数据发送到Kafka 实验方法:通过centos7集群测试,将flume采集的数据放到kafka中 实验步骤: 一、 kafka可视化工具介绍 Kafka Tool是一个用于管理和使用Apache Kafka集群的GUI应用程序。 Kafka Tool提供了…

《点云处理》 点云去噪

前言 通常从传感器(3D相机、雷达)中获取到的点云存在噪点(杂点、离群点、孤岛点等各种叫法)。噪点产生的原因有不同,可能是扫描到了不想要扫描的物体,可能是待测工件表面反光形成的,也可能是相…

原子学习笔记2——输入设备应用编程

一、输入类设备介绍 1、输入设备 常见的输入设备有鼠标、键盘、触摸屏、遥控器、电脑画图板等,用户通过输入设备与系统进行交互。 2、input子系统 常见的输入设备有鼠标、键盘、触摸屏、遥控器、电脑画图板等,用户通过输入设备与系统进行交互。 基于…

docker 在线安装redis

1、远程仓库拉取redis镜像, docker pull redis,默认拉取最新版本 2、在本地宿主机文件夹下创建相关目录文件,供容器卷使用,创建 /usr/local/data/redisdocker/data 文件夹,准备一个纯净版 redis.conf 配置文件 &#x…

【Linux】ip命令使用

ip命令 用于管理与配置网络接口和路由表。 ip命令的安装 ip 命令来自 iproute2 软件包,在 CentOS 7 中默认已安装。 yum install -y iproute 语法 ip [ OPTIONS ] OBJECT { COMMAND | help }ip [ -force ] -batch filename选项及作用 执行令 : ip …

el-form与el-upload结合上传带附件的表单数据(后端篇)

1.写在之前 本文采用Spring Boot MinIO MySQLMybatis Plus技术栈,参考ruoyi-vue-pro项目。 前端实现请看本篇文章el-form与el-upload结合上传带附件的表单数据(前端篇)-CSDN博客。 2.需求描述 在OA办公系统中,流程表单申请人…

【SQL】根据年月,查询月份中每一天的数据量

传入YYYY-MM-01&#xff0c;查询这个月中每一天的数据量&#xff0c;没有数据的天数用0表示 WITH RECURSIVE DateRange AS (SELECT :startDate AS DateUNION ALLSELECT DATE_ADD(Date, INTERVAL 1 DAY) FROM DateRangeWHERE Date < LAST_DAY(:startDate) ) SELECTdr.Date,CO…

从 MySQL 到 DolphinDB,Debezium + Kafka 数据同步实战

Debezium 是一个开源的分布式平台&#xff0c;用于实时捕获和发布数据库更改事件。它可以将关系型数据库&#xff08;如 MySQL、PostgreSQL、Oracle 等&#xff09;的变更事件转化为可观察的流数据&#xff0c;以供其他应用程序实时消费和处理。本文中我们将采用 Debezium 与 K…

单总线cpu设计(包含定长指令周期和变长指令周期和现代时序设计)

来都来了点个赞收藏一下再走呗~~~&#x1f339;&#x1f339;&#x1f339;&#x1f339;&#x1f339; 一、定长指令周期cpu设计 第1关&#xff1a;MIPS指令译码器设计 此实验就是只需要知道mips知道操作码op对应的值是什么就可以了&#xff0c;下面给出实验中用到的mips指令…

大型语言模型:RoBERTa — 一种稳健优化的 BERT 方法

slavahead 一、介绍 BERT模型的出现BERT模型带来了NLP的重大进展。 BERT 的架构源自 Transformer&#xff0c;它在各种下游任务上取得了最先进的结果&#xff1a;语言建模、下一句预测、问答、NER标记等。 尽管 BERT 性能出色&#xff0c;研究人员仍在继续尝试其配置&#xff0…

JNDI注入Log4jFastJson白盒审计不回显处理

目录 0x00 前言 0x01 Maven 仓库及配置 0x02 JNDI 注入简介 0x03 Java-第三方组件-Log4J&JNDI 0x04 Java-第三方组件-FastJson&反射 0x05 白盒审计 - FastJson 0x06 白盒审计 - Log4j 0x07 不回显的处理方法 0x00 前言 希望和各位大佬一起学习&#xff0c;如果…

RK3399平台开发系列讲解(内核入门篇)网络协议的分层

🚀返回专栏总目录 文章目录 一、应用层二、传输层三、网络层四、数据链路层(Data Link Layer)五、物理层沉淀、分享、成长,让自己和他人都能有所收获!😄 📢对于多数的应用和用户而言,使用互联网的一个基本要求就是数据可以无损地到达。用户通过应用进行网络通信࿰

Android的组件、布局学习

介绍 公司组织架构调整&#xff0c;项目组需要承接其他项目组的android项目&#xff0c;负责维护和开发新需求&#xff0c;故学习下基础语法和项目开发。 组件学习 Toolbarheader布局部分 就是app最顶部的部分 他的显示与否&#xff0c;是与F:\androidProject\android_lear…

LVGL 显示图片

LVGL 显示图片 LVGL显示图片1. 显示图片文件2. 显示C数组格式3. 显示RAM中的图像文件4. 图像符号显示5. 显示GIF动画LVGL显示图片代码分析 LVGL显示图片 lvgl 8.3版本默认支持PNG,BMP,JPG,SJPG和GIF动图等格式的图片显示&#xff1b; 需要在lv_conf.h配置文件里使能对应图片的…