200美元/月的ChatGPT Pro版上线?OpenAI草莓模型曝两周内发布,但模型表现要打个问号?

news2024/12/25 4:00:29

夕小瑶科技说 原创
 作者 | 海野

现在看到“草莓”两个字,我已经条件反射了,已经不再是之前单纯的香香甜甜的草莓了。

一早醒来,又发生了两件“大事”:

一个是OpenAI的草莓(strawberry)被曝要提前了,会在两周内发布。

另一个还是OpenAI,他们新推出了一个定价200美元/月的ChatGPT Pro订阅套餐。

昂,具体是这样传的。

昨晚,外媒The Information透露,在未来两周左右,OpenAI就会上线他们的草莓模型(strawberry)。

曾经OpenAI说“秋季发布草莓模型”,如果是真的,这可能是OpenAI提前兑现期货的一次。

先对这次的曝光总结一下子:

  • 速度慢
  • 猜测使用了新范式Self-play RL
  • 数学代码能力强(之前就曝过的)

草莓模型,它的卖点就是——“自主思考”能力,以及强大的数学/代码能力。

在响应之前,会有一段10~20秒的“思考”时间,然后回答带有自己想法的答案。

网友猜测,根据现在有关草莓模型的各种信息来看,草莓模型的自主推理、强大代码能力,很有可能是通过一个新范式Self-play RL(自博弈强化学习)训练而得

在AI发展和进化的路上,追求AI进化为类人智能,一直是可想而不可实现的目标。其中最大的难点就是:让AI通过“模仿人类思维”进行思考和推理。

虽然,在非常庞大的数据集支撑下,现存的生成式大模型可以在对话中出口成章,为我们提供现有的各种信息。

但,这只是模型根据人类已有的数据与信息进行重复利用,却无法根据这些数据产生自己的想法和共鸣。

也就是说,大模型可以是一个很强的“文科生”,但在理科方面,只会做曾经做过的题。

而通过自博弈方法,大模型会与自己进行无数次对话,在这个过程中实现自我迭代学习。Claude和Deepseek的AI Coding能力也有一定可能源自这个范式。如果真的采用这种方法,草莓模型也会在数学和代码方面有非常强的建树。

但介于自博弈方法的计算效率有限,目前AI只能利用这个范式,实现在单个特定领域的突破。比如2017年的AlphaGo Zero,在没有人类输入的情况下,自博弈学习围棋,以100:0打赢了AlphaGo Master,而后者曾战胜过柯洁。

 

此外,自博弈需要进行超大量级的试验,对存储资源需求较高,推理成本也比较高,所以基本上没多少自博弈模型能真正落地。

当然,以上是对草莓模型的推测,具体原理是否如此,还需要等模型上线揭晓。 以及,受美国国家安全局掣肘,草莓模型也有可能蒸馏后再上线。

虽然草莓模型集成到ChatGPT中,但它是作为一个独立的产品存在,ChatGPT集成只是用法的一种。而初始版本的草莓模型只能接收和生成文本,并不会像其他GPT模型一样支持多模态。后续还要慢慢等更新。

根据介绍,草莓模型使用起来可能会更简单一些——对于现有的大语言模型,我们还要输入完整的“思维链”,才能换来想要的答案。而草莓模型只需要提供问题,就可以独立思考解决问题的逻辑链,从而给出结果。

不过我们都希望,这种思考只是用在比较复杂的问题上,可惜的是,尽管是一些简单到不行的问题,草莓模型可能也会思考很久,让人等个十几秒。如果换成普通的模型来回答也用不了这么久。

而且,十几秒的等待时间确实很长,不符合最开始对AI思考时间的预期。

然后是定价。

根据热心网友爆料,OpenAI还推出了一个新的订阅价位——

ChatGPT Pro,定价200美元/月。

网传有人发了付款页面,但目前尚不确定是否确有此事。

如果情况属实,这个新的订阅档位很大可能就是为草莓模型准备的。出于草莓模型的推理成本,这个定价也许是OpenAI能接受的最低价,这个模型的使用场合也可能更适合团队或集体使用。

对于个人来说……除非它能达到的效果真的有10倍以上,不然还是建议各位量力而行啊~


原文链接:https://mp.weixin.qq.com/s/xT1ZrfipYs1JOR4p1eWdWA

参考资料

[1]https://www.theinformation.com/articles/new-details-on-openais-strawberry-apples-siri-makeover-larry-ellison-doubles-down-on-data-centers?rc=ayfylg
[2] https://mp.weixin.qq.com/s/iN3BkbjDsEO4k88KOcIfkg 

参考模型:363Ai工具箱

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2130698.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Xorbits Inference(Xinference):一款性能强大且功能全面的大模型部署与分布式推理框架

大模型部署与分布式推理框架Xinference Xinference的基本使用概述安装启动服务模型部署模型参数配置说明 API接口概述对话接口模型列表嵌入模型Rerank模型使用Xinference SDK使用OpenAI SDK 命令行工具概述启动模型引擎参数其他操作 集成LoRA启动时集成LoRA应用时集成LoRA 部署…

Stable Diffusion绘画 | ControlNet应用-Tile(分块)—tile_resample(分块-重采样)

要想使用 SD 生成高品质图片,放大增加分辨率是必不可少的环节。 tile_resample(分块-重采样) 主要是将图片切分成很多个分块,并识别每个分块的信息,最终通过特定算法把分块的信息重组起来。 能有效避免直接对一整张图片统一处理&#xff0c…

TensorFlow深度学习框架改进K-means聚类、SOM自组织映射算法及上海招生政策影响分析研究...

全文链接:https://tecdat.cn/?p37652 分析师:Chen Zhang 在教育政策研究领域,准确评估政策对不同区域和学生群体的影响至关重要。2021 年上海市出台的《上海市初中学业水平考试实施办法》对招生政策进行了调整,其中名额分配综合…

LSS可视化分析

1 完整 2 去掉plt.imshow(img_show) 3 去掉plt.axis(‘off’) 4 去掉plt.annotate(cams_text[img_id].replace(‘_’, ’ ), (0.01, 0.92), xycoords=‘axes fraction’)

3C电子胶黏剂在手机制造方面有哪些关键的应用

3C电子胶黏剂在手机制造方面有哪些关键的应用 3C电子胶黏剂在手机制造中扮演着至关重要的角色,其应用广泛且细致,覆盖了手机内部组件的多个层面,确保了设备的可靠性和性能。以下是电子胶在手机制造中的关键应用: 手机主板用胶&…

【蓝桥杯省赛真题52】Scratch猪八戒落地 蓝桥杯scratch图形化编程 中小学生蓝桥杯省赛真题讲解

scratch猪八戒落地 第十五届青少年蓝桥杯scratch编程省赛真题解析 一、题目要求 编程实现 1)点击绿旗,猪八戒在空中踩着一朵云,如图所示; 2)1秒后,猪八戒踩着云向地面移动,如图所示; 3)猪八…

海外问卷调查有其他方式赚美金吗?

大家好,我是梦蝶问卷,专注于海外问卷调查项目。 大家应该都了解,做海外问卷项目填写问卷能赚美金,那除此之外,还有其它盈利模式吗?答案当然是肯定的。 有创业过的朋友应该都知道,一个项目的每个…

spring项目期间的学习9/11

核心:需要计算具体要求字段出现的数量使用count,需要返回出现字段的数量需要使用AS,需要避免重复需要使用distinct,需要具体体现在8月份需要使用like 代码如下: selectcount(distinct device_id) as did_cnt,count(question_id) …

UDS 诊断 - RequestUpload(请求上传)(0x35)服务

UDS 诊断服务系列文章目录 诊断和通信管理功能单元 UDS 诊断 - DiagnosticSessionControl(诊断会话控制)(0x10)服务 UDS 诊断 - ECUReset(ECU重置)(0x11)服务 UDS 诊断 - SecurityA…

一篇文章,讲清SQL的 joins 语法

SQL 中的不同 JOIN 类型: 1. (INNER)JOIN(内连接):返回两个表中具有匹配值的记录。 2. LEFT(OUTER)JOIN(左外连接):返回左表中的所有记录&#…

【SQL】百题计划:SQL内置函数“LENGTH“的使用

【SQL】百题计划-20240912 方法一: Select tweet_id from Tweets where LENGTH(content) > 15;– 方法二: Select tweet_id from Tweets where CHAR_LENGTH(content)> 15;

【DataSophon】Yarn配置历史服务器JobHistory和Spark集成historyServer

目录 一、概述 1.1历史服务器JobHistory 1.2 Spark历史服务器HistoryServer 二、集成配置 一、概述 1.1历史服务器JobHistory 为了查看程序的历史运行情况,需要配置一下历史服务器。方便在xxxx:8088查看历史任务运行日志信息。 1.2 Spark历史服务器HistoryServ…

夜幕降临 Nightfall Comes,官方中文,解压即玩,

游戏截图 《Nightfall Comes》是一款基于俯视角3D动作的Rogue-lite游戏, 讲述了四位角色的故事,他们怀着对已灭亡世界的最后执念,聚集在一个领地上的城堡中。 下载地址: 夜幕降临 Nightfall Comes,官方中文,解压即玩,

老板:IT部门一天到晚都在干什么?

最近某集团公司的一位CIO与笔者闲聊,吐槽道:老板问“IT部门一天到晚都在干什么?你们不就是修修电脑搞搞网络吗?要那么多人干什么?” 这位CIO其实是说出了老板对IT部门的质疑,背后折射的是企业数字化转型过…

安装office后,右键-》新建,不能创建word、PPT、Excel

原因是安装没有选择默认安装 解决办法: 文件的后缀名: 打开注册表: word: Excel: PPT: 最后重启一下电脑 效果:

七大技术 增强轧钢测径仪的抗干扰能力!

轧钢测径仪是在线检测设备,也就意味着其需要直面钢材,这些钢材在生产测量时,大部分温度高,环境中还有水汽、氧化铁皮等干扰测量的因素,因此在对轧钢测径仪设计之初就考虑到了现场的各种情况,提高测径仪的防…

极狐GitLab CI/CD 作业一直处于等待状态,如何解决?

本分分享 GitLab CI/CD Job 不工作的的故障排查方法:当 GitLab Runner 不接受 Job,Job 一直处于等待状态,如何解决此问题。 极狐GitLab 为 GitLab 在中国的发行版,中文版本对中国用户更友好。极狐GitLab 支持一键私有化部署&…

Linux arm-linux-gcc 内核编译

1.下载 arm-linux-gcc 4.4.3版本后更新路径 sudo vim /home/linux/.bashrc 的最后一行加入路径 或者 sudo vim /erc/profile 最后一行加路径 如果使用第一个改,则注释掉第二个的最后一行的旧的arm-linux-gcc 的路径 版本更新好后,使用编译可能还有错误&a…

如何评估一个RAG(检索增强生成)系统-上篇

最近项目中需要评估业务部门搭建的RAG助手的效果好坏,看了一下目前业界一些评测的方法。目前分为两大类,基于传统的规则、机器学习的评测方法,基于大模型的评测方法。在这里做一些记录,上篇主要做评测方法的记录,下篇会…

盘点2024年大家都在用的录屏工具

现在录屏工具的使用范围越来越广了。我的深切体验是有很多人愿意为知识付费了,但是到线下培训的话很多人时间不一定能协调的来,这就导致涌现了不少的录屏课程。这次我们来探讨下要怎么录屏才能呈现更好的效果。 1.福昕录屏大师 链接达达:ww…