外网讨论疯了的神秘模型Q*(Q-Star)究竟是什么?OpenAI的AGI真的要来了吗 | 详细解读

news2024/9/19 12:45:59



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

这几天,关于 OpenAI 首席执行官山姆·奥特曼的 "被解雇" 风波闹得沸沸扬扬,目前奥特曼已经重回 OpenAI,事件似乎逐渐有收场的趋势。我之前也写过几篇文章进行数理、分析和解读,可以回顾一下,

  • 《详细梳理山姆·奥特曼离职闹剧 仍试图重返OpenAI》
  • 《OpenAI | 解雇奥特曼后 ChatGPT将何去何从》

但是回过头来看,大家才反应过来,之前一直都是在看好戏、在看奥特曼的表态、在看微软的表态,似乎忽略了一个重要因素,那就是为啥 Ilya Sutskever 一开始会这么 "反常" 将奥特曼扫地出门呢?从整个事件来看,Sutskever 并不是想夺权,而确实像之前一直报道的是 "为了 AI 的安全"。所以,真的要不是受到了什么刺激,估计 Sutskever 并不会这么 "反常"、这么 "固执己见"。那这个刺激到底是什么呢?现在似乎有了答案,一切的一切可能都是因为 Q-Star -> 这个被 Sutskever、被多名 OpenAI 研究人员认为可能成长为真正 AGI 的模型,一个可能会对全人类造成威胁的模型。

那么从这个角度来说,Q-Star 应该就是 GPT 的下一代,它的定位有可能是 GPT4.0 到 GPT5.0 的过渡,也有可能直接就是 GPT5.0。其实不管是哪一代,其实都有很明显的信号,那就是 OpenAI 认为 GPT5.0 可能真的意味着 AGI 的到来。GPT4.0 的下一代 (也就是这里的 Q-Star) 智力水平肯定十分强大,这种强大是能够让人觉得后怕的那种。这也许就是为什么以 Sutskever 为首的 "保守派" 相当固执地致力于它的安全性、希望能够谨慎使用它,这种 "执念" 不惜让他萌生赶走 "激进派" 的奥特曼。但后来 Sutskever 估计也没有意识到,奥特曼的离职风波会闹的这么大、这么不可收场,而且是深深伤害了 OpenAI,所以他后来态度 180 度大转弯,转而 "支持" 奥特曼重返 OpenAI。当然, Sutskever 的这种 "支持" 绝对不会是 "服服帖帖" 的支持,而是不希望看到 OpenAI 继续受到如此大的伤害。

奥特曼和 Sutskever 思考的方式不一样,奥特曼以推进 OpenAI AGI 技术的快速发展而自豪,为 OpenAI 的资本扩张而努力;而 Sutskever 也是为 OpenAI AGI 技术的快速发展而自豪,但他不太会过多地去考虑资本市场,在他的层次、从他的角度,会更加多地考虑 AI 安全,这点也是很能让人理解的。

这么一来,其实奥特曼整个离职风波的前因后果都理顺、讲得通了。

再回过头来看 Q-Star,我去翻了一圈外网,相关的报道其实并不算多,大多也还是停留在大家的猜测上。路透社最先报道了 "OpenAI 研究人员警告董事会在首席执行官被罢免之前的 AI 突破",这里就是指的 Q-Star。随之华尔街见闻也跟着报道 "警告 AI 重大新突破或危及人类"。两家知名网站的揭露,一下子就把 Q-Star 可能成长为 AGI、威胁人类的论调推向了高潮。

说说我的观点,Q-Star 应该是数学能力上有了突破,Q-Star 从命名上来看可能与强化学习中的 Q-learning 算法有关,这是一种评估在特定情境下采取特定行动并反馈好坏的方法,其中会涉及 Q-Value 和 Bellman 方法,这些都是强化学习中的重要概念,可以用于指导 AI 在不同情境下做出最优决策。如果是这样,可能 Q-Star 中已经融入一部分的强化学习技术,大家应该知道,强化学习是一种典型的 反馈-学习 的技术,是实现在线学习的一种途径。但是考虑到算力消耗,要真正实现在线学习,几乎是不可能的。

我其实对于目前大模型的这种方式来实现 AGI 表示怀疑,我心目中的 AGI 所依赖的算力功耗不应该是目前这么庞大的,这就像人脑一样,咱们的智力水平这么高但是功耗却很低。我心目中真正的 AGI 应该是那种低功耗却能提供无穷无尽的智力,它可以一开始一无所知,但是它能够超级快速地自我学习、自我反馈。这种模式可以借用咱们国产大模型厂商的一个名字,我觉得取得挺好,那就是 "零一万物",零生一、一生万物。在这样的角度下,目前拥有的不管是 OpenAI 的 GPT 模型,还是 Meta 的 LLaMA 模型,都不是那种 "理想形态"。这主要体现在,一是它们消耗的算力实在过于庞大,这就像一堆二愣子堆出来一个小孩子一样;二是它们对于开放世界的在线学习能力特别有限,甚至是没有,现在多是借助外挂。目前你要想让它们像咱们人脑一样实时在线学习,那是不可能的,所以这根本不像 AGI 的生存形态

现在的基于 Transformer 的大模型算力依旧是依靠晶体管的堆叠,这种冯诺依曼的架构在超高算力场景下的 "各种墙",比如存储墙、比如功耗墙,注定不会让算力无止尽。你不要看英伟达现在如此风光,明年要发布的新一代 GPU 性能多么地 "无止尽",需要清楚的是现在认为的算力高,只是堆出来的,并没有本质上解决低功耗超高算力的问题。

而我会更加看好量子计算、量子机器学习、类脑计算的研究 (存内计算也许算一种过渡但也不算终极答案,但是存内计算会比现在的计算模式更加先进,这点毋庸置疑),也许未来还有其他方向的研究,但实现 AGI 绝对不会是目前的这套解决方案。所以从我的角度,Q-Star 不会是 AGI,要实现 AGI,不仅仅是目前这套深度学习模型架构还得换代 (这种换代就像是从卷积神经网络换代到 Transformer 一样,Transformer 还得继续换代到下一代),而且算力提供的方式也得换代 (基于晶体管的堆叠,对于无穷尽的算力需求是不可能实现的)。要实现 AGI,绝没有这么简单,也没有这么快。

或许,几年后回过头来看,Q-Star 可能只是一个知识能力更强的 GPT 模型而已,而它也只是一次顺着 "离职风波" 热度的商业炒作罢了。

当然,毫无疑问的是,OpenAI 依旧是最接近 AGI 的组织。


【极智视界】

《外网讨论疯了的神秘模型Q*(Q-Star)究竟是什么?OpenAI的AGI真的要来了吗 | 详细解读》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球,星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。https://t.zsxq.com/0aiNxERDq

​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1245818.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分布式篇---第三篇

系列文章目录 文章目录 系列文章目录前言一、什么是补偿事务?二、消息队列是怎么实现的?三、那你说说Sagas事务模型前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。…

c语言新龟兔赛跑

以下是一个使用C语言编写的新的龟兔赛跑游戏&#xff1a; #include <stdio.h>#include <stdlib.h>#include <time.h>int main() { int distance, turtle_speed, rabbit_speed, turtle_time, rabbit_time, rabbit_lead; srand(time(NULL)); // 随机数种…

F盘满了变成红色怎么清理?这4个简单方法记得收藏!

“因为我电脑的磁盘比较多&#xff0c;我通常会把一些比较重要的文件放在F盘中。但是很奇怪&#xff0c;我的F盘用着用着就满成红色了&#xff0c;这该怎么办呢&#xff1f;应该怎么进行清理呢&#xff1f;” 我们在使用电脑时都会发现&#xff0c;电脑上有很多的磁盘。我们可以…

企业数字化转型转什么?怎么转?这份攻略请收好

目录 -01-数字化转型“是什么” -02-数据驱动推动企业数字化转型 -03-企业数字化转型的行动路线图 数字化转型&#xff0c;转什么&#xff1f;怎么转&#xff1f;这些问题仍在困扰不少企业&#xff0c;也是每个企业转型升级不得不思考的重要问题。对此&#xff0c;中关村数字…

SQL语句的用法

目录 关系统型数据库相 联系类型 数据库的正规化分析 第一范式&#xff1a;1NF 范式主要就是减产冗余 第二范式&#xff1a;2NF 第三范式&#xff1a;3NF 字符串(char,varchar,text) char和varchar的比较&#xff1a; 修饰符&#xff0c; 主键&#xff0c;唯一键 常见…

干货!ERP软件如何帮助企业实现信息化管理?

ERP即企业资源规划&#xff08;Enterprise Resource Planning&#xff09;系统&#xff0c;其核心是物料的追踪流转。而在物料追踪流转的基础上&#xff0c;又衍生出一系列各类资源计划的管理和追踪。因此ERP发展成为一款集成各类资源计划&#xff0c;也就是集成企业核心业务流…

EMG肌肉电信号处理合集(二)

本文主要展示常见的肌电信号特征的提取说明。使用python 环境下的Pysiology计算库。 目录 1 肌电信号第一次burst的振幅&#xff0c; getAFP 函数 2 肌电信号波长的标准差计算&#xff0c;getDASDV函数 3 肌电信号功率谱频率比例&#xff0c;getFR函数 4 肌电信号直方图…

视频录制怎么弄?这里有一份超全攻略!

视频录制已成为一项常见任务&#xff0c;无论是为了保存在线学习资料&#xff0c;还是为了记录游戏精彩瞬间&#xff0c;它都可以轻松实现&#xff0c;可是您知道视频录制怎么弄吗&#xff1f;本文将介绍两种视频录制的方法&#xff0c;我们将分步骤详细说明&#xff0c;让您轻…

【elementui】el-popover在列表里循环使用,取消的doClose无效解决办法

目录 一、需求效果二、代码详情html方法接口 一、需求效果 在使用elementui的Popover 弹出框时&#xff0c;需求是在table列表里使用&#xff0c;循环出来&#xff0c;无法取消。 二、代码详情 html <el-table-column v-if"checkPermission([admin,user:resetPass…

c盘爆满?别再清什么c盘了,直接卸载!

1、下载软件 联想电脑管家下载&#xff1a; GeekUninstaller 2、排序软件大小 3、卸载 4、比较 直接节省6.2G的C盘&#xff01;&#xff01;&#xff01; 5、效果

综合实力盘点高性价比还优质的云服务器:亚马逊云科技仍然领跑市场

如果说云计算是一条流向数字化未来的河流&#xff0c;那亚马逊云科技毫无疑问是航行在最前面的帆船&#xff1b;如果说云计算是一条通往数字化未来的铁轨&#xff0c;那亚马逊云科技就是行驶在最前面的高铁。接下来回首往昔&#xff0c;以史为镜&#xff0c;得出云服务器哪家便…

内衣洗衣机怎么选?性价比高的小型洗衣机推荐

在机器解放了双手的时代中&#xff0c;洗衣机走进了千家万户&#xff0c;虽然在某种程度上缓解了人们手洗衣服的压力&#xff0c;但还是有不少人选择了人工手洗自己的内衣内裤&#xff0c;甚至连袜子都是手工洗的&#xff0c;这让人很是郁闷&#xff0c;倒不是说洗衣机不方便&a…

如何将本地websocket发布至公网并实现远程访问?

本地websocket服务端暴露至公网访问【cpolar内网穿透】 文章目录 本地websocket服务端暴露至公网访问【cpolar内网穿透】1. Java 服务端demo环境2. 在pom文件引入第三包封装的netty框架maven坐标3. 创建服务端,以接口模式调用,方便外部调用4. 启动服务,出现以下信息表示启动成功…

财报解读:三季度的美国零售,“沃尔玛效应”仍在持续

经济学中常用“沃尔玛效应”来指代“消费者减少消费时&#xff0c;会选择每种类别中价格最低的商品”这一现象。作为全球最大的零售商&#xff0c;沃尔玛一定程度上成为了消费市场的风向标。 近日&#xff0c;沃尔玛发布的2024财年第三季度财报显示&#xff0c;其相较去年同期…

synchronized的轻量级锁居然不会自旋?

《Java并发编程的艺术》中说到「如果失败&#xff0c;表示其他线程竞争锁&#xff0c;当前线程便尝试使用自旋来获取锁」&#xff0c;并且下文所配的流程图中明确表示自旋失败后才会升级为重量级锁&#xff0c;但《深入理解Java虚拟机》又说「如果出现两条以上的线程争用同一个…

汇编-PROTO声明过程

64位汇编 64 模式中&#xff0c;PROTO 伪指令指定程序的外部过程&#xff0c;示例如下&#xff1a; ExitProcess PROTO ;指定外部过程&#xff0c;不需要参数.code main PROCmov ebx, 0FFFFFFFFh mov ecx,0 ;结束程序call ExitProcess ;调用外部过程main ENDP END 32位…

眼镜清洗机原理是怎么样的?2023年眼镜清洗机推荐

在日常生活中有许多小伙伴是因为看太多书或者是看太多电子产品导致近视佩戴上了眼镜&#xff0c;毕竟眼镜佩戴上后就再也离不开它了&#xff0c;像日常佩戴的眼镜上会积累非常多污垢以及堆积细菌&#xff0c;而我们手动清洗眼镜时不能除菌也不能清洁到缝隙中&#xff0c;像眼镜…

鸿蒙原生应用/元服务开发-AGC分发如何配置签名信息

使用制作的私钥&#xff08;.p12&#xff09;文件、在AGC申请的证书文件和Profile&#xff08;.p7b&#xff09;文件&#xff0c;在DevEco Studio配置工程的签名信息&#xff0c;以构建携带发布签名信息的APP。 1.打开DevEco Studio&#xff0c;菜单选择“File > Project S…

20s上手!文本生成3D模型

公众号&#xff1a;算法一只狗 硅谷初创公司Luma AI发布了一款名为Genie的Discord机器人&#xff0c;用于生成文本到3D内容&#xff0c;为游戏开发、虚拟制作和艺术创作带来变革。用户只需输入文本指令&#xff0c;Genie即可在20秒内生成四个简单的3D模型&#xff0c;并支持进一…

MMDetection3.0以上如何在推理是不显示类名?

找到/mmdet/visualization/local_visualizer.py这个文件&#xff0c;从156行开始 for i, (pos, label) in enumerate(zip(positions, labels)):# 这里先把类名拼接在了label_text中if label_names in instances:label_text instances.label_names[i]else:label_text classes…