对话吴翰清:把全世界AI联合起来,打败OpenAI这个垄断怪兽

news2024/9/30 3:35:38

前面坐着吴翰清,这个中国互联网技术圈里多少有点传奇色彩的“黑客”。

不是所有人都会成为某种互联网都市传说的主角,但他却一个人占了好几个,什么单枪匹马黑掉了阿里的网络,什么在拉斯维加斯坐着大巴车一路走一路黑掉了路旁酒店的Wi-Fi,一个比一个令人惊异。有的他不停否认,有的是他自己随口讲出来的。

现在他离开了成名的阿里,不过物理距离不远,他坐在自己在27层的落地窗转角办公室和我们聊天,办公室门上写着“总裁办公室”,尽管这是个刚成立几个月只有十几个人的公司,不远处是阿里云去年搬离的原总部大楼,他左侧的窗外是一片开阔地,各种近几年建成的奇异造型的办公楼和等待着变成办公楼的农田都在脚下,等待着这个办公室的主人随时俯瞰他们。

对话开始没多久,吴翰清进入了他的世界,这是一个叫做kOS的产品构想,和一个叫做半个宇宙的乌托邦。这个办公室渐渐开始让我感觉像是某种科幻小说中反抗邪恶统治的盟军总部。那个对手就是OpenAI。

OpenAI要打造一个怪兽,我要做的是联合世界上的居民来一起对抗它。他说。

图片

吴翰清

听起来十分狂妄,但吴翰清已经开始这么做了。这是一个大计划。

孙悟空

去年ChatGPT的发布像一场大海啸的开端,之后全世界都在一波又一波浪花里蒙眼狂奔,离开工作了很多年的阿里后,吴翰清也在研究大模型并寻找创业的方向。但最终,与那些快速投入到模型层或应用层的创业者不同,他得出了一个“相反”的结论:

他认为大模型的确是个强大的技术进步,但今天大部分人对它的用法却都错了。

大模型最惊艳之处在于它呈现出来的、目前仍然是谁也解释不清到底如何产生的推理能力,而过去一年工业界的AI热潮基本围绕着如何继续加强这种能力和如何把这种能力以应用的形式直接落实到真实世界里。但吴翰清认为这是工业界被学术界带偏了。

“今天整个计算机的工业界被学术界给带歪了。”他说。“学术界一直在追求让神经网络具备逻辑推理能力,首先这是一个非常值得追求的科学问题,但是它是一个到今天都没有答案的问题,也就意味着今天在学界所有做所谓人工智能或者说人工神经网络的人都是在猜测,都是在猜想,所以没有谁能够100%说我的道路一定是正确的,其中典型的代表就是今天的大模型。今天所有在大模型上做工程投入的人和团队实际上都是在尝试去让神经网络具备逻辑推理能力,这是一个非常值得追求的科学问题,但它一定不是一个重要的应用问题,在今天一定不是。”

他把大语言模型的本质定义为:“速成幻觉智能”。

“它是速成的,因为它是用了大量的语料压缩进去,所以它今天没有办法去增长它的知识,每次增长知识必须重新训练,它没有办法通过一种自学习的模式来增长自己本身的知识,这是一个很严重的问题,人类不是这样去学习的。”

也就是说,他认为靠大模型自己,幻觉问题永远解决不了,就永远没法直接为产业所用。

吴翰清还用他自己的方式从技术上证实这个判断:

“我们当时在想一定要解决一个别人都解决不了的问题,然后才能证明这个东西是有必要的。我找到了这个问题,其实非常简单,简单到一句话说清楚了,就叫做——《西游记》里面孙悟空到底被提到了多少次?”他说。

“当你把这个问题简单的作为输入题给以恶搞AI系统,然后把《西游记》给它,你希望它能够自动回答,但你会发现没有一个能够回答,包括OpenAI,包括谷歌,这就很有意思了。为什么这么简单的问题,你大模型不是天天吹牛嘛,那你回答一下?回答不了。”

回答不了的原因是孙悟空在《西游记》里压根就不叫孙悟空。

“《西游记》里面的孙悟空叫做大圣,叫做行者,叫做老孙,叫做臭猢狲,他有一系列的别名。另外还有所有的代词,他的指称,你我他。哪一个是指的孙悟空,没有被计算过,所以当我问GPT的时候它就开始胡说八道。OK,所以这是一个非常非常关键的问题,但是被所有人所忽视的问题。”

用一个精妙的小刀捅破巨大的罩幕,典型的黑客行事风格。“我用一个问题干趴下了所有大模型,就是这么简单。”他说。

但不能光提出问题难倒别人,你得给出解法。吴翰清思考后的解法也挺简单——就是不要只想着大模型了。

“从我们角度来看的时候,这个问题的答案就像摆在我面前一样这么直白和显而易见,就是《西游记》里面孙悟空被提到多少次这个问题,对于传统的程序员来说,它压根不是一个问题。当你用data mining去做完之后,你基本上就是SQL查一下或者用Python去写成代码,它自然而然就出来了。”他说。

“对于所有程序员来说,逻辑推理不是一个问题,1+1必然等于2。但是对于所有做神经网络的人来说,如何让神经网络自动的生成1+1等于2这个答案是一个非常非常难的事情。”

至此吴翰清要做的事情也就呼之欲出了,他要构造一个全新的系统,来统一这两种技术和能力。

“这又变得非常简单,我要统一神经网络和高级编程语言。”他说。“或者更加抽象地说,我尝试用同一个系统来统一掉连接主义和符号主义,让它兼具神经网络的泛化能力,同时又能够保留高级编程语言的逻辑推理能力。”

在这个系统里,大语言模型不是全知全能的神,它只是吴翰清构建的世界里的一个零件。

我做的就是一个计算机

这个“零件”就是CPU,一个新的计算体系里的CPU。

今天世界上最聪明的人们似乎都立刻拜倒了在大模型的石榴裙下,并且大有抛弃一切旧有技术路线全面围绕大模型重构一切的势头。但吴翰清设想的世界里,大模型是CPU,只是CPU,只是一个更加“优雅”的、代表未来的系统的一部分,甚至是一小部分。

在12月,吴翰清在他关注者众多的公众号上发布了一篇3万字的长文。这篇创业宣言里,吴翰清把这个系统的架构设计公开了出来。

图片

架构手绘草图,更清晰的图在下文。图片来源:kmind

它包括输入输出模块、控制器、运算器、存储器和记忆器。

其中,大语言模型是CPU,它的泛化能力首先被用在LUI里,主要做指令解析,指令解析完之后的流程则由程序员来控制。其次,大模型还被用在运算器里,与过往特定场景的data mining方式相比,大模型可以省掉很多程序的编写,省掉训练很多特定场景数据样本的过程。

“所以大模型对我们来说,我们把它封装成为了一个个指令,可以原子化的去调用。”吴翰清说。“这是为什么我们谈它像心脏,它像CPU。它虽然不理解用户最终的意图,但是它的每一次跳动都是非常重要的,心脏时刻在跳动,但是它真的不理解你到底在想什么,想什么是大脑去理解的事情。”

这样,一个“降服”了大模型的系统完成。吴翰清认为这个架构很完美。“kOS的实现完全符合计算机的基础三论:信息论、控制论和系统论的。它是一个非常优雅的结构设计。”吴翰清说。

“对这个系统,我们不要求局部的神经网络具备精确的逻辑推理能力,同时也不要求高级编程语言在特定场景具备足够的泛化能力,所以它的全局是兼具这两种特性的,统一起来是完全符合系统论的设计思想。”吴翰清说。

“同时我们在模拟人的思考过程,控制器还会不断地跟外界做交互,多轮对话会反问你并不断做反馈,这就是控制论的思想。整个系统不断迭代,循环,交互,由此来获得人和机器共生交互上的一种智能。”

而在信息论方面,吴翰清直接针对的就是大模型的幻觉问题,要解决的就是孙悟空问题。

今天我们无法对大模型做精准的修改,比如要求它在生成内容后,只对其中的某一段做修改,它们往往是直接重新生成一个新的东西。吴翰清认为这对于工业界就是灾难,你必须能精准的控制它,也就是要有足够高的“AI精度”,在西游记里准确找出所有孙悟空背后AI精度的问题。

“我用了三体里的概念,提出一个数据脱水与浸泡的技术。”吴翰清说。

“数据脱水这个过程是从原始的应用数据里通过自动化的data mining产出一个结构化的数据,于是就可以非常方便去用高级编程语言进行处理,所有的python,包括关系型数据库和图计算都能派上用场,在这个时候我们程序员过去这么多年所有的技术积累就都有了用武之地。”他说。

“处理完之后还需要把它还原和恢复回去,变成一个重新可以被使用的原始数据,过程我们依然是通过大模型或者是扩散模型来完成,它是多个计算组合在一起的一个过程,我们把它称之为元数据浸泡。”

三体小说里,三体人可以通过脱水和浸泡改变形态,吴翰清形容数据也可以如此完成改造和恢复,从而让人们能精确地修改或精确统计原始数据中更细粒度的局部,从而可以回答一些更难的问题。

“所以今天我在干什么,我就是在做一台新的计算机,个人AI计算机。”

图片

图片来源:kmind

这台计算机没有一个固定的硬件躯壳,已有的硬件都可以视为它的接口。“功能是来自于结构,所以工程师最重要的工作就是把这个结构定义出来之后,让它具备新的功能 。”吴翰清说。kOS的结构是个计算机的结构——它是一个扩展的冯.诺依曼结构,比冯诺伊曼架构多了一个,所以它是个计算机。

他给它的英文名命名PAIC,P在前,就像PC这个名词一样,因为这是一个对AIC的个人化。

吴翰清拿个人计算机的发展历史来对比这个AI时代的计算机。

他把个人计算机的发明归结为三个关键技术基础:微处理器、图形界面、高效的编程语言。它们分别实现了让普通人买得起;让普通人能看懂、用懂,和一个可编程的通用计算平台。

而对应到个人AI计算机,它的这三个技术基础也已经成熟,分别是:云计算带来的数据和算力的普惠、大模型实现的新型人机交互方式,以及呼之欲出的新型编程范式。

目前三要素缺少的就是编程范式。吴翰清提出了ACT的概念。“其实本质就是算法,就是你所有的指令编排和秩序的执行以及它的结构。只不过,随着计算机的不同,它的名字不同,PC时期叫软件,智能手机时期叫APP,PAIC时期我把它定义为ACT。”

ACT就是PAIC自己的指令集,用来控制各个模块,它的编写需要高级编程语言,但调用可以通过自然语言的映射完成,从而让用户可以通过自然语言来操控计算机。

“对于大多数普通用户来说,并不需要对形式化的编程语言望而生畏,因为我们的目的,首先是为了给程序员看,说明白我们的工作原理,我们实际上做了一次类似“魔术揭秘”的事情,而像OpenAI和其他做AI Agent的公司,一定不会揭开自己的商业秘密。我们之所以愿意这么做,是因为我们的目标和他们是不同的,我们做的是一台计算机,而不是Agent,因此我们希望计算机的工作原理和编程语言是广为人知的。”

而这也是一个中间态,最终的状态是高级编程语言成为AI用的语言,而所有人都可以用自然语言完成编程。

“我们系统处于从“可编程AI”过渡到“AI可编程”的一个中间状态,现在支持一个高级编程语言可以让程序员在调试ACT的过程中方便许多。未来我们希望能实现约翰·巴库斯的梦想:编程应该是人告诉机器“做什么”,而不是说“怎么做”。”

不要造亚里士多德,而要解放雅典人民

从吴翰清的整个思考和设计的过程里会发现,这个年少成名、总以代表着打破一切的“黑客”身份出现、外形也多少有些潇洒飘逸的吴翰清,却习惯回头看,朝计算机历史要答案。

事实上,在创业前的一年,他几乎把精力都投入了一件事上:写书,写一本大部头的书。这本直接取名《计算》的书,把人类的各种计算历史写了一遍,一直写到GPT的出现。

“你们以为GPT的能力很神奇,在我看来,它背后就跟人们对魔术的惊异一样。”他说。当魔术揭秘后,背后就是计算。“从我们做工程角度来说就是魔术揭秘。当你把几千字计算压缩成一次交互过程的时候,你就会觉得很神奇,实际上你可能计算了很多次。”

现在他同样要变魔术了,只不过他认为这次的魔术可以展示给所有人,并且更加优雅,更加是人类未来需要的戏法。

在和吴翰清聊天的过程里,他一直呈现出这种不太一样的特质——他几乎是带着某种夙愿迎来了大模型这个技术的爆发,而这个夙愿就是掀翻今天互联网巨头们对数据的垄断。

个人计算机真正变得伟大是因为它们连在了一起,也就是互联网的出现。但吴翰清认为,互联网出现后因为信息流动方式的问题,导致数据最终聚集在了少数互联网巨头的手里,他们通过广告这个精妙的商业模式,把财富聚集在自己手里,垄断出现。

大模型带来的技术变革本有望打破这一切,但在他看来,OpenAI的AGI野心最终是让自己长成一个吸血的怪兽,它会垄断所有的知识来靠此收费,在垄断这件事上不仅故态复萌,甚至换了新方法变本加厉上演。

“数据,算力和算法,这三者的价值全是OpenAI拿走的,所以最后它是会让所有agent公司死掉。”而且最近OpenAI的“宫斗”闹剧也让吴翰清不再对这家公司的价值观抱有期待。

要改变这一切,需要从数据的权益角度做出彻底的改变,吴翰清认为现在终于有了可能:

这场变革要发生在PAIC彼此连接成网的过程里,发生在一个AI互联网的世界里。

吴翰清设计了这个理想的AI互联网的雏形:半个宇宙。

图片

图片来源:kmind

每个人有一个可以自己给它取名的“星伴”,它由kOS驱动,能跟你对话,也能帮你去寻找半个宇宙网络里的信息。此外还有“星魂”,用来保存星伴的个性化知识、经验、记忆、性格。你还有一个星盘用来存放你的本地数据,这些数据可以用不同的权限来控制,也可以用不同方式提供给你在半个宇宙的网络里的好友。而好友关系上,吴翰清认为将互联网设计成一个类似于人类社会关系网络的模型会是一个更加公平的网络,他认为事实上微信就是这样的网络结构。

于是这看起来像是一个微信+宠物小精灵+网盘的产品,一个吴翰清想象中未来互联网的雏形。

图片

半个宇宙目前的界面,许多功能在建设中

在这个构想里,最终这个世界里在“上网”的AI比人多。它们永远在线,永远在服务着每个人类个体。而它们之间的互动是信息找人:当一个人有需求,自己的PAIC发出广播,不同的AI之间完成信息的交换,吴翰清认为,这样就再也不会出现信息的聚集,也就不会有垄断。

甚至,吴翰清还从一开始就预想了自己违背初心的场景,为此设计好机制来保证半个宇宙的纯净。

“我们最关键的动作是要把推荐算法给开源掉,这个动作还没执行,因为我们系统还不成熟,所以到未来某一天会去执行。第二我们会有大量的ACT开源掉,而且会有很多人选择把他的ACT给开源掉,来丰富整个社区。”吴翰清承诺。

“开源是手段,本质上是要公众监督。如果某一天半个宇宙选择把推荐算法给闭源掉,替换了开源算法,我也号召所有用户来推翻半个宇宙。”最后这句像是来自某种科幻世界的说法。

于是在这个半个宇宙里,没有节点能垄断知识,也就不会出现全知全能的AGI。甚至,把它们连接在一起,也正是为了对抗那个全知全能的AGI所代表的黑暗未来的路线。

“这就是我们跟OpenAI愿景最大不一样的地方,它希望AGI出来之后统一掉所有东西,今天看到AGI一旦造神运动成功之后,所有人用的东西都叫做ChatGPT,所有人登录到他那个网站看到的AI都是同一个名字,就是ChatGPT,这是我们不希望看到的未来。”他说。

吴翰清构建起了一个关乎人类未来的叙事,在这家公司还只有16个人,刚成立几个月的时候。

“所以OpenAI在创造一个AI亚里士多德或者AI孔子,让所有人跟这个人对话,而你只想让雅典的每个人跟曲阜的人每个人都能对话。”我从他描述的世界里缓过神来,然后问他。

“而你在做的一切,就是从技术理论上推导出来一个乌托邦的存在,然后你要建造他了。”

“对,你说的对。”

他想了下回答。

“我认为所有的知识不应该被统一成同样的价值和同样的态度,而是应该百花齐放,应该同一件事情有不同的观点,这样才是一个更加丰富和美好的未来,而且可能也才会是一个更加公平的未来。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1395918.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【开源】基于JAVA的教学资源共享平台

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 课程档案模块2.3 课程资源模块2.4 课程作业模块2.5 课程评价模块 三、系统设计3.1 用例设计3.2 类图设计3.3 数据库设计3.3.1 课程档案表3.3.2 课程资源表3.3.3 课程作业表3.3.4 课程评价表 四、系统展…

PyTorch各种损失函数解析:深度学习模型优化的关键(1)

目录 详解pytorch中各种Loss functions binary_cross_entropy 用途 用法 参数 数学理论 示例代码 binary_cross_entropy_with_logits 用途 用法 参数 数学理论 示例代码 poisson_nll_loss 用途 用法 参数 数学理论 示例代码 cosine_embedding_loss 用途 …

189.轮转数组(数组翻转,C解法)

题目描述: 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,3,4,5] 向右轮转…

交叉编译工具 aarch64-linux-gnu-gcc 的介绍与安装

AArch64 是随 ARMv8 ISA 一起引入的 64 位架构,用于执行 A64 指令的计算机。而且在 AArch64 状态下执行的代码只能使用 A64 指令集。,而不能执行 A32 或 T32 指令。但是,与 AArch32 中不同,在64位状态下,指令可以访问 …

Vue以弹窗形式实现导入功能

目录 前言正文 前言 由于个人工作原因,偏全栈,对于前端的总结还有些初出茅庐,后续会进行规整化的总结 对应的前端框架由:【vue】avue-crud表单属性配置(表格以及列) 最终实现的表单样式如下:…

文件共享服务(一)——DAS、NAS、SAN存储类型

一、存储类型 存储类型主要有三种 1. DAS直连式存储 通常由数据线直连电脑就可以用,比如一块新硬盘,只需要利用磁盘模拟器分区,创建文件系统,挂载就可以使用了。 PC中的硬盘或只有一个外部SCSI接口的JBOD存储设备(即…

MySQL---经典SQL练习题

MySQL---经典50道练习题 素材:练习题目:解题: 素材: 1.学生表 Student(SId,Sname,Sage,Ssex) SId 学生编号,Sname 学生姓名,Sage 出生年月,Ssex 学生性别 2.课程表 Course(CId,Cname,TId) CId 课程编号,Cname 课程名称,TId 教师编号 3.教师表 Teacher(T…

一万六千字大章:Chrome 浏览器插件 V3 版本 Manifest.json 文件全字段解析

Chrome 浏览器插件 V3 版本 Manifest.json 文件全字段解析 Manifest.json 文件格式 每个扩展程序的根目录中都必须有一个 manifest.json 文件,其中列出了有关该扩展程序的结构和行为的重要信息。 1、Demo 展示 1. 最小文件 {"manifest_version": 3,&quo…

Redis--Zset使用场景举例(滑动窗口实现限流)

文章目录 前言什么是滑动窗口zset实现滑动窗口小结附录 前言 在Redis–Zset的语法和使用场景举例(朋友圈点赞,排行榜)一文中,提及了redis数据结构zset的指令语法和一些使用场景,今天我们使用zset来实现滑动窗口限流&a…

从初学者到专家:Dubbo中Application的终极指南【十一】

欢迎来到我的博客,代码的世界里,每一行都是一个故事 从初学者到专家:Dubbo中Application的终极指南【十一】 前言Application组件的重要性Application 在 Dubbo 中的定义Application 的作用和重要性Dubbo 应用程序的生命周期 配置和使用Appli…

往docker中cloudbeaver的容器添加达梦数据库、impala数据库连接支持(cloudbeaver添加自定义数据连接)

cloudbeaver默认没有开放impala连接,更不会支持国产数据库了 docker安装运行cloudbeaver可以参考文章:docker安装运行CloudBeaver并设置默认语言为中文 本文跳过cloudbeaver镜像拉取,直接就开始实现自定义数据库连接功能 1、初始化cloudbe…

卷级实时备份功能特点及应用场景

为满足部分对RTO和RPO指标敏感的用户需求,云祺科技通过结合卷远程复制技术和持续数据保护技术、以及高可用技术的原理,推出了一款基于卷为最小处理单元的实时容灾备份产品,其对于备份源对象具有良好的兼容性,无论是文件、影音、应…

json-server的基础使用

json-server 是什么? 用来快速搭建模拟的 REST API 的工具包 可以30秒内快速为我们搭建一个假的基于 REST API的服务 我们要如何使用呢? 1.先安装 //全局安装 npm i -g json-server 2.创建文件 db.json 我们需要在db.json放入一点内容 放入示例: {/…

带你解析Git的基础功能(三)

文章目录 前言一.远程仓库的概念二.远程仓库的操作2.1新建远程仓库2.2 克隆远程仓库2.3 向远程仓库推送2.4 拉取远程仓库2.5 忽略特殊⽂件2.6 标签管理 三.Git实战场景3.1 Git多人实战场景一准备工作由开发者1和开发者2新增加文件内容。将dev的文件合并到master上总结 3.2 Git多…

TypeScript实现一个贪吃蛇小游戏

游戏效果 文件目录 准备1&#xff1a;新建index.html&#xff0c;编写游戏静态页面 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-…

微店商品详情API(micro.item_get)的数据分析和挖掘

随着电商行业的迅猛发展&#xff0c;微店作为电商平台的重要组成部分&#xff0c;提供了丰富的API接口供开发者使用。其中&#xff0c;微店商品详情API&#xff08;micro.item_get&#xff09;是用于获取商品详情的接口&#xff0c;为数据分析和挖掘提供了大量有价值的数据源。…

域环境权限提升

Windows系统配置错误 在Windows系统中&#xff0c;攻击者通常会通过系统内核溢出漏来提权&#xff0c;但是如果碰到无法通过系统内核溢出漏洞法国提取所在服务器权限的情况&#xff0c;就会系统中的配置错误来提权。Windows系统中常见哦欸之错误包括管理员凭证配置错误&#x…

人才测评,招聘软件研发经理的胜任素质模型与任职资格

招聘软件研发经理的胜任素质模型和任职资格是确保能够招聘到胜任的人才的重要组成部分。以下是详细的说明&#xff1a; 一、胜任素质模型 1.技术能力 软件研发经理需要具备深厚的技术能力&#xff0c;对软件开发的各个方面有深入的理解和掌握。他们需要掌握多种编程语言和…

c# 视频播放之Vlc.DotNet.Forms

先说下优缺点 优点&#xff1a;与电脑无关&#xff0c;能播放主流编码格式视频。 缺点&#xff1a;只能播放本地视频&#xff0c;网络视频播放不了。 下面是具体操作和代码 1. 安装Vlc.DotNet.Forms 和 VideoLAN.LibVLC.Windows Vlc.DotNet.Forms 是播放库&#xff0c;Vid…

算法 动态分析 及Java例题讲解

动态规划 动态规划&#xff08;英语&#xff1a;Dynamic programming&#xff0c;简称 DP&#xff09;&#xff0c;是一种在数学、管理科学、计算机科学、经济学和生物信息学中使用的&#xff0c;通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划常常适…