希尔伯特旅馆里,住着AI的某种真相

news2024/12/23 18:25:31

a2fb7d5d7904a6e24f783847be5a0a2c.jpeg

“无穷”和“无穷+1”,哪个更大?

已经吸收了不知道多少数据的AI模型,和比他多学习一条数据的模型,哪个更智能?

想聊聊这个问题,出于一个偶然的机会。很早之前我在测试ChatGPT的时候,突然想问他个刁钻问题,于是就问它:“希尔伯特旅馆悖论,对现实世界有什么影响?”

9b78e5bd8981127091bb0e5e1711b296.png

说实话,ChatGPT答的驴唇不对马嘴,还硬拗出几点,有他一贯的特色。但其中一段回答值得琢磨。他答:“希尔伯特旅馆对于计算机科学是有帮助的,因为当我们处理无限大的数据集时,希尔伯特旅馆可以作为我们思考方式。”

无限大的数据集,这东西显然不存在。但当大模型训练用的数据参数达到某种天文数字,当真人反馈机制成为常态,模型在使用过程中会接触难以估量的数据。这难道不是某种无限吗?

但人类能控制无限吗?

今天这个话题,其实更接近某种科幻讨论,或者一些关于AI未来的脑洞。可能大家读完之后也不清楚在说什么。但也无妨,我们就当一起舒展一下大脑,放松一下最近被ChatGPT弄得挺焦躁的心情。

一起去希尔伯特旅馆,度个假吧。

欢迎来到,悖论旅馆

c26aa8421b3ce8173162366b17f91b27.png

这家旅馆坐落在名叫“数学”的热带风情度假胜地,有的人来了不想走,有的人一想到它就口干舌燥。

希尔伯特旅馆,其实是德国数学家大卫·希尔伯特在讨论无穷这个概念时,举的一个生动例子。它既是一个数学游戏,也经常跻身知名的若干悖论之一。

它的具体意思是说,假设一家旅馆有无穷个房间,但是都住满了。这时候又来了一位旅客要订房间,酒店主人就可以不慌不忙,让1号房间客人移到2号,2好移3号……以此类推,反正房间数量是无穷的,这样新的旅客就可以住1号房间。

而这时,又来了一车旅客。酒店主人依旧如法炮制,让每个房间的客人都向后移动N个房间,最终把新来的客人安置进去。

73aa264a1913e2611649d8b9f7210a9d.png

以此类推,接下来会发生什么呢?假如新来了无穷个客人。那么酒店老板只需要让每位客人都移到单号房间。比如2号房间移到3号房间,3号房间移到5号房间,把偶数房间都空出来,那么无穷个客人依旧可以住进去。

即使来了无穷多个旅行团,每个旅行团有无穷多位旅客,希尔伯特酒店依旧有办法,只需要把非2n(n∈N+)号房间就都空出来就行了。

希尔伯特旅馆之所以是个悖论,因为它标明了这样一件事:无穷是无法比较的。

无穷+1等于无穷;无穷+N等于无穷,无穷加无穷,无穷乘无穷,那还是无穷,无穷是纹丝不动的,又是随时变化的,无穷是可以包含若干个无穷的。

总之,无穷是难以名状的。

3093c9172f311001a725e1a6862ecd2f.png

无穷这玩意,会有点怪

听上去,希尔伯特旅馆悖论好像没啥用。其实不然,人类在很多领域几乎都必然面对“无穷”这个问题,至少在理论推导和概念验证环节,面对无穷几乎是必然的。一个事物可以比另一个更无穷,但它们俩都还是无穷。这样的思路可以进行很多假设,也可以解释很多问题。

1674f634b995f84437725daf6bf372ac.png

比如说,在物理学当中,希尔伯特旅馆悖论可以来解释量子物理学中的很多现象,其中最典型的就是量子场论中关于虚粒子的假设。关于虚粒子是否真实存在,抑或是一种纯粹的假设工具,这个问题有着非常多的争论,但它确实可以用来解释引力、光子、胶子等物理定义,进而为解释真空中的能量情况,分析宇宙辐射做出帮助。前提在于,我们需要用希尔伯特旅馆的思维,来理解存在于无穷中的虚粒子。

在计算机科学中,数据存储是个基本问题,而在设计数据结构的时候,就需要考虑如果有海量数据需要存储,结构上究竟如何调动能够保证效率最优,故障率最低。这时就需要假定数据集是无穷的,希尔伯特旅馆也就用上了。

668b50d05e56ebec1edf7e8edd115d44.png

无穷很怪,这个概念还经常被用在文学创作,尤其是科幻小说当中。科幻是对未来的推演,但如果某件事可以增长到无穷,它往往会出现反常识的状态。比如说永生不死的人,它可能首先就会失去对时间的概念,因为无穷的时间已经没有意义了,进而表现出完全失去人类的一切特征,毕竟人类的所思所为,都是在时间有限这个前提下驱动的。又比如瞬间移动,它会不会让空间失去意义,进而让人失去辨别空间的需求和能力,进而出现从来不想停留下来的人,而始终都在超高速移动的人,究竟还是人吗?

一件事如果逼近甚至抵达无穷,它就会超出控制,出现反常识,反逻辑的一面。这个逻辑,对于AI似乎也适用。

用这个逻辑,解释智能涌现

715026463dd8435a09c7dd045423ef90.png

这几年伴随着预训练大模型的兴起,越来越多的人开始谈“智能涌现”。一般来说,所谓“智能涌现”现象,是指当模型规模突破某个未知的界限后,就会突然涌现出惊人的智能。比如模型会表达出训练者预想不到的逻辑感、流畅性,甚至是人类称之为情商的东西。

事实上,智能涌现作为一个目标,并不是今天才有。早在上世纪70年代,专家机器人的理论构想就是在输入足够多的知识后,让计算机展现出一种无所不知,无所不晓的效果,从而帮助人类解决各种问题。只是碍于当时的算力与数据承载能力,最终这个设想无法落地。

而在今天云计算+大数据的组合下,更大规模的数据集可以应用到AI训练中,加上深度学习在算法上实现了更好的数据吸纳能力,才最终产出了ChatGPT为代表的智能涌现现象。

665c2fbe4844c601f4555ebc27c22feb.png

智能涌现到底是怎么实现的,这一点就像深度学习的黑箱性一样,始终没有特别合理的解释。但“智能涌现”这个词却不是AI专有的,这个词更早是一个生物学词汇,是用来描述蚂蚁、鱼群表现出的集体智能行为。一只蚂蚁挺傻的,一条鱼也不聪明,但当大量蚂蚁聚集到一起,所表现出的那种分工明确、体系森严、结构精巧的组织行动方式,简直让人叹为观止。是蚂蚁的大脑进化了吗?恐怕并不是,而是在蚂蚁聚集到一定规模后,突破了某种希尔伯特旅馆式的智能边界。

从这个角度看,大模型这条AI之路,或许终极目标并不是模仿人类。它不需要进化出直觉、情感、自由意识这些人类独有的东西。但它会积累无穷多的数据和知识,当我们无法观测和预估大模型里拥有多少知识,那么它就有无穷的知识。AI模型就变成了一座类希尔伯特旅馆,它可以吞噬更多知识,吞噬更多无穷,最终可以表现出人类想要的智能,也可能表现出更多人类不想要,或者没准备好想要的东西。

b8c643e2c3ece3c7bdca4296835d5b11.png

或许我们改换个思路,最终的通用人工智能AGI、强人工智能Strong AI,可能内在机制并不类似于人类,而是更近乎蚂蚁,近乎鱼群,近乎希尔伯特旅馆。

我们总是讨论AI像不像人,能不能做人类所做的,人类有哪些独有能力,巴拉巴拉巴拉。这是因为我们不住在希尔伯特旅馆里,我们住在一个有限的世界,住在短暂的生命和易朽的躯壳里,住在一个绝大部分构成物是水的大脑里。但AI不是,它相比人类更加贴近无穷。他能通过图灵测试,他最终能做到一切。但我们并不知道为什么,因为AI并不想成为人,他只是刚好住在希尔伯特旅馆里。

“智能涌现”或许是个征兆,它告诉我们,AI的进化目标不是人类,而是《星际争霸》里的虫族。

2944701f527b80fbb65224d260da2172.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/582109.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

简单工厂、工厂方法、抽象工厂模式-这仨货的区别

要想明白这三玩意的区别就需要知道这三玩意的优缺点; 之所以有三种工厂模式,就说明它们各有所长,能解决不同场景的问题; 一、简单工厂模式 UML图 代码 public class MobileFactory {public static Mobile getMobile(String brand)…

【Linux】线程概述、创建线程、终止线程

目录 线程概述1、创建线程函数解析代码举例 2、终止线程函数解析代码举例 橙色 线程概述 与进程类似,线程是允许应用程序并发执行多个任务的一种机制。一个进程可以包含多个线程。 进程是 CPU 分配资源的最小单位,线程是操作系统调度执行的最小单位。…

回归预测 | MATLAB实现SSA-CNN-LSTM麻雀算法优化卷积长短期记忆神经网络多输入单输出回归预测

回归预测 | MATLAB实现SSA-CNN-LSTM麻雀算法优化卷积长短期记忆神经网络多输入单输出回归预测 目录 回归预测 | MATLAB实现SSA-CNN-LSTM麻雀算法优化卷积长短期记忆神经网络多输入单输出回归预测预测效果基本介绍模型描述程序设计学习总结参考资料 预测效果 基本介绍 MATLAB实现…

【笔记整理】轻量级神经网络 MobileNetV3

【笔记整理】轻量级神经网络 MobileNetV3 文章目录 【笔记整理】轻量级神经网络 MobileNetV31、深度可分离卷积2、翻转残差块和线性瓶颈结构3、h-swish 函数和 SE 模块4、网络结构搜索 近年来关于 CNN 的研究在飞速发展,CNN 模型在目标检测、图像分割等领域都取得了…

力扣sql中等篇练习(二十九)

力扣sql中等篇练习(二十九) 1 计算每个销售人员的影响力 1.1 题目内容 1.1.1 基本题目信息1 1.1.2 基本题目信息2 1.1.3 示例输入输出 a 示例输入 b 示例输出 1.2 示例sql语句 # Write your MySQL query statement below SELECT s1.salesperson_id,s1.name,IFNULL(t.total…

毕业季到底是去大厂还是去小公司

(点击即可收听) 毕业季到底是去大厂还是去小公司 相信很多人在选择大小公司的时候,会比较痛苦,外面的人想进去,里面的人想出来,至于选择大厂还是小公司 这是因人而异的,不同的阶段都可以有不同的选择 进大厂不一定就是对的,进小公司也不一定就是错的,学习东西,增长经…

股票量化分析工具QTYX使用攻略——涨停个股挖掘热门板块(更新2.6.5)

搭建自己的量化系统 如果要长期在市场中立于不败之地!必须要形成一套自己的交易系统。 行情不等人!边学习边实战,在实战中学习才是最有效地方式。于是我们分享一个即可以用于学习,也可以用于实战炒股分析的量化系统——QTYX。 QTY…

软考A计划-试题模拟含答案解析-卷九

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例 👉关于作者 专注于Android/Unity和各种游戏开发技巧,以及各种资源分享&am…

JetBrains的多数据库管理和SQL工具DataGrip 2023版本在Win10系统的下载与安装配置教程

目录 前言一、DataGrip 安装二、使用配置总结 前言 DataGrip是一款多数据库管理和SQL工具,适用于不同类型的数据库。它提供了丰富的功能和工具,可以帮助开发人员更高效地管理数据库、编写SQL查询和执行数据操作。 DataGrip的主要特点: ——…

这里有3个Tips,也许可以帮你躲过ChatGPT大规模封号 | AIGC实践

据说,从昨天开始,ChatGPT又双叒叕开始大规模封号,很多注册用户收到这样一则消息: 大意是说:OpenAI 发现了你的 ChatGPT 账号存在可疑活动,为了保障平台安全,已自动退款并取消你的 ChatGPT Plus …

驱动开发:内核解析内存四级页表

当今操作系统普遍采用64位架构,CPU最大寻址能力虽然达到了64位,但其实仅仅只是用到了48位进行寻址,其内存管理采用了9-9-9-9-12的分页模式,9-9-9-9-12分页表示物理地址拥有四级页表,微软将这四级依次命名为PXE、PPE、P…

七年老程序员的三四月总结:三十岁、准备婚礼、三次分享

你好,我是 shixin,一名工作七年的安卓开发。 每两个月我会做一次总结,记下这段时间里有意义的事和值得反复看的内容,为的是留一些回忆、评估自己的行为、沉淀有价值的信息。 一转眼 2023 年过去了三分之一,这两个月经历…

【数据湖仓架构】数据湖和仓库:Databricks 和 Snowflake

是时候将数据分析迁移到云端了。我们比较了 Databricks 和 Snowflake,以评估基于数据湖和基于数据仓库的解决方案之间的差异。 在这篇文章中,我们将介绍基于数据仓库和基于数据湖的云大数据解决方案之间的区别。我们通过比较多种云环境中可用的两种流行技…

HTML+CSS+JavaScript制作弹幕效果

全屏弹幕 <!DOCTYPE html> <html> <head><meta charset"UTF-8"><title>弹幕效果</title><style>/* 设置弹幕的样式 */.bullet {position: absolute;font-size: 20px;color: white;text-shadow: 1px 1px 1px black;white-s…

用Python让小朋友的手绘图跳起来(附源码)

大家好&#xff0c;我是小F&#xff5e; 今天给大家介绍一个非常有趣的项目&#xff0c;基于AI识别&#xff0c;制作儿童手绘图舞蹈图。 只需几分钟&#xff0c;就能自动生成儿童手绘人物或类人角色&#xff08;即具有双臂、两条腿等的角色&#xff09;的动画&#xff0c;而且生…

波奇学C++:模板和STL

什么是模板&#xff1f;为什么我们需要模板&#xff1f; 先假设一个场景&#xff0c;我们要编写一个函数交换a,b两个数的值 void swap(int& a,int& b) {int cmpa;ab;ba; } swap函数可以帮我们交换两个int型的值&#xff0c;那如果要交换的类型是float&#xff0c;do…

基础篇010.1 STM32驱动RC522 RFID模块之一:基础知识

目录 1. RFID概述 1.1 RFID工作原理 1.2 RFID分类 1.3 RFID模块 1.4 RFID卡片 1.5 IC卡和ID卡介绍 1.6 IC卡和ID的区分 2. Mifare卡结构原理 2.1 Mifare卡概述 2.2 Mifare非接触式 IC 卡性能简介&#xff08;M1&#xff09; 2.2.1 Mifare S50与Mifare S70 2.2.2 S5…

操作系统的发展史

█ DOS操作系统 上期提到&#xff0c;20世纪70年代&#xff0c;伴随着计算机技术的成熟&#xff0c;操作系统也进入了一个快速发展阶段。现代操作系统的概念&#xff0c;也在那一时期逐渐形成。 1975年初&#xff0c;MITS电脑公司推出了基于Intel 8080芯片的Altair 8800微型计算…

7 种常见的路由协议

网络路由是网络通信的重要组成部分&#xff0c;通过互联网将信息从源地址移动到目的地的过程。路由发生在 OSI 模型的第 3 层&#xff08;网络层&#xff09;。实际网络中通常会将静态和动态路由结合使用。静态路由适用于小型网络&#xff0c;而动态路由适用于大型网络。 什么…

Office project 2013安装

哈喽&#xff0c;大家好。今天一起学习的是project 2013的安装&#xff0c;Microsoft Office project项目管理工具软件&#xff0c;凝集了许多成熟的项目管理现代理论和方法&#xff0c;可以帮助项目管理者实现时间、资源、成本计划、控制。有兴趣的小伙伴也可以来一起试试手。…