人工智能将成为数学家的“副驾驶”

news2024/12/29 11:08:45

人工智能将成为数学家的“副驾驶”

在这里插入图片描述

数学传统上是一门独立的科学。1986年,安德鲁·怀尔斯为了证明费马定理,退到书房里呆了7年。由此产生的证明往往很难让同事们理解,有些至今仍有争议。但近年来,越来越多的数学领域被严格地分解为各自的组成部分(“形式化”),证明可以由计算机进行检查和验证。

加州大学洛杉矶分校的Terence Tao相信,这些方法为数学领域的合作开辟了全新的可能性。如果再加上人工智能的最新进展,未来几年该领域可能会出现全新的工作方式。在计算机的帮助下,尚未解决的大问题可能更接近于解决。陶在接受《科学美国人》的德语姊妹刊物《光谱》(spectrum der Wissenschaft)采访时阐述了他对未来的看法。

[以下是经过编辑的采访实录。]

在你在旧金山联合数学会议上的一次演讲中,你似乎暗示数学家之间并不相互信任。你这话是什么意思?

我是说,我们有,但你得认识个人。除非你能逐行检查他们的工作,否则很难与素未谋面的人合作。通常情况下,5个是合作者的最大数量。

随着自动校验器的出现,这种情况是如何改变的?

现在你可以和几百个你从未见过的人合作。你不需要信任他们,因为他们上传代码,Lean编译器会验证它。你可以做比我们通常做的更大规模的数学。当我用所谓的多项式Freiman-Ruzsa (PFR)猜想形式化我们最近的结果时,[我和]20多人一起工作。我们把证明分解成很多小步骤,每个人都对其中一个小步骤做出了证明。我不需要逐行检查贡献是否正确。我只需要管理整个事情,确保一切都朝着正确的方向发展。这是一种不同的数学方法,一种更现代的方法。

德国数学家、菲尔兹奖得主彼得·肖尔兹(Peter Scholze)参与了一个精益项目——尽管他告诉我他对计算机了解不多。

对于这些形式化项目,并不是每个人都需要成为程序员。有些人只关注数学方向;你只是把一个大的数学任务分成很多小的部分。还有一些人专门研究将这些小片段转化为正式的证明。我们不需要每个人都是程序员;我们只需要一些程序员。这是一种分工。

我在20年前就听说过机器辅助证明,当时它还是一个非常理论化的领域。每个人都认为你必须从头开始——将公理形式化,然后做基本的几何或代数——而进入高等数学超出了人们的想象。是什么改变了形式数学的实用性?

有一件事发生了变化,那就是标准数学库的发展。尤其是Lean,它有一个叫做mathlib的大型项目。所有本科数学的基本定理,如微积分和拓扑学等,都被一个接一个地放在这个图书馆里。因此,人们已经投入了工作,从公理到一个相当高的水平。我们的梦想是让图书馆达到研究生的教育水平。这样,(数学的)新领域的形式化就容易得多了。也有更好的搜索方法,因为如果你想证明一些东西,你必须能够找到那些已经被证实是真的东西。所以智能搜索引擎的发展也是一个重要的新发展。

所以这不是计算能力的问题?

不,一旦我们正式确定了整个PFR项目,只花了半个小时来编译验证。这不是瓶颈,而是让人们使用它,可用性,用户友好性。现在有一个成千上万人的大社区,还有一个非常活跃的在线论坛来讨论如何使语言变得更好。

精益是最先进的还是存在竞争系统?

精益可能是最活跃的社区。对于单个作者的项目,也许有一些其他的语言稍微好一些,但是总的来说,Lean更容易上手。它有一个很好的图书馆和一个很好的社区。它最终可能会被另一种语言所取代,但现在它是占主导地位的形式语言。

当你做一个关于另一个数学项目的演讲时,有人问你是否想把它形式化,你基本上说这需要很长时间。

我可以把它正式化,但要花我一个月的时间。现在,我认为我们还没有达到将一切例行公事形式化的地步。你必须挑选。你只想把那些真正对你有用的东西形式化,比如教你如何在精益中工作,或者其他人是否真的关心这个结果是否正确。但这项技术会越来越好。所以我认为在很多情况下,更明智的做法是等待,直到它变得更容易。它不需要花费10倍的时间来形式化,而是花费传统方法的两倍的时间。

你甚至说过要把这个因子降到小于1。

有了人工智能,就有可能做到这一点。我想在将来,我们会向一些GPT解释它们,而不是打印我们的证明。GPT会尝试在精益中将其形式化。如果一切顺利,GPT就会说:“这是你用LaTeX写的论文;这是你的精益证明。如果你愿意,我可以按下这个按钮,帮你把它提交给杂志。”它将来会是一个很棒的助手。

到目前为止,证明的想法仍然来自人类数学家,不是吗?

是的,最快的形式化方法是首先找到人类的证据。人类提出的想法,证明的初稿。然后把它转化为形式证明。在未来,也许事情会有所不同。可能会有一些合作项目,我们不知道如何证明这一切。但是人们有关于如何证明小片段的想法,他们将其形式化,并试图将它们组合在一起。在未来,我可以想象一个大定理是由20个人和一群人工智能共同证明的,每个人工智能都证明了一些小事情。随着时间的推移,它们会连接起来,你就可以创造出一些奇妙的东西。那太好了。这甚至要等很多年才能实现。技术还没有到位,部分原因是目前正规化太痛苦了。

我曾与一些人交谈过,他们试图使用大型语言模型或类似的机器学习技术来创建新的证明。Tony Wu和Christian Szegedy最近与Elon Must等人共同创立了xAI公司,他们告诉我,在两到三年内,数学将像解决国际象棋一样被“解决”——机器将比任何人类都更擅长寻找证明。

我认为三年内人工智能将对数学家有用。这将是一个伟大的副驾驶。你试图证明一个定理,你认为有一步是正确的,但你不太清楚它是如何正确的。你可以说,“人工智能,你能帮我做这些事吗?”它可能会说,“我想我可以证明这个。”我不认为数学会被解决。如果人工智能有另一个重大突破,那是有可能的,但我想说的是,在三年内,你会看到显著的进步,人工智能的实际应用将变得越来越容易管理。即使人工智能可以完成我们现在所做的数学运算,这也意味着我们将会进入到一个更高类型的数学。现在,举个例子,我们一次证明一个。这就像一个个工匠在做一个木制娃娃或别的什么东西。你拿一个娃娃,仔细地把所有的东西都涂上,以此类推,然后你拿另一个。我们做数学的方式并没有太大的改变。但在其他学科中,我们都有大规模生产。所以有了人工智能,我们可以一次证明数百或数千个定理。人类数学家将指导人工智能做各种事情。所以我认为我们做数学的方式会改变,但他们的时间框架可能有点激进。

2018年彼得·舒尔茨获得菲尔兹奖时,我采访了他。我问他,有多少人明白你在做什么?他说大概有10个人。

在形式化项目中,我们注意到的是,你可以与那些不了解整个项目的全部数学原理的人合作,但他们只了解其中的一小部分。就像任何现代设备一样。没有一个人可以自己造出一台电脑,开采所有的金属,提炼它们,然后制造硬件和软件。我们有所有这些专家,我们有一个庞大的物流供应链,最终我们可以创造出智能手机或任何东西。现在,在数学合作中,每个人都必须了解几乎所有的数学知识,正如[Scholze]提到的那样,这是一个绊脚石。但是有了这些形式化,就有可能只知道其中的一部分就对项目进行划分和贡献。我认为我们也应该开始将教科书正规化。如果教科书是形式化的,你可以创建这些非常互动的教科书,在那里你可以描述一个结果的证明,在一个非常高级的意义上,假设有很多知识。但是如果有你不明白的步骤,你可以扩展它们并进入细节——如果你愿意的话,一直到公理。现在还没有人在教科书上这么做,因为工作量太大了。但如果你已经把它形式化了,电脑可以为你创建这些互动教材。这将使一个领域的数学家更容易开始为另一个领域做出贡献,因为您可以精确地指定一个大任务的子任务,而不需要了解所有内容。

数学证明不仅仅是检查某件事是否正确。证明也是关于理解的,对吧?有漂亮的证明,也有非常技术性的丑陋证明。好的证明能使你对问题有更好的理解。所以,如果我们把这个任务交给机器,我们还能理解它们所发现的东西吗?

数学家所做的是我们在探索什么是真,什么是假,以及为什么事情是真的。我们的方法是通过证明。每个人都知道,当它是真的,我们必须去证明它或反驳它。这要花很多时间。它是乏味的。但在未来,也许我们会问人工智能,“这是真的还是假的?”我们可以更有效地探索空间,我们可以试着专注于我们真正关心的事情。人工智能将通过加速这一过程来帮助我们。我们还会继续开车,至少现在是这样。也许50年后情况会有所不同。但在短期内,人工智能将首先自动化无聊、琐碎的工作。

人工智能会帮助我们解决数学中悬而未决的大问题吗?

如果你想证明一个未解决的猜想,你需要做的第一件事就是把它分解成更小的部分,每一个都有更大的机会被证明。但是你经常会把一个问题分解成更困难的问题。把一个问题转化为一个更难的问题比转化为一个更简单的问题容易得多。在这方面,人工智能并没有表现出比人类更好的能力。

通过分解问题并探索它,你也会在这个过程中学到很多新东西。例如,费马大定理,是一个关于自然数的简单猜想,但是用来证明它的数学不再是关于自然数的了。所以解决一个证明不仅仅是证明这一个例子。

假设一个人工智能提供了一个难以理解的、丑陋的证据。然后你就可以处理它,分析它。假设这个证明用了10个假设得到一个结论——如果我删除一个假设,这个证明还有效吗?这是一门目前还不存在的科学,因为我们还没有那么多人工智能生成的证明,但我认为会有一种新型的数学家,他们会利用人工智能生成的数学,让它变得更容易理解。比如,我们有理论科学和实验科学。有很多东西是我们凭经验发现的,但是我们做了更多的实验,我们发现了自然规律。我们现在在数学中不这么做。但我认为会有一个行业的人试图从最初没有任何洞察力的人工智能证据中提取洞察力。

那么,这不是数学的终结,而是数学的光明未来吗?

我认为会有不同的方法来做数学,只是现在还不存在。我可以看到项目经理数学家能够组织非常复杂的项目——他们并不理解所有的数学,但他们可以把事情分解成更小的部分,并把它们委派给其他人,他们有很好的人际交往能力。还有在子领域工作的专家。有些人擅长训练AI学习特定类型的数学,有些人可以将AI的证明转化为人类可读的东西。它将变得更像几乎所有其他现代工业的运作方式。比如,在新闻业,不是每个人都有相同的技能。有编辑,有记者,有商人,等等——我们最终会在数学领域有类似的东西。

我们所做的数学是与我们的大脑相匹配的,不是吗?如果在某一时刻人工智能变得如此聪明,它可能会进入我们难以理解的领域。

数学已经比任何一个人的头脑都要大。数学家通常依赖于其他人已经证明的结果。他们知道为什么它是对的,他们有一些直觉,但是他们不能把它分解成公理。但他们知道去哪里找,或者他们认识能找到的人。我们已经有了很多定理,这些定理只能通过计算机来验证,一些大规模的计算机计算已经检查了上百万种情况。你可以手工验证,但没人有时间这么做,也不值得。所以我认为我们会适应。一个人检查一切是没有必要的。让电脑帮我们检查,我觉得没问题。

在数学的前沿,有很多事情发生,把看似不相关的领域联系在一起,根据我天真的理解,一个了解所有这些领域的人工智能可以给你一个提示,说:“你为什么不看看那里?这也许能帮你解决问题。”

这是人工智能的一个非常令人兴奋的潜在用途,它可以创造联系,或者至少指出可能的联系。现在它的成功率非常低。它可能会给你10个建议,其中一个是有趣的,9个是垃圾。实际上,这几乎比随机还要糟糕。但这在未来可能会改变。

训练数学人工智能的道路上有什么问题?

部分问题在于它没有足够的数据来进行训练。网上有发表的论文,你可以在上面进行训练。但我认为很多直觉并不是在期刊上的印刷论文中捕捉到的,而是在与数学家的对话中,在讲座中,在我们给学生的建议中。有时我开玩笑说,我们需要做的是让GPT去接受标准的研究生教育,坐在研究生课上,像学生一样提问,像人类学习数学一样学习。

已发表的证明版本总是简明扼要的。即使你把人类历史上发表的所有数学数据都算进去,与这些模型训练的内容相比,它仍然很小。

人们只发表成功的故事。真正宝贵的数据来自于当某人尝试某件事时,它不太奏效,但他们知道如何解决它。但他们只发表成功的东西,而不是过程。

也许你应该努力证明些什么,比如医学研究。研究人员会注册它,然后即使它没有成功,他们也必须发表它。

我们没有那种文化。也许将来形式化会变得非常有效,你可以实时形式化。也许如果你想在一个研究项目中使用2040年的人工智能精益,你想获得使用这种人工智能的资金,你必须同意你尝试事物和失败的过程被记录下来。然后可以用来训练未来的人工智能。或者其他小组也在解决类似的问题,他们可以看到,“哦,另一个小组也做了同样的事情,但他们失败了,”这样你就不用浪费时间犯同样的错误了。

数学家是不是浪费了很多时间?

哦,非常喜欢。如此多的知识不知何故被困在数学家的头脑中。只有一小部分是明确的。但是我们形式化得越多,我们的隐性知识就会变得越明确。所以这会带来意想不到的好处。

这篇文章最初出现在《光谱》杂志上,并经许可转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1820839.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

汇编:EFLAGS寄存器

EFLAGS寄存器是x86架构处理器中的一个状态寄存器,用于存储当前处理器状态和控制特定操作;寄存器中的各个标志位可以影响指令执行,并且指令执行过程中也可以修改这些标志位,每个位都有特定的含义。 EFLAGS寄存器图示: …

振弦采集仪在隧道工程中的安全监测与控制研究

振弦采集仪在隧道工程中的安全监测与控制研究 隧道工程的安全监测与控制是保障隧道施工和运营安全的重要工作。隧道工程常面临的问题包括地层变形、地下水位变化、地震影响等,这些问题对隧道结构的安全性和使用寿命有着重要影响。因此,隧道工程中的安全…

【CS.AI】AI引领编程新时代:深度探索GitHub Copilot

文章目录 引言0. TOP TAKEAWAYS 重要要点1. Copilot的基本功能2. 技术原理3. 优势与局限优势局限 4. 使用体验4.1 初次使用4.2 在 JetBrains 全家桶中使用 GitHub Copilot1. 安装插件2. 配置插件3. 使用 GitHub Copilot 4.3 日常开发4.4 体验与反馈 5. 对开发者生态系统的影响5…

零碳产业园区建设指南案例

零碳产业园区的建设一直备受广泛关注,特别是在我国碳达峰碳中和的背景下。据不完全统计,目前,全国共有国家级和省级园区2500余家,这些园区在贡献了全国50%工业产出的同时,其CO2排放量也占到了全国排放总量的30%以上。作…

VMware安装ubuntu22.4虚拟机超详细图文教程

一 、下载镜像 下载地址:Index of /ubuntu-releases/22.04.4/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 二、创建虚拟机 打开VMware点击左上角文件,创建新的虚拟机,打开后如下图: 下一步,镜像文件就是…

光纤跳线(又称光纤连接器)的种类

光纤跳线(又称光纤连接器),也就是接入光模块的光纤接头,也有好多种,且相互之间不可以互用。SFP模块接LC光纤连接器,而GBIC接的是SC光纤连接器。下面对网络工程中几种常用的光纤连接器进行详细的说明&#x…

3d交互式场景在线编辑平台的好处

在数字化教学的新时代,我们为您带来了革命性的产品——VR全景展示搭建编辑器。它将传统的教学方式升级为三维模式,让课程训练更加真实生动,为您带来前所未有的学习体验。 VR全景展示搭建编辑器不仅支持视频录播、PDF、图文等多种内容承载方式…

非阻塞IO简介和代码实例

接上篇 阻塞IO、非阻塞IO、IO多路复用和信号驱动IO简介-CSDN博客文章浏览阅读90次。阻塞IO、非阻塞IO、IO多路复用和信号驱动IO简介https://blog.csdn.net/CSDN_DU666666/article/details/139598410?csdn_share_tail%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%2…

Matlab|基于主从博弈的智能小区代理商定价策略及电动汽车充电管理

目录 一、主要内容 二、部分代码 三、程序结果 四、下载链接 一、主要内容 主要做的是一个电动汽车充电管理和智能小区代理商动态定价的问题,将代理商和车主各自追求利益最大化建模为主从博弈,上层以代理商的充电电价作为优化变量,下层以…

用PlayCanvas打造一个3D模型

本文由ScriptEcho平台提供技术支持 项目地址:传送门 基于 PlayCanvas 的 3D 物理场景开发 应用场景介绍 PlayCanvas 是一款功能强大的 3D 引擎,可用于创建各种类型的 3D 体验,包括游戏、模拟和交互式可视化。本技术博客将介绍如何使用 Pl…

低成本和颜值兼顾的 HomeLab 设备:HPE MicroServer Gen10(二)

本篇文章,继续分享另外一台端午假期折腾的设备,HP MicroServer Gen10 一代。同样分享下我的折腾思路,希望能够帮助到有类似需求的你。 写在前面 Gen10 “标准版”(第一代)和 Plus 版本设计风格一致,同样颜…

20240607在ubuntu下解压缩7z的压缩包文件

20240607在ubuntu下解压缩7z的压缩包文件 2024/6/7 10:26 百度:ubuntu 7z解压缩 在Ubuntu中,可以使用7z命令来解压.7z文件。首先,确保你已经安装了p7zip-full包,如果没有安装,可以使用以下命令安装: sudo …

预告|博睿数据将受邀出席GOPS全球运维大会北京站!

GOPS全球运维大会作为国内外运维领域最具影响力的技术盛会之一,旨在汇聚全球运维精英,分享运维领域的前沿技术、实践经验与创新理念。6月28日,博睿数据(bonree.com,股票代码688229)将受邀出席第二十三届 GO…

SQL入门到入土索引优化,聚合函数,数据备份与恢复,事务处理,查询、更新、插入和删除数据库

本人详解 作者:王文峰,参加过 CSDN 2020年度博客之星,《Java王大师王天师》 公众号:JAVA开发王大师,专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生,期待你的关注和支持!本人外号:神秘小峯 山峯 转载说明:务必注明来源(注明:作者:王文峰…

巨头 VC 间的博弈:一文了解 Paradigm 及 Lido 支持的再质押协议 Symbiotic

撰文:Yangz,Techub News 作为此轮牛市中少有的 DeFi 热门叙事,再质押赛道迎来又一位重磅选手。6 月 11 日,Symbiotic 宣布完成初步部署并在 Paradigm 和 Cyber Fund 领投的种子轮融资中筹集 580 万美元。上线 5 小时后&#xff0c…

FOXMAIL邮箱:高效办公,邮件管理新风尚

随着电子邮件在日常工作和生活中的普及,选择一个高效、易用的邮箱客户端变得尤为重要。FOXMAIL作为一款功能强大、操作简便的邮箱客户端,深受用户喜爱。下面将为您详细介绍FOXMAIL邮箱的使用方法,帮助您轻松掌握其各项功能。 一、下载安装与账…

C++中的结构体——结构体案例2

案例描述 设计一个英雄的结构体,包括成员姓名,年龄,性别;创建结构体数组,其中存放五名英雄 通过冒泡排序的算法,将数组中的英雄按照年龄升序排列,最终打印排序后的结果 五名英雄信息如下&…

OpenCV计算形状之间的相似度ShapeContextDistanceExtractor类的使用

操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:Visual Studio Code编程语言:C11 1.功能描述 ShapeContextDistanceExtractor是OpenCV库中的一个类,主要用于计算形状之间的相似度或距离。它是基于形状上下文(Shape Co…

React基础教程(06):Ref的应用

7、Ref的应用 7.1 给标签设置ref"username" 通过这个获取this.refs.username&#xff0c;ref可以获取到应用的真实dom <input style{{width:300}}ref{"text"}/> {/*非常推荐*/} <Button style{{backgroundColor:#2ba471, border:"none&qu…

基于STM32和人工智能的智能交通管理系统

目录 引言环境准备智能交通管理系统基础代码实现&#xff1a;实现智能交通管理系统 4.1 数据采集模块4.2 数据处理与分析4.3 控制系统4.4 用户界面与数据可视化应用场景&#xff1a;智能交通管理与优化问题解决方案与优化收尾与总结 1. 引言 随着城市化进程的加快&#xff0…