陶哲轩甩出调教GPT-4聊天记录,点击领取大佬的研究助理

news2024/12/24 8:29:31
量子位 | 公众号 QbitAI

鹅妹子嘤,天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT了!

就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用了GPT-4”,后者给他提出了一种可行的解决方法。

借助GPT-4,他不仅成功地突破了这一难题,还将答案分享在了MathOverflow上:

它给我提供了最终的解题思路,接下来我只需要继续计算就行。

为了给更多数学家分享用GPT-4工作的便利性,陶哲轩还将自己的聊天记录po了出来,里面完整地记载了他和GPT-4的对话。

可以看见,在这份聊天记录中,他把GPT-4称呼为“专业数学合作者”,而不仅仅是一个普通的数学助手。

这个身份属实不一般了,不知道之后陶哲轩写论文的时候会不会把GPT-4列为共同作者(手动狗头)。

不仅如此,戳对话记录底部的“continue this conversation”按钮,还能一键把对话记录导入自己的ChatGPT中,突然闯入人类大师和AI的交谈。

陶哲轩解决了什么新问题?

陶哲轩研究的问题,是一个两天前在数学网站MathOverflow上更新的提问。

这个名叫“优雅的递归之A301897”问题,具体长这样:

其中,A301897是一个被整数数列网站OEIS收录的数列:

这个数列中有一系列来自长度为n的排列b的数,它们有一个共同点,就是满足Diaconis-Graham不等式且等号成立。

Diaconis-Graham不等式由戴康尼斯(Persi Diaconis)和葛立恒(没错,就是“最大数”之父Ronald Graham)于1977年共同提出,属于概率统计方面的研究。

显然,这一大段提问中不仅夹杂着大量专业数学公式,而且还涉及需要跳转的网页资料

作为数学公认不太好的“数学菜鸡”,GPT-4真的能像一名专业数学家那样快速读懂公式、给出解决问题的专业建议吗?

事实上,相比直接把问题复制粘贴给GPT-4,陶哲轩做了三件事

  • 首先,做一些提示工程,明确GPT-4的“身份”和“目标”。其中身份是“一个擅长给技巧性建议的数学合作专家”,目标是“提供一些建议”而非解决问题。

  • 然后,相比直接把大段公式复制进GPT-4提问栏(确实可以这样做),陶哲轩选择将问题描述转成Markdown格式

  • 最后,涉及需要GPT-4自己查找资料的内容,陶哲轩将它转变成一个引用注释,并在结尾给出网址。

完整的提问过程长这样:

也就是说,相比让GPT-4直接化身数学家去“解决问题”,陶哲轩只是把它当成一个提供灵感来源的“专家”,给自己建议一些研究的方向。

GPT-4很快给出了8个具体的建议:

1、理解问题:在深入证明之前,确保你理解了问题中的每一项。如果你不熟悉Diaconis-Graham不等式,研究一下它,了解表达式a(n)和R(n, q)中的每一项代表什么。

2、简化表达:有时候,复杂的表达可以被简化。例如,你可能想看看表达式中a(n)的二项式系数是否可以简化,或者是否可以用更简单的方式计算总和。

3、归纳法:由于R(n, q)是递归定义的,因此证明猜想的一种自然方法是使用数学归纳法。你可能想要证明,如果这个猜想对n成立,那么它对n+1也成立。

4、生成函数:另一种方法是使用生成函数。尝试找到a(n)和R(n, 0)的生成函数,然后证明它们是相等的。这有时可以把一个复杂的组合问题变成一个更简单的代数问题。

5、渐近分析:正如你提到的,分析a(n)和R(n, 0)的渐近行为可能会对它们的关系有一些深入的了解。这有时可以用斯特林的阶乘近似来实现,或者通过分析表达式中的主导项来实现。

6、数值证据:虽然不是证明,但收集数值证据有时可以让我们了解如何证明一个猜想。因为你有PARI/GP代码,可以用数值来检查猜想,你可能想读一读每个序列的前几项,看看是否能发现任何模式。

7、寻找类似问题:有时,一个问题或猜想是一个已知问题的泛化或变体。在组合文献中寻找类似的问题或定理,看看它们的证明是否可以适用于这个问题。

8、寻求反馈和合作:不要犹豫,从同事那里寻求反馈,或者在MathOverflow这样的论坛上发布你的部分结果。协作和同行评议通常是解决复杂数学问题的关键。

最终,陶哲轩使用建议4,也就是生成函数的方法,成功解决了问题。

当然,解决问题的过程并不需要用到GPT-4,采用MAPLE工作表+纸笔手动计算就能完成。陶哲轩也尝试了渐进分析(建议5)的方法,不过事实证明还是用生成函数更有效。

简单来说,陶哲轩只是用GPT-4给自己提供不同的解题思路,也就是“解题灵感”,但具体怎么解答,也就是更加数学的方法,他则不会交给GPT-4来完成。

至于“查资料”这种GPT-4的应用,陶哲轩也发挥到了极致。

例如在思考问题时,他还会把自己的“灵光乍现”拿出来和GPT-4讨论一下,例如他觉得这个问题和卡特兰数(Catalan numbers)有相似之处,希望GPT-4帮他查找一下对应的资料。

GPT-4很快给出了对应的回答,这也促使陶哲轩对另一个问题产生了新的灵感。

简单来说,陶哲轩在短短两段与GPT-4的对话中,展示了数学家使用GPT-4的正确姿势——找灵感和查资料。

这样一来,即使“数学菜鸡”如GPT-4,也能成为数学家的AI助理了。

大佬是怎么玩儿GPT的

分享人类大师和AI的聊天记录之余,陶哲轩的乳齿象博文里还附带着一份贴心指南,是他使用ChatGPT和GPT-4的经验之谈。

根据他过去的实操经验,最要紧的第一点:

不要试图让AI直接回答问题,因为这几乎肯定会得到一些看起来专业的废话

为了避免GPT成为废话文学大王,行之有效的方案如下:

让AI扮演合作者的角色,而后让它提供策略建议

Like this:

除此之外,“数学菜鸡”GPT,在大数学家手里能有什么用处?

陶哲轩大概的意思是酱婶儿的:

ChatGPT数学能力虽然不咋滴,但对做学术研究的人来说是个发散思维的好工具。

(对普通人来说有点不太专业,但对搞数学的学术人员来说刚刚好)

怎么解释用来“发散思维”这句话呢?

陶哲轩表达出来的观点是,既然ChatGPT在具体数学问题上给出的答案是不完全正确的,那不如索性发挥发挥它生成答案部分正确的特性。

简而言之,就是让它帮你找灵感balabalabla:

在处理数学问题时,可以让ChatGPT这类大语言模型做一些半成品的语义搜索工作
也就是说,ChatGPT不用提供确切的答案,只用生成一些可能的提示。

这样一来,依据GPT生成的提示+传统搜索引擎搜索,就能很轻松get答案。

而且他还自曝,在GPT-4发布之前,他本人就从微软那里获得了访问资格

也就是和微软154页《AGI的火花》论文里同款,未经过安全训练但能力更强的满血版

从陶哲轩的反馈中可以看到,GPT-4非常擅长在和人类对话时进行一些cosplay,比如充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师,或者是魔鬼的代言人。

与此同时,对于AI在数学研究中的表现,陶哲轩给出的大胆却又严谨的预言:

当与形式证明验证器、互联网搜索和数学符号包等工具整合时,2026年的AI,如果使用得当,将成为数学研究中值得信赖的共同作者,而且在许多其他领域也是如此

除了数学研究,GPT-4已经是陶哲轩生活中的全方位小助手了。

他经常使用GPT-4回答一些随意、措辞含糊的问题,这些问题以前需要在搜索引擎里精心调整关键词才行。

还有位同事,因为亲戚拿到重症诊断而郁郁寡欢。为此,陶哲轩让大手一挥,让GPT-4洋洋洒洒写了封慰问信。

结果呢?同事眼含热泪,被感动哭了。

最后说回陶哲轩用GPT-4解决数学难题这事儿上来。

在MathOverflow下,有的网友觉得他不应该用GPT来回答数学问题,感觉是个很敏感的话题。

但还是有人表示了资瓷,表示觉得真的是泰库辣~

陶哲轩倒是毫不避讳地站出来表明了自己的立场,他倒不觉得有啥不好:

现在的担忧,跟维基百科流行初期时大家讨论的重点也没啥区别……
现在在维基百科上get初始线索,并且在引为论点时附上链接,展现它是我论据的一部分,都是大伙儿习以为常的事情。

并且陶哲轩看法还挺坚定,那就是“相信大家以后也会觉得用GPT来支持研究,没啥不妥当的呢”

加入陶哲轩和GPT-4的对话:
https://chat.openai.com/share/53aab67e-6974-413c-9e60-6366e41d8414

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/684080.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【FFmpeg实战】avformat_find_stream_info() 函数源码解析

转载自地址:https://cloud.tencent.com/developer/article/1873836 先来看一下 avformat_find_stream_info() 的头文件里的注释对该函数的介绍,本文我们基于 FFmpeg n4.2 版本的源码分析。 /*** Read packets of a media file to get stream informatio…

Apikit 自学日记:创建 API 文档

Apikit 中一共有5种创建API文档的方式: 新建API文档 导入API文档,详情可查看《导入、导出API文档》 从模板添加API文档,详情可查看《API文档模板》 自动生成API文档,详情可查看《自动生成API文档》 IDEA插件注释同步API文档 …

linux 在线安装 Redis

博主介绍: ✌博主从事应用安全和大数据领域,有8年研发经验,5年面试官经验,Java技术专家✌ Java知识图谱点击链接:体系化学习Java(Java面试专题) 💕💕 感兴趣的同学可以收…

生成式AI掀起产业智能化新浪潮|爱分析报告

报告摘要 大模型支撑的生成式AI,让人类社会有望步入通用人工智能时代,拥有广阔的应用前景,有望赋能千行百业。当前生成式AI的落地整体处于初级阶段,不同模态的落地时间表差异明显,企业需求主要集中在数字化程度高、容…

地平线旭日x3派部署yolov8

地平线旭日x3派部署yolov8 总体流程1.导出onnx模型导出YOLOV8_onnxruntime.py验证onnxutils.py 2.在开发机转为bin模型2.1准备数据图片2.2转换必备的yaml文件2.3开始转换 3.开发机验证**quantized_model.onnx4.板子运行bin模型 资源链接 总体流程 1.导出onnx模型 导出 使用y…

03 | 事务隔离:为什么你改了我还看不见?

以下出自 《MySQL 实战 45 讲》 03 | 事务隔离:为什么你改了我还看不见? 隔离性与隔离级别 当数据库上有多个事务同时执行的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read&#xff0…

搜索功能全流程解析

在产品中一般会分布着大大小小的搜索,以便提升用户的信息获取效率和信息消费的能力。本文作者全流程角度,对搜索功能进行了讲解,并从搜索流程中寻找提升体验的触点,一起来看一下吧。 在产品中因多功能诉求和业务复杂性等因素&…

《Pytorch深度学习和图神经网络(卷 1)》学习笔记——第三章

学习基于如下书籍&#xff0c;仅供自己学习&#xff0c;用来记录回顾&#xff0c;非教程。 <PyTorch深度学习和图神经网络&#xff08;卷 1&#xff09;——基础知识>一书配套代码&#xff1a; https://github.com/aianaconda/pytorch-GNN-1st 百度网盘链接&#xff1a;…

vite优化

1.利用 rollup-plugin-analyzer 插件进行进行代码体积分析&#xff0c;从而优化你的代码。 根据项目体积分析&#xff0c;进行接下来的优化&#xff1a; &#xff08;一&#xff09;使用unplugin-vue-components插件按需加载antd vue 组件&#xff1a; 使用步骤 1、安装插件…

6.18 、Java初级:锁

1 同步锁 1.1 前言 经过前面多线程编程的学习,我们遇到了线程安全的相关问题,比如多线程售票情景下的超卖/重卖现象. 上节笔记点这里-进程与线程笔记 我们如何判断程序有没有可能出现线程安全问题,主要有以下三个条件: 在多线程程序中 有共享数据 多条语句操作共享数据 多…

GPT-4 的创造力全方位持平或碾压人类 | 一项最新研究发现

文章目录 一、前言二、主要内容三、总结 &#x1f349; CSDN 叶庭云&#xff1a;https://yetingyun.blog.csdn.net/ 一、前言 最近&#xff0c;一项有关 GPT-4 的创造力思维测试火了。来自蒙大拿大学和 UM Western 大学的研究团队发现&#xff0c;GPT-4 在 Torrance 创造性思维…

Sharding-JDBC之RangeShardingAlgorithm(范围分片算法)

目录 一、简介二、maven依赖三、数据库3.1、创建数据库3.2、创建表 四、配置&#xff08;二选一&#xff09;4.1、properties配置4.2、yml配置 五、范围分片算法六、实现6.1、实体层6.2、持久层6.3、服务层6.4、测试类6.4.1、保存订单数据6.4.2、根据时间范围查询订单 一、简介…

还在等待本地渲染?云渲染才是真的省时省心又省钱!

可能很多设计师会觉得本地渲染效果图或动画更灵活&#xff0c;而且没有什么额外的附加费用&#xff0c;但其实不然&#xff01;当你面对多个大型或紧急的项目时&#xff0c;本地渲染就“慌”了。 接下来我将全面对比“本地渲染”和“云渲染”&#xff0c;相信还在等待本地渲染…

黑客常用cmd命令(window版)

1、ping命令 ping命令是一个常用的网络工具&#xff0c;用来测试和诊断网络连接状况。通过发送ICMP&#xff08;Internet控制消息协议&#xff09;数据包到目标主机&#xff0c;并接收回复的数据包&#xff0c;可以测量目标主机的可达性、平均响应时间等指标。 在Windows操作…

前后端实现:行为验证码---文字点选

最近接到一个新的需求&#xff0c;由于客户是内网&#xff0c;你能使用腾讯的验证码了&#xff0c;需要改为前后端实现。 具体的代码已经提交git 项目效果图&#xff1a; 使用的技术栈&#xff1a;vitevue3ts git地址&#xff1a;https://github.com/susanliy/point_captcha…

TCP/IP协议是什么?

78. TCP/IP协议是什么&#xff1f; TCP/IP协议是一组用于互联网通信的网络协议&#xff0c;它定义了数据在网络中的传输方式和规则。作为前端工程师&#xff0c;了解TCP/IP协议对于理解网络通信原理和调试网络问题非常重要。本篇文章将介绍TCP/IP协议的概念、主要组成部分和工…

《程序喵》项目跨域问题解决思路

跨域问题&#xff1a;由于浏览器的 同源策略 限制&#xff0c;当一个请求url的协议、域名、端口号三者之间有任意一个与当前的url不同即为跨域。 同源策略是一种约定&#xff0c;它是浏览器中最核心也最基本的安全功能。同源策略会阻止一个域的 Javascript 脚本和另一个域的内…

举例说明梯度下降算法与最小二乘法的区别

梯度下降算法和最小二乘法都是用于求解线性回归问题中参数的优化方法。我们可以通过一个简单的例子来说明它们之间的区别。 假设我们有以下数据点&#xff1a;(1, 2)&#xff0c;(2, 3)&#xff0c;(3, 4)&#xff0c;(4, 5)&#xff0c;我们希望找到一条最佳拟合线 y wx b&a…

Android 中Looper机制详解

版本基于&#xff1a;Android R 0. 前言 在《Android 基于Handler 剖析消息机制》一文中&#xff0c;以 Handler 类为起点详细分析了异步通信&#xff0c;分析了Java 端 Handler 与Looper、MessageQueue、Message 之前的通信关系。 框架如下&#xff1a; 在Java 端的 Looper …

2. IO 流原理及流的分类

2.1 Java IO 原理 • Java 程序中&#xff0c;对于数据的输入/输出操作以“流(stream)” 的方式进行&#xff0c;可以看做是一种数据的流动。 • I/O 流中的 I/O 是 Input/Output 的缩写&#xff0c; I/O 技术是非常实用的技术&#xff0c;用于处理设备之间的数据传输。如读/写…