CoT让Transformer打破推理极限的讨论

news2025/1/22 16:55:04

论文简要

题目:Chain of Thought Empowers Transformers to Solve Inherently Serial Problems
在这里插入图片描述

Denny Zhou等人提出的中间推理token,跟o1的核心技术CoT非常相似。
传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。
而CoT,恰恰解决了这个问题。
在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的问题;但一旦加入CoT,Transformer几乎可以解决任何问题。
说明:AC0(AC zero)是指没有任何额外约束的电路,也就是只能进行基本的逻辑运算,如 AND、OR 和 NOT 门电路。这意味着传统的 Transformer 模型能够处理的问题范围有限,只能解决一定复杂度的问题。

CoT 是一种让模型在给出最终答案之前,先生成一系列解题步骤的技术。这些中间步骤类似于人类解决问题时的思考过程,它们帮助模型更好地理解和解决复杂问题。通过 CoT,Transformer 几乎可以解决任何问题,这是因为它能够模拟更复杂的推理过程,从而超越了 AC0 电路的局限。
简而言之,CoT 使得 Transformer 模型能够进行更高级别的抽象和推理,提升了其解决问题的能力。
只要CoT步骤足够多,Transformer就能模拟任意大小的布尔电路,解决P/poly问题
只要CoT步骤足够多,Transformer就能模拟任意大小的布尔电路,解决P/poly问题

也就是说,可以用数学严格证明,CoT可以让Transformer解决几乎所有能用计算机解决的问题

利用CoT,可以模拟布尔电路中每个逻辑门的计算利用CoT,可以模拟布尔电路中每个逻辑门的计算

这项工作暗示着,CoT为更强大的LLM推理提供了新的思路,CoT或将成为未来LLM发展的重要方向,而且很可能闪烁着AGI的火花。
Denny Zhou发帖后,立即引发了AI社区的热议。

讨论

谷歌DeepMind首席科学家Denny Zhou在ICLR 2024论文中提出,通过引入中间推理token,Transformer可以解决任何问题,从而打破了推理能力的极限。
这一观点与OpenAI的CoT技术相似,CoT技术已经帮助LLM在少量样本下进行复杂推理,甚至表现出类人情感。

然而,这一理论被田渊栋和Yann LeCun等人质疑,他们认为CoT的长度可能会非常长,难以通过梯度下降学习,且人类推理链的简洁性和效率与之不同。
LeCun指出,尽管理论上2层多层感知器可以拟合任何函数,但在实践中这样的模型可能难以应用。
网友们对CoT的效果和LeCun关于模型复杂性的担忧进行了讨论,有人认为CoT在多维扩展场景中有潜力,而有人则认为这种讨论类似于无限序列猴子定理
说明:猴子定理,也被称为无限猴子定理,是概率论中的一个理论。这个定理指出,如果无限多的猴子随机地、无限长时间地敲打键盘,它们最终将几乎必然地打出任何给定的文本,如莎士比亚的全部作品。

田渊栋认为,谷歌的论文思路有可取之处,但问题更为复杂,涉及数据分布、模型架构、学习算法等多个方面。Denny Zhou在UC伯克利的讲座中强调了AI推理能力的重要性,并指出LLM在包含中间步骤和解释原理时能够更好地进行少样本学习。尽管CoT提供了一种新的推理方式,但它并不能解决所有LLM推理的缺陷,例如模型容易受到无关上下文的干扰,以及自我纠正能力的不健全。

核心歧义点

尽管理论上 2 层多层感知器可以拟合任何函数,但在实践中这样的模型可能难以应用。LeCun 进一步表示,人类推理链的简洁性和效率与 CoT 的方法不同,而且 AI 目前只能进行暴力搜索,而没有人类的 “启发式” 思考和 “直觉”。

最终,AI系统需要模拟人类的高效问题解决路径,以达到AGI的水平。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2164664.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动物关键点数据集-yolov8 pose动物关键点识别-动物姿态估计-keypoints(代码+数据集)

跨域适应于动物姿态估计 概览 本文介绍了一个专门用于动物姿态估计的数据集,该数据集包含了五个不同种类的动物:狗、猫、牛、马和羊。整个数据集中共包含超过6000个实例,分布在4000多张图像上。此外,数据集还为另外七种动物提供…

QT创建线程,QT多线程的创建和使用,QT线程池

一、在Qt中创建多线程的原因和优势 1. **UI响应性:** - 在单线程模型中,如果需要执行长时间运行的任务(如网络请求、文件I/O、计算密集型操作等),这将会阻塞主线程,导致UI无响应。通过在单独的线程中执…

分布式框架 - ZooKeeper

一、什么是微服务架构 1、单体架构 顾名思义一个软件系统只部署在一台服务器上。 ​ 在高并发场景中,比如电商项目,单台服务器往往难以支撑短时间内的大量请求,聪明的架构师想出了一个办法提高并发量:一台服务器不够就加一台&am…

Bottleneck、CSP、DP结构详细介绍

文章目录 前言一、BottleneckDarknetBottleneck 二、CSPCSP思想pp-picodet中的CSPLayer DP卷积 前言 本篇文章详细介绍了三种神经网络中常见的结构,bottleneck、CSP、DP,并附上了代码加深理解。 一、Bottleneck Bottleneck出现在ResNet50/101/152这种…

矩阵特征值怎么求?矩阵特征值计算器来帮你

大家好,这里是效率办公指南! 📚今天我们要探讨一个数学和编程领域中经常遇到的问题——矩阵特征值的计算方式,以及如何计算一个2x2矩阵的特征值。无论你是数学爱好者,还是编程高手,这个主题都可能对你有所…

29 C 语言中的随机数实现:rand 与 srand

目录 1 为什么需要随机数? 1.1 背景介绍 1.2 应用场景 2 C 语言实现随机数 2.1 rand() 函数 2.1.1 函数原型 2.1.2 功能说明 2.1.3 案例演示 2.2 srand() 函数 2.2.1 函数原型 2.2.2 功能说明 2.2.3 案例演示 2.3 指定范围的随机数 2.3.1 获…

为什么 qt 成为 c++ 界面编程的第一选择?

一、前言 为什么现在QT越来越成为界面编程的第一选择,笔者从事qt界面编程已经有接近8年,在这之前我做C界面都是基于MFC,也做过5年左右。当时为什么会从MFC转到QT,主要原因是MFC开发界面想做得好看一些十分困难,引用第…

hexo github部署,通过域名访问你的博客

hexo github部署,通过域名访问你的博客 hexo 常用命令hexo github 部署 在部署之前,了解一下hexo的常用命令 hexo 常用命令 hexo new "My New Post" # 新建文章 hexo n "My New Post"hexo generate # 生成静态文件 hexo ghexo serv…

【CTF】Nginx日志注入

Nginx日志注入: 日志包含漏洞的成因还是服务器没有进行严格的过滤 ,导致用户可以进行任意文件读取,但是前提是服务器需要开启了记录日志的功能才可以利用这个漏洞。 对于Apache,日志存放路径:/var/log/apache/access.l…

【论文阅读】FedBABU:TOWARD ENHANCED REPRESENTATION FOR FEDERATED IMAGE CLASSIFICATION

算法流程: 训练过程中冻结客户端的头部参数,只训练主体参数。训练完之后再在客户端本地跑几个epoch微调一下(文章推荐5个)。 由于该算法与FedPer思路过于相似,故读完后跑了个实验。 FedPer:训练过程中只聚合主体参数。…

Redis --- redis事务和分布式事务锁

redis事务基本实现 Redis 可以通过 MULTI,EXEC,DISCARD 和 WATCH 等命令来实现事务(transaction)功能。 > MULTI OK > SET USER "Guide哥" QUEUED > GET USER QUEUED > EXEC 1) OK 2) "Guide哥"使用 MULTI命令后可以输入…

Linux应用开发实验班——JSON-RPC

目录 前言 1.是什么JSON-RPC 2.常用的JSON函数 1.创建JSON 2.根据名字获取JSON 3.获取JSON的值 4.删除JSON 3.如何进行远程调用 服务器 客户端 4.基于JSON-RPC进行硬件操作 课程链接 前言 学习的课程是百问网韦东山老师的课程,对更详细步骤感兴趣的同学…

LINUX网络编程:Tcp(2)

目录 1.Tcp流量控制 2.滑动窗口 2.1滑动窗口的更新 2.2滑动窗口的丢包问题 1.报文丢失的情况 2.ACK丢失的情况 3.拥塞控制 3.1慢启动 3.2拥塞窗口的增长 1.Tcp流量控制 为什会有流量控制? 1.在网络通信中,假如发送方的发送能力特别的强&#xff0…

支付宝沙箱环境 支付

一 什么是沙箱: 沙箱环境是支付宝开放平台为开发者提供的安全低门槛的测试环境 支付宝正式和沙箱环境的区别 : AI: 从沙箱到正式环境: 当应用程序开发完成后,需要将应用程序从沙箱环境迁移到正式环境。 这通常涉及…

opencv图像增强十四:opencv两种白平衡介绍及实现

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、白平衡介绍二、灰度世界法三、完美反射法 前言 在摄影与影像领域,白平衡是一个至关重要的概念。它直接影响着画面的色彩表现,关系到…

构建网络遇到的问题-AlexNet

1.对模型进行初始化采用的一般代码 def _initialize_weights(self):for m in self.modules(): # 遍历模型每一层if isinstance(m, nn.Conv2d): # 判定m层是否属于nn.Conv2d类型nn.init.kaiming_normal_(m.weight, modefan_out, nonlinearityrelu)if m.bias is not None:nn.in…

从自动化到智能化:AI如何推动业务流程自动化

引言:从自动化到智能化的必然趋势 在当今数字化时代,企业为了提升效率、降低成本,纷纷采用自动化技术来简化重复性任务。然而,传统自动化仅限于标准化操作,无法应对复杂的决策和多变的市场环境。随着人工智能&#xff…

基于springboot垃圾分类网站

基于springboot垃圾分类网站 摘 要 本论文主要论述了如何使用JAVA语言开发一个垃圾分类网站 ,本系统将严格按照软件开发流程进行各个阶段的工作,采用B/S架构,面向对象编程思想进行项目开发。在引言中,作者将论述垃圾分类网站的当…

Android开发拍身份证带人像框和国徽框效果

Android开发拍身份证带人像框和国徽框效果 拍身份证时往往要带上外框辅助用户拍照,这也是很常见的需求。 一、思路 自定义Camera和自定义拍照的界面,把外框画上去,做个遮罩 二、效果图: Android开发教程实战案例源码分享-拍身…

深入理解计算机系统-Bomb Lab

使用 头歌 平台 GDB 调试器 反汇编函数