AI 中的 CoT 是什么?一文详解思维链

news2025/4/22 2:18:05

文章目录

      • CoT 的组成
      • CoT 的作用
      • CoT 的推理结构变体
      • CoT 的特点
      • CoT 的适用场景
      • 总结

在人工智能领域,尤其是自然语言处理和机器学习中,有一种名为思维链(Chain of Thought,CoT)的技术,它正逐渐改变着我们对 AI 模型推理能力的认知。CoT 由 Google 在 2022 年的论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》中首次提出,其核心思想是让大模型逐步参与将一个复杂问题分解为一步一步的子问题并依次进行求解,通过显式输出中间逐步的推理步骤来增强大模型的算数、常识和推理的质量。

CoT 的组成

一个完整的包含 CoT 的提示词一般由以下三部分组成:

  • 指令(Instruction) :用于描述问题并且告知大模型的输出格式,让模型明确知道需要做什么。
  • 逻辑依据(Rationale) :指 CoT 的中间推理过程,可以包含问题的解决方案、中间推理步骤以及与问题相关的任何外部知识,是模型思考过程的具体体现。
  • 示例(Exemplars) :以少样本的方式为大模型提供输入输出对的基本格式,每个示例都包含问题、推理过程与答案,帮助模型更好地理解和学习如何进行推理。

根据是否包含示例,可将 CoT 分为 Zero-Shot-CoT 与 Few-Shot-CoT。Zero-Shot-CoT 仅在指令中添加一行经典的 “Let’s think step by step”,无需提供具体示例,即可唤醒大模型的推理能力;而 Few-Shot-CoT 则在示例中详细描述了解题步骤,让模型照猫画虎得到推理能力。

CoT 的作用

  • 提升模型推理能力 :CoT 将复杂问题分解为多个子问题,使模型能够逐步解决,从而更好地应对复杂任务,显著提高了大语言模型在复杂推理任务上的性能,如在数学推理任务 GSM8K 上,PaLM-540B 的准确率从 17% 提升至 58%。
  • 增强模型的可解释性 :显式输出的中间推理步骤为人们提供了一个观察模型思考过程的窗口,方便使用者了解模型是如何得出答案的,也便于发现模型可能存在的错误,进而提高了大模型推理的可解释性和可信度。
  • 具有广泛的适用性 :CoT 能用在数学应用题、常识推理和符号操作等多种任务上,几乎涵盖任何人类通过语言能解决的问题,并且支持任何语言模型使用,只需将其加在 few-shot 的样例中即可生效,无需重新训练模型。

CoT 的推理结构变体

  • PoT(Program of Thought) :对思维链中大模型有可能出错的一些计算问题,让大模型生成编程语言在解释器中运行,将复杂计算与模型的文本生成解耦,从而提高计算的准确性和可靠性。
  • Tab-CoT(Tabular Chain of Thought) :迫使大模型在每一步的推理中记录一个 “∣步数∣子问题∣过程∣结果∣” 的推理表格,并从生成的表格中提取答案,增强大模型的推理能力。
  • ToT(Tree of Thought) :将 CoT 的链式结构扩展为树形结构,让大模型在解决子问题时生成多个不同的答案选择,通过建立的树形结构展望未来确定下一步的决策,并通过追溯来纠正历史决策。
  • GoT(Graph of Thought) :基于 ToT 的思想,将 Tree 拓展为 Graph,其核心在于一个 “控制器”,控制器处理对图的操作以及图状态推理,将任务分解为相互连接的节点 - 边关系,并维护大模型在生成的图上的推理过程。

CoT 的特点

  • 以人类解决问题的方式为灵感 :CoT 模仿人类解题时的思考模式,通过一系列连贯的逻辑推导来促进系统地解决问题,使 AI 模型更接近人类的思维方式。
  • 涌现性 :当模型参数量达到百亿级别时,CoT 才能显著生效,发挥出其在提升模型推理能力方面的作用。

CoT 的适用场景

  • 数学应用题 :对于复杂的数学问题,CoT 可以帮助模型逐步分解问题,进行算术推理,从而得到正确的答案。
  • 常识推理 :在涉及常识的问答中,CoT 能够让模型展示出其推理过程,更好地运用常识进行推理和判断。
  • 符号操作 :如代码生成等任务,CoT 可引导模型按照逻辑步骤生成正确的代码。
  • 其他需要逻辑推理的任务 :如逻辑谜题解答、数据解读等,只要是可以将问题分解为多个步骤并通过逻辑推理解决的场景,CoT 都有其用武之地。

总结

CoT 作为一种简单而有效的方法,为提高 AI 模型的推理能力和可解释性提供了一种新的思路和解决方案。它通过引入中间推理步骤,使模型能够更像人类一样逐步思考和解决问题,在各种复杂任务中展现出了巨大的潜力和价值。随着研究的不断深入,CoT 将不断进化和完善,并与其他技术相结合,进一步推动 AI 模型的发展和应用,为我们带来更强大、更智能的人工智能系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2339794.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【OC】AVPlayerLayer的学习

文章目录 前言关于AVPlayer概念及作用具体方法及使用 关于AVPlayerLayer基本概念及作用具体用法 AVPlayer与AVPlayerLayer结合实现视频播放应用使用本地视频使用网络请求申请视频数据 总结 前言 在编写类视频软件项目时,涉及到视频播放的问题,我们需要给…

C++笔记-list

list即是我们之前学的链表,这篇主要还是讲解list的底层实现,前面会讲一些list区别于前面string和vector的一些接口以及它们的注意事项。 一.list的基本使用 和之前的string,vector一样,有很多之前见过的一些接口,经过…

open webui 介绍 是一个可扩展、功能丰富且用户友好的本地部署 AI 平台,支持完全离线运行。

AI MCP 系列 AgentGPT-01-入门介绍 Browser-use 是连接你的AI代理与浏览器的最简单方式 AI MCP(大模型上下文)-01-入门介绍 AI MCP(大模型上下文)-02-awesome-mcp-servers 精选的 MCP 服务器 AI MCP(大模型上下文)-03-open webui 介绍 是一个可扩展、功能丰富且用户友好的…

极狐GitLab 登录限制如何设置?

极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 登录限制 (BASIC SELF) 您可以使用登录限制自定义 Web 界面以及基于 HTTP(S) 的 Git 的身份验证限制。 设置 要访问登录限…

嵌入式exfat-nofuse文件系统移植和使用

exfat-nofuse 是一款专为linux ARM平台设计的开源项目,它提供了一个非FUSE机制的内核级驱动,用于在Linux系统上无缝地读写exFAT和VFAT文件系统。此项目由Dorimanx维护,采用C语言编写,兼容GPL-2.0许可证。它避开了FUSE(用户空间文件系统)的使用…

再来一篇,Linux中的软件管理

Linux中软件包的类型 在Linux系统中,软件包有多种不同的格式和类型,主要包括以下几种: DEB (Debian软件包)(此软件包不适用于RHEL8 系统): 适用于 Debian 及其衍生版本(如Ubuntu等&…

SimBody安装

SimBody安装 Simbody 是一个用于创建生物力学和机械系统仿真的多体动力学库。 SimBody安装 Windows安装: 下载地址:GitHub - simbody/simbody: High-performance C multibody dynamics/physics library for simulating articulated biomechanical and…

thinkphp:部署完整项目到本地phpstudy

一、准备工作 首先准备一个thinkphp的项目文件;准备mysql数据库 二、小皮初步搭建 1、建立网站 在小皮界面,网站->创建网站->输入域名,选择PHP版本等 注:确保端口未被占用 2、将项目文件放入根目录 网站->管理->…

大模型相关面试问题原理及举例

大模型相关面试问题原理及举例 目录 大模型相关面试问题原理及举例Transformer相关面试问题原理及举例大模型模型结构相关面试问题原理及举例注意力机制相关面试问题原理及举例大模型与传统模型区别 原理:大模型靠海量参数和复杂结构,能学习更复杂模式。传统模型参数少、结构…

Redis List 的详细介绍

Redis List 的详细介绍 以下是 Redis List 的详细介绍,从基础命令、内部编码和使用场景三个维度展开: 一、基础命令 Redis List 支持双向操作(头尾插入/删除),适用于队列、栈等场景,以下是核心命令分类&a…

使用virtualbox的HostOnly建立共享网络-实现虚拟机上网

目录 环境描述解决方案具体步骤1.新建一个virtual host-only ethernet adapter2.设置windows的wifi信号网络共享3.确认winows宿主网络信息3.1.wifi适配器的信息3.2.虚拟网卡的信息3.3.确认virtualbox中虚拟网卡的ip地址 4.虚拟机网卡设置5.虚拟机网络设置5.1.本地连接设置5.2.u…

springboot+vue3+mysql+websocket实现的即时通讯软件

项目演示 即时通讯软件项目演示 业务架构 技术栈 后端 选用编程语言 Javaweb框架SpringBootdb MySQL 持久存储nosql 缓存 Redis全双工通信框架 WebSocket 前端 前端框架Vue3TypescriptUI样式 Css、ElementPlus网页路由 vue-router全双工通信框架Websocket 功能完成情况 已实…

基于 Spring Boot 瑞吉外卖系统开发(五)

基于 Spring Boot 瑞吉外卖系统开发(五) 删除分类 分类列表中每条分类信息右侧提供了一个“删除”按钮,当需要将已经存在的分类信息删除时,可以通过单击“删除”按钮实现。 请求路径为/category,携带参数id&#xf…

【Web部署问题】在Tomcat中部署web项目出现http状态-404 -未找到详细解决方案

部署完tomcat记得在选中要运行的工件。 如果没有工件,或者工件有缺失东西,去这里配置工件,

Linux——Shell编程之正则表达式与文本处理器(笔记)

目录 基础正则表达式 1:基础正则表达式示例 (4)查找任意一个字符“.”与重新字符“*” (5)查找连续字符范围“{ }” 文本处理器 一、sed工具 二、awk工具 (1)按行输出文本 (2&#xff0…

05-DevOps-Jenkins自动拉取构建代码

新建Gitlab仓库 先在Gitab上创建一个代码仓库,选择创建空白项目 安装说明进行填写,然后点击创建项目 创建好的仓库是空的,什么都没有 新建一个springboot项目,用于代码上传使用。 只是为了测试代码上传功能,所以代码…

SRS transcode支持 h264_nvenc 硬件解码方案

文章目录 SRS transcode支持 h264_nvenc 硬件解码方案1、修改文件2、重新编译3、使用 SRS transcode支持 h264_nvenc 硬件解码方案 SRS 是开源的流媒体服务,但在使用 GPU 服务器时,想要通过硬件加速,目前官方是不支持的,所以简单…

阿里云服务器搭建开源版禅道

一,下载地址:禅道11.5版本发布,主要完善细节,修复bug,新增动态过滤机制 - 禅道下载 - 禅道项目管理软件 下载地址二: 禅道21.6.stable 实现旧编辑器撰写的文档无感升级至新版编辑器 - 禅道下载 - 禅道项目…

怎么用面向对象和状态机架构,设计一个通用的按键检测功能?

说起按键检测,在座的各位,哪个没被它折磨过? 我刚入门时,为了实现一个简单的按键功能,硬生生写了几十行代码,各种 if...else 嵌套,逻辑绕得我自己都头晕。 更可气的是,辛辛苦苦写完…

Java基础系列-LinkedList源码解析

文章目录 简介LinkedList 插入和删除元素的时间复杂度?LinkedList 为什么不能实现 RandomAccess 接口? LinkedList 源码分析Node 定义初始化获取元素插入元素删除元素遍历链表 简介 LinkedList 是一个基于双向链表实现的集合类,经常被拿来和…