Chain of Thought Prompting和Zero Shot Chain of Thought初步认识

news2025/7/3 20:28:48

1. 思维链提示（Chain-of-Thought Prompting）

思维链(Chain-of-Thought:CoT)提示过程是一种最近开发的提示方法，它鼓励大语言模型解释其推理过程。下图显示了 few shot standard prompt（左)与链式思维提示过程（右）的比较。

思维链提示使大型语言模型能够处理复杂的算术、常识和符号推理任务。突出显示了思维链推理过程。

思维链的主要思想是通过向大语言模型展示一些少量的 exemplars，在样例中解释推理过程，大语言模型在回答提示时也会显示推理过程。这种推理的解释往往会引导出更准确的结果。

结论

思维链已被证明对于算术、常识和符号推理等任务的结果有所改进1。特别是，在GSM8K2基准测试上，PaLM 540B3的提示达到了57%的解决率准确性。

限制

思维链已被证明对于算术、常识和符号推理等任务的结果有所改进1。特别是，在GSM8K2基准测试上，PaLM 540B3的提示达到了57%的解决率准确性。

备注

本章的写作过程中，没有对任何语言模型进行微调

论文地址

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

https://ai.googleblog.com/2022/05/language-models-perform-reasoning-via.html

2.零样本思维链（Zero Shot Chain of Thought）

零样本思维链（Zero Shot Chain of Thought，Zero-shot-CoT）提示过程1是对 CoT prompting2 的后续研究，引入了一种非常简单的零样本提示。他们发现，通过在问题的结尾附加“让我们一步步思考。”这几个词，大语言模型能够生成一个回答问题的思维链。从这个思维链中，他们能够提取更准确的答案。

从技术上讲，完整的零样本思维链过程涉及两个单独的提示/补全结果。在下面的图像中，左侧的顶部气泡生成一个思维链，而右侧的顶部气泡接收来自第一个提示（包括第一个提示本身）的输出，并从思维链中提取答案。这个第二个提示是一个 自我增强 的提示。

结论

零样本思维链也有效地改善了算术、常识和符号推理任务的结果。然而，毫不奇怪的是，它通常不如思维链提示过程有效。，在获取思维链提示的少量示例有困难的时候，零样本思维链可以派上用场。

有趣的消融实验

Kojima等人尝试了许多不同的零样本思维链提示（例如“让我们按步骤解决这个问题。”或“让我们逻辑思考一下。”），但他们发现“让我们一步一步地思考”对于他们选择的任务最有效。

备注

提取步骤通常必须针对特定任务，使得零样本思维链的泛化能力不如它一开始看起来的那样强。

从个人经验来看，零样本思维链类型的提示有时可以有效地提高生成任务完成的长度。例如，请考虑标准提示写一个关于青蛙和蘑菇成为朋友的故事。在此提示的末尾附加让我们一步一步地思考会导致更长的补全结果。

论文地址

Large Language Models are Zero-Shot Reasoners

参考资料

🟢 Chain of Thought Prompting | Learn Prompting: Your Guide to Communicating with AI

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/607732.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ChatGPT提示词攻略之基本原则

ChatGPT提示词攻略之基本原则

下面是调用openai的completion接口的函数。但在本文中并不是重点。了解一下就好。 import openai import osfrom dotenv import load_dotenv, find_dotenv _ load_dotenv(find_dotenv())openai.api_key os.getenv(OPENAI_API_KEY)def get_completion(prompt, model"gp…

阅读更多...

[LeetCode周赛复盘] 第 348场周赛20230604

[LeetCode周赛复盘] 第 348场周赛20230604

[LeetCode周赛复盘] 第 348场周赛20230604 一、本周周赛总结6462. 最小化字符串长度1. 题目描述2. 思路分析3. 代码实现 6424. 半有序排列1. 题目描述2. 思路分析3. 代码实现 6472. 查询后矩阵的和1. 题目描述2. 思路分析3. 代码实现 6396. 统计整数数目1. 题目描述2. 思路分析…

阅读更多...

10.全局配置 app.json 与页面配置

10.全局配置 app.json 与页面配置

常用的配置项有 pages 小程序的所有页面window 小程序窗口的外观tabBar 小程序底部的tabBar效果，就是底部的切换那部分style 组件样式版本目录 1 window 2 tabBar 3 页面配置 1 window 小程序由下面三个部分组成，window可以配置导航栏区域与…

阅读更多...

JavaSE_day43（多线程单线程区别，图解main方法若是单多线程该如何执行，如何使用多线程2种方式）

JavaSE_day43（多线程单线程区别，图解main方法若是单多线程该如何执行，如何使用多线程2种方式）

1 A.java * 学习多线程之前，我们先要了解几个关于多线程有关的概念。 A:进程：进程指正在运行的程序。确切的来说，当一个程序进入内存运行，即变成一个进程，进程是处于运行过程中的程序，并且具有一定…

阅读更多...

【生成数据】绘制简单的折线图

【生成数据】绘制简单的折线图

使用scatter绘制散点图并设置其样式 plt.scatter(2, 4, s200)#设置图表标题并给坐标轴加上标签 plt.title("Square Number", fontsize24) plt.xlabel("Value", fontsize14) plt.ylabel("Square of Value", fontsize14)#设置刻度标记的大小 plt.…

阅读更多...

2022年，Rust与Go哪一个更好？

2022年，Rust与Go哪一个更好？

这是每一个程序员和开发人员都问过的问题，还有很多人仍然在问，即使他们已经做出了自己的决定。Rust vs. Go。2022年，我应该选择哪一个？或选择哪种语言--Golang或Rust。 Golang和Rust是目前使用的最年轻的编程语言。Go于2009年在谷…

阅读更多...

最新ChatGPT4.0Plus开通教程-支付宝购买苹果礼品卡-亲测可用

最新ChatGPT4.0Plus开通教程-支付宝购买苹果礼品卡-亲测可用

2023.06.04亲测可用ChatGPT开通Plus教程前言：一、准备工作二、购买苹果礼品卡一、官网购买礼品卡二、支付宝方式购买三、AppStore充值礼品卡四、ChatGPT Plus 订阅五、iOS 端 ChatGPT Plus 订阅失败解决方法六、美区AppStore账号ID注册教程： 之前&…

阅读更多...

【Svelte】一个简单的前端框架

【Svelte】一个简单的前端框架

Svelte.js的学习成本高吗？ Svelte是新手编码初学者的完美平台。只需一个HTML/CSS和JavaScript技能组合，您就可以从头开始构建您的第一个网站，而无需额外的知识。这使得学习曲线非常小，不像它的大多数替代方案。除此之外&#xf…

阅读更多...

ChatGLM-6b 多任务微调

ChatGLM-6b也是一种预训练模型，它也可以通过微调来适应下游任务。实验表明，使用ChatGLM-6b微调和Bert类预训练模型微调的效果相近。如果采用多任务设计，ChatGLM-6b的效果会更好。你可以在这里了解更多关于ChatGLM-6B的信息: ChatGLM-6Bhttps:…

阅读更多...

$边缘化中FEJ图例的理解$

边缘化中FEJ图例的理解

如图所示，在解释为什么需要FEJ(First Estimation Jacobian)时，通常会将这个图拿出来说事。但是，很多时候只是一笔带过，这个图看的云里雾里的，不是非常明白(可能是我理解力的问题），所以&#xff…

阅读更多...

AngularJs学习笔记--bootstrap

AngularJs学习笔记--bootstrap

AngularJs学习笔记系列第一篇，希望我可以坚持写下去。本文内容主要来自 AngularJS 文档的内容，但也加入些许自己的理解与尝试结果。一、总括本文用于解释Angular初始化的过程，以及如何在你有需要的时候对Angular进行手工初始化。二、An…

阅读更多...

【云原生-K8s】k8s可视化管理界面安装配置及比较【Kubesphere篇】

【云原生-K8s】k8s可视化管理界面安装配置及比较【Kubesphere篇】

总览安装了k8s控制面板，方便日常的问题处理，查看资源状态信息，也可以增加子账号进行开放给其他人员使用，减少命令操作，提升工作效率前置条件须有一个正常使用的k8s集群附k8s v1.23版本搭建：https://…

阅读更多...

JavaScript实例（Visual Studio Code）(一)

JavaScript实例（Visual Studio Code）(一)

JavaScript程序本身不能独立存在它是依附于某个HTML页面在浏览器端运行的基本语法： <script type"text/javascript" [src"外部js文件"]>... </script> 语法说明： script为脚本标记，它必须以<scri…

阅读更多...

【小沐学Web】Rust实现Web服务器

【小沐学Web】Rust实现Web服务器

文章目录 1、简介2、开发环境配置2.1 下载2.2 安装2.3 编辑工具2.4 构建工具2.5 自动化工具 3、Hello World4、TCP/UDP通信5、Web服务器结语 1、简介 https://www.rust-lang.org/ Rust: 一种使每个人都能够构建可靠且高效的软件的语言。如今，全球有数百家公司在生…

阅读更多...

谈谈Memcached与Redis

1. Memcached简介 Memcached是以LiveJurnal旗下Danga Interactive公司的Bard Fitzpatric为首开发的高性能分布式内存缓存服务器。其本质上就是一个内存key-value数据库，但是不支持数据的持久化，服务器关闭之后数据全部丢失。Memcached使用C语言开发&am…

阅读更多...

【01】水仙花数算法

【01】水仙花数算法

水仙花数是指一个n位数（n ≥ 3），它的每个位上的数字的n次幂之和等于该数本身。换句话说，对于一个三位数而言，如果它满足条件：各个位上的数字的立方和等于该三位数本身，那么这个数就被称为水仙花…

阅读更多...

chatgpt赋能python：Python操作——去除非字母元素优化SEO

chatgpt赋能python：Python操作——去除非字母元素优化SEO

Python操作——去除非字母元素优化SEO 介绍在做SEO优化时，处理关键词是必不可少的环节。我们需要对关键词进行一些处理，使其更加规范、简洁、且易于搜索引擎的识别和分类。其中一个重要的环节，就是去除非字母元素，即去除关键词…

阅读更多...

大模型训练和部署的关键技术

大模型训练和部署的关键技术

自2016年至今，模型大小每18个月增长40倍，自2019年到现在，更是每18个月增长340倍。然而相比之下，硬件增长速度较慢，自2016年至今，GPU的性能增长每18个月1.7倍，模型大小和硬件增长的差距逐渐扩大…

阅读更多...

LeetCode110. 平衡二叉树

LeetCode110. 平衡二叉树

题目 leetcode110. 平衡二叉树思路只有每个节点的左右子树高度差不超过1才是平衡二叉树，因此可以递归解决。递归的2要素： ①终止条件：当左右子树高度差超过1时返回false；递归到空节点和叶子节点时，由于空节点和…

阅读更多...

每日学术速递5.31

每日学术速递5.31

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models 标题：无提示扩散：从文本到图像扩散模型中提取“文本” 作者&…

阅读更多...

推荐文章

最新文章