【LLM大模型】“提示工程”的技术分类

news2024/11/15 11:20:39

尽管大模型非常强大,但仍然有着自身的局限。大模型可以生成看起来非常值得信赖的内容并引用外部资源,但是,大模型本身并不能直接访问互联网也不能访问互联网的资源。偏见往往会使大模型产生某些定型的内容。当被问到一个不知道答案的问题时,大模型有时会产生“幻觉”或者产生错误的信息, 很多时候,即使是最简单的数学或常识的问题, 大模型仍然要挣扎一番。另外,通过操纵提示词,以忽略开发人员的指令并生成特定的内容。

大多数提示技术主要解决幻觉和解决数学/常识问题,而偏见和提示词攻击是需要单独讨论的话题。提示技术离不开提示词的编写,一些常见的规则可以帮助我们写出清晰而具体的提示词,例如:

  • 准确地说出要做什么(写、总结、提取信息) ;
  • 避免说什么不该做,而是说什么该做;
  • 具体描述,不要说“几句话”,要说“两三句话”;
  • 添加标记或分隔符以结构化提示符;
  • 如果需要,请求结构化输出(JSON,HTML) ;
  • 要求模型验证是否满足条件(例如: 如果你不知道答案,请说”没有相关资料“) ;
  • 要求模型首先解释,然后提供答案(否则模型可能会试图证明一个不正确的答案)。

通过提示工程技术,我们可以引入更多的时间和空间以及内容的属性,有助于更好地生成提示词。那么,提示工程技术有哪些呢?我们如何更好地使用它们呢?

分类是认知的开始。现有的大多数提示技术可以分为三类:

  • 单一提示技术:旨在优化一个提示的响应
  • 多重提示技术:为了解决任务而多次查询模型(或模型)
  • 大模型与外部工具结合的技术

1 单一提示技术

在这里插入图片描述

LLM 非常擅长一次性学习,但是他们仍然可能在复杂的任务中失败。单一提示技术是提示工程的基础,常见的技术手段有:

  • Zero-Shot:使用自然语言指令的最简单的技术。
  • One-shot:一次性学习
  • Few-Shot:用正确的答案向模型演示类似的任务,提供一些关于标签空间、输入测试的分布和序列的整体格式的示例
  • Chain of Thought(CoT):思想链的提示通过中间的推理步骤使复杂的推理能力成为可能。这种技术旨在使模型对每个步骤进行迭代和推理。
  • Program-Aided Language Models (PAL):一种通过使用代码将解释扩展为自然语言来扩展思维链提示的方法,可以将LangChain中的 PALChain 作为参考实现。

2. 多重提示技术

基于不同的策略,将一个或几个提示技术组合在一起的,主要包括:

  • 投票排名:应用投票来得到正确的答案,例如, 自我一致性的方法(Self-Consistency)。
  • 分而治之:一组提示基于将复杂任务划分为几个提示,例如: 定向激励提示,知识生成,提示链,表链提示以及 Least-to-Most 的提示。
  • 自我评估:将检查输出是否符合指令的步骤纳入框架,例如,思维树等。
2.1 投票排名

投票排名策略中的自我一致性方法基于这样的直觉: “一个复杂的推理问题通常需要多种不同的思维方式才能得到独一无二的正确答案”。它要求相同的思维链提示几次,从而产生一组不同的推理路径,然后通过应用投票选择最一致的答案.

在这里插入图片描述

一般地,对算术和常识任务而言,应用自我一致性的效果在常规基准测试中为4% -18% 。

2.2 分而治之

分治是算法设计中使用最为频繁的技术之一,在许多经典算法中都可以发现分治策略的影子。排序中的归并排序、快速排序,查找中的二分查找都是用分治策略来实现的。分治策略的思想是将一个复杂的问题分解为两个或更多的相同或相似的子问题,再把子问题分成更小的子问题,直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。

定向激励提示

在定向激励提示中有两个步骤: 产生提示(例如,关键字)和使用它们来提高响应的质量。定向提示用于总结、对话响应应生成和思维链推理任务,包括两种模式:

  • 一个小型可调整的策略模型被训练成产生提示(例如,一个暗示) ;
  • 基于前一步的问题和提示,利用一个黑盒大模型来生成一个摘要。

在这里插入图片描述

其中,策略模型可以通过监督下的微调来优化,使用标注数据和线下或基于 LLM 输出的在线奖励来强化学习,为 LLM 提供针对特定输入的指导,以达到期望的目标。

知识生成

知识生成的提示技术使用一个单独的提示来首先生成知识,然后使用它来获得更好的响应。

在这里插入图片描述

一般包括两个阶段:

  • 生成知识: 使用few-shot从大模型生成与问题相关的知识陈述。
  • 知识整合: 使用另一个打磨下对每个知识语句进行预测,然后选择最高置信度的预测。

该方法不需要对知识集成进行特定任务的监督,也不需要访问结构化的知识库,但它提高了大模型在常识推理任务上的性能。

提示链

提示链是一种简单但功能强大的技术,这种技术将任务划分为子问题,并逐个提示模型。提示链对于完成复杂的任务非常有用,有助于提高 LLM 应用程序的透明度,增加可控性和可靠性。

在这里插入图片描述

Least to Most提示方法进一步添加了一个步骤,在这个步骤中,模型应该决定如何将任务分解为子问题,在与符号操作、组合概括和数学推理相关的任务中,Least to Most提示表现良好。 最小到最大提示.png

表链

表链提示技术,将表格数据被明确地用在推理链中作为中间思维结果的代理,该算法包括两个步骤:首先是动态规划,大模型根据输入查询和以前操作的历史记录从操作池中抽样下一个操作(操作链) ,参数生成涉及使用 LLM 和编程语言的应用程序为前一步操作中选定的参数(例如新的列名)生成参数,以执行操作并创建相应的中间表。

在这里插入图片描述

2.3 自我评估

思维树(ToT)技术概括了思想链的方法,允许模型探索多个推理步骤和自我评估的选择。要实施 ToT 技术,必须决定四个问题::

  1. 如何将中间过程分解为思维步骤?
  2. 如何从每个状态产生潜在的想法?
  3. 如何启发式地计算状态(使用状态评估提示) ?
  4. 使用什么样的搜索算法?

在这里插入图片描述

输入的提示必须包括解决问题的中间步骤的描述,以及抽样的想法或生成这些想法的说明。状态评估提示必须提供指令,说明要在哪些提示上选择下一步。对于需要进行复杂计划或搜索的任务, ToT 相对成功。另外,LangChain 在experimental.tot.base.ToTChain 类中实现了思维树技术。

3. 使用外部工具的大模型

实际上,使用外部工具的大模型提示技术就是基于大模型的应用,主要包括RAG 和Agent。

3.1 RAG

RAG 结合了信息检索组件和文本生成模型,在检索步骤中,系统通常使用向量搜索来搜索可能回答问题的相关文档。接下来,将相关文档作为上下文与初始问题一起传递给大模型. 在大多数情况下,使用 RAG 方法意味着我们检索 k 文档,并使用它们生成回答用户查询的所有输出令牌。

在这里插入图片描述

RAG 中的大模型可以进行微调,但实际上很少这样做,因为经过预训练的 LLM 足够好,可以按原样使用,而且微调成本太高。此外,RAG 中的内部知识可以以一种有效的方式进行修改,而不需要对整个模型进行再训练。

RAG 产生的响应更加真实、具体和多样化,改善了事实验证的结果。关于RAG 的更多内容,可以参考《大模型系列——解读RAG》。

3.2 Agent

当前,已经有多种agent 技术框架,这里简要介绍Reflexion 和ReAct。

反思(Reflexion)是一个通过语言反馈来强化语言主体的框架。反射代理通过语言反映任务反馈信号,然后在记忆缓存中维持自己的反思文本,以诱导更好的决策在随后的试验。

在这里插入图片描述

一般地,反思框架由三种不同的模型组成: * Actor: 一个 LLM 模型,它基于状态观察生成文本和操作(使用 CoT 和 ReAct) * Evaluator: 一个 LLM 模型,它对Actor产生的输出进行评分 * Self-Reflection: 一个 LLM 模型,产生语言强化线索,以协助Actor自我完善

反思在需要顺序决策、编码和语言推理的任务中表现良好。

ReAct 的框架使用大模型以交错的方式生成推理轨迹和特定任务的行为: 推理轨迹帮助模型产生、跟踪和更新行动计划以及处理异常,而行为允许它与外部来源(如知识库或环境)接口交互并收集额外的信息。

在这里插入图片描述

ReAct 框架可以选择一个可用的工具(如搜索引擎、计算器、 SQL 代理) ,应用它并分析结果以决定下一个操作。ReAct 通过与简单的 Wikipedia API 交互,克服了思维链推理中的幻觉和错误传播的普遍问题,并产生比没有推理痕迹的基线更可解释的类人任务解决轨迹。具体地,可以参考使用 Langchain 工具实现 ReAct 的示例。

关于Agent 的更多信息,可以参考《基于大模型(LLM)的Agent 应用开发》以及《Agent 应用于提示工程》。

4. 提示评估技术

提示技术的测试指标在很大程度上取决于应用程序和可用资源,大模型提示词中的最小变化非常敏感,这些变化不是最优的,而且往往是主观的。无论选择哪种提示技术,将提示工程视为数据科学的过程都非常重要。这意味着创建一个测试集并选择指标,调优提示并评估它对测试集的影响。

在这里插入图片描述

尽管如此,提示的评估技术有一些基本的原则:

  1. 事实性和相关性: 生成的答案有多真实, 生成的答案与问题的相关程度。
  2. 检索:主要针对 RAG 和 Agent 管道,但可应用于生成的知识和定向提示,主要指标还是准召;
  3. 内部思维方式: Agent 和工具选择的准确性,为 Agent 提取工具参数, 从上下文中检索到正确的参数并进行了适当的转换, 在多轮对话中记住事实,正确的逻辑步骤,例如反思和思维链提示
  4. 非功能性:答案的风格和语气,没有偏见, 合规和安全检查, 提示注入实验。

5. 提示工程的方法小结

在应用提示工程的时候,提示语要清晰而准确,这样模型就不必猜测我们的意图。我们可以使用分隔符或标记添加结构, 通过展示示例和添加解释来帮助模型, 要求模型反复思考,解释它的解决方案。

在这里插入图片描述

对于复杂的提示词,请考虑将其拆分为子任务, 多问几次同样的问题, 并考虑添加一个模型自检的步骤。如果需要,将 LLM 与外部工具结合起来,并将提示调优视为一个数据科学过程,它是迭代的,需要评估。

如何系统的去学习AI大模型LLM ?

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来

😝有需要的小伙伴,可以V扫描下方二维码免费领取🆓

在这里插入图片描述

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

在这里插入图片描述

四、AI大模型商业化落地方案

img

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。
  • 内容
    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
      - L1.4.1 知识大模型
      - L1.4.2 生产大模型
      - L1.4.3 模型工程方法论
      - L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。
  • 内容
    • L2.1 API接口
      - L2.1.1 OpenAI API接口
      - L2.1.2 Python接口接入
      - L2.1.3 BOT工具类框架
      - L2.1.4 代码示例
    • L2.2 Prompt框架
      - L2.2.1 什么是Prompt
      - L2.2.2 Prompt框架应用现状
      - L2.2.3 基于GPTAS的Prompt框架
      - L2.2.4 Prompt框架与Thought
      - L2.2.5 Prompt框架与提示词
    • L2.3 流水线工程
      - L2.3.1 流水线工程的概念
      - L2.3.2 流水线工程的优点
      - L2.3.3 流水线工程的应用
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。
  • 内容
    • L3.1 Agent模型框架
      - L3.1.1 Agent模型框架的设计理念
      - L3.1.2 Agent模型框架的核心组件
      - L3.1.3 Agent模型框架的实现细节
    • L3.2 MetaGPT
      - L3.2.1 MetaGPT的基本概念
      - L3.2.2 MetaGPT的工作原理
      - L3.2.3 MetaGPT的应用场景
    • L3.3 ChatGLM
      - L3.3.1 ChatGLM的特点
      - L3.3.2 ChatGLM的开发环境
      - L3.3.3 ChatGLM的使用示例
    • L3.4 LLAMA
      - L3.4.1 LLAMA的特点
      - L3.4.2 LLAMA的开发环境
      - L3.4.3 LLAMA的使用示例
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。
  • 内容
    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

学习计划:

  • 阶段1:1-2个月,建立AI大模型的基础知识体系。
  • 阶段2:2-3个月,专注于API应用开发能力的提升。
  • 阶段3:3-4个月,深入实践AI大模型的应用架构和私有化部署。
  • 阶段4:4-5个月,专注于高级模型的应用和部署。
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1981517.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在Pxe环境下使用kickstart自动化批量安装Linux系统

一、环境准备 1.rhel7.9操作系统 2.开启主机图形 systemctl set-default graphical.target reboot 如果你的服务器安装了图形,直接切换启动级别5: init 5 3.配置好ip,网关,dns地址 nmcli connection add ifname eth0 con-na…

初学Ubuntu及遇到的问题

初学Ubuntu及遇到的问题 Ubuntu的安装 1.安装VMware Workstation Pro(网上有很多资料,本文就不细说啦~~~) 2.在Ubuntu官网下载iso文件>https://mirrors.tuna.tsinghua.edu.cn/ubuntu-releases/20.04/ iso文件随便放在哪个位置&#xff…

免费【2024】springboot 电影院订票信息管理系统的设计与实现

博主介绍:✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围:SpringBoot、Vue、SSM、HTML、Jsp、PHP、Nodejs、Python、爬虫、数据可视化…

计算机毕业设计选题推荐-教务管理系统-Java/Python项目实战

✨作者主页:IT毕设梦工厂✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Py…

六点建议有效防止晶振老化

晶振作为电子设备中的关键元件,其稳定性直接影响到整个系统的性能。晶振老化是导致其性能下降的主要原因之一。为了延长晶振的使用寿命,以下六点建议将帮助您有效防止晶振老化。 防止晶振老化的六点建议 1.避免裸手触碰: 不要用裸手直接触…

蓝牙耳机哪个品牌质量最好最耐用?4款主流品牌开放式耳机测评

开放式蓝牙耳机现在确实是很火爆啊。2023年期间,中国蓝牙耳机市场的整体销量约为8552万台,同比增长了7.5%。其中,开放式耳机市场销量达到了652万台,同比增长了130.2%。那其实这些数据就表明了开放式蓝牙耳机在中国市场正迅速增长&…

java.net.BindException: 地址已在使用

java.net.BindException: 地址已在使用,也可以说是端口被占用,通常出现在启动服务的时候。 安装netstat: sudo yum install net-tools 1、出错地方如图所示: 2、执行netstat -alnp | grep 8125 3、kill - 9 1899

Linux学习第58天:Regmap API 实验

Linux版本号4.1.15 芯片I.MX6ULL 大叔学Linux 品人间百味 思文短情长 本章思维导图如下: 一、Regmap API简介 1、什么是Regmap 寄存器设置 Linux 下使用 i2c_transfer 来读写 I2C 设备中的寄存器, SPI 接口的话使…

Java:设计模式(单例,工厂,代理,命令,桥接,观察者)

模式是一条由三部分组成的通用规则:它代表了一个特定环境、一类问题和一个解决方案之间的关系。每一个模式描述了一个不断重复发生的问题,以及该问题解决方案的核心设计。 软件领域的设计模式定义:设计模式是对处于特定环境下,经常…

Spring统一功能处理:拦截器、响应与异常的统一管理

目录 一.拦截器 二.统一数据返回格式 三.统一异常处理 一.拦截器 拦截器是Spring框架提供的核⼼功能之⼀,主要⽤来拦截⽤⼾的请求,在指定⽅法前后,根据业务需要执⾏预先设定的代码。 也就是说,允许开发⼈员提前预定义⼀些逻辑…

全球情境感知计算市场规划预测:未来六年CAGR为17.0%

随着全球数字化转型的加速和物联网技术的广泛应用,情境感知计算作为一种能够理解和响应环境变化的智能技术,正逐渐受到更多关注。本文旨在通过深度分析情境感知计算行业的各个维度,揭示行业发展趋势和潜在机会。 【市场趋势的演变】 1. 市场…

C++——string类及其使用

P. S.:以下代码均在VS2019环境下测试,不代表所有编译器均可通过。 P. S.:测试代码均未展示头文件iostream的声明,使用时请自行添加。 博主主页:Yan. yan.                        …

体系结构论文导读(三十一)(上):Soft errors in DNN accelerators: A comprehensive review

Soft errors in DNN accelerators: A comprehensive review DNN 加速器中的软错误:全面回顾 一、文章核心 深度学习任务覆盖了广泛应用。DNN算法被实现于不同系统上,从小型嵌入式设备到数据中心。DNN加速器(例如GPU、FPGA、ASIC&#xff0…

JetBrains:Wrong tag。注释告警

报错信息如下: Wrong tag ‘copyright:’ ,这个是alt enter 选择 Add copyright:to custom tags,虽然能解决问题,如果创建一个新项目又回出现这个告警提示。 其实这个问题的就是这个在Java Doc里面不存在,才会出现这…

Bugku-CTF-聪明的php

pass a parameter and maybe the flag files filename is random :> 传递一个参数,可能标记文件的文件名是随机的: 于是传一下参,在原网页后面加上/?a1,发现网页出现了变化 3.传入参数,一般情况下是文件包含,或者命令执行&…

linux安装weblogic

文章目录 weblogic是干什么用的weblogic安装前置条件1. 安装jdk2.安装weblogic2.1.创建用户组及用户2.2.切换用户上传安装jar包到目录下,配置文件进行安装准备配置文件2.3保证安装配置文件和安装jar包在同一目录,执行安装命令 3. 创建域来启动页面3.1 构…

Science Robotics 封面论文:美国宇航局喷气推进实验室开发了自主蛇形机器人,用于冰雪世界探索

人们对探索冰冷的卫星(如土卫二)的兴趣越来越大,这可能具有天体生物学意义。然而,由于地表或冰口内的环境极端,获取样本具有挑战性。美国宇航局的喷气推进实验室正在开发一种名为Exobiology Extant Life Surveyor&…

【分巧克力】

题目 代码 #include<bits/stdc.h> using namespace std;const int N 1e510; int n, k; int h[N], w[N]; bool check(int mid) {int cnt 0;for(int i 1; i < n; i){cnt (h[i] / mid) * (w[i] / mid); //切块一定是切出长方形洞才最省料&#xff0c;这样的话能切几…

等保测评练习卷27

等级保护初级测评师试题27 姓名&#xff1a; 成绩&#xff1a; 一、判断题&#xff08;10110分&#xff09; 1.对于大型物联网来说&#xff0c;处理应用层一般由云计算平台和业务应用终端设备构成。&#xff08; T &#xff09; …

企业数据接口:股权穿透

支持查询公司名称&#xff0c;股权路径&#xff0c;股东出资比例&#xff0c;层级等信息&#xff0c;呈现出公司多层次股权结构&#xff0c;高效理清企业投资股权关系