Prompt Engineering | 编写prompt的原则与策略

news2024/11/24 4:47:17

😄 为了更好地与大模型(e.g. chatgpt)更好的交流,一起来学习如何写prompt吧!😄

文章目录

  • 1、简介
  • 2、编写prompt的原则与策略
    • 2.1、编写清晰、具体的指令
      • 2.1.1、策略一:使用分隔符清晰地表示输入的不同部分
      • 2.1.2、策略二:要求一个结构化的输出
      • 2.1.3、策略三:要求模型检查是否满足条件
      • 2.1.4、策略四:提供少量示例
    • 2.2、给模型时间去思考
      • 2.2.1、策略一:指定完成任务所需的步骤
      • 2.2.2、策略二:指导模型在下结论之前找出一个自己的解法
  • 3、局限性

1、简介

  • 随着大型语言模型(LLM)的发展,LLM 大致可以分为两种类型,即基础LLM和指令微调LLM。基础LLM也就是之前那些预训练语言模型(如GPT-1, GPT-2, GPT-3)。指令微调LLM也就是在基于已经训练好的基础LLM,然后,使用输入是指令(prompt即提示)、输出是其应该返回的结果的数据集来对其进行微调,要求它遵循这些指令。然后通常使用一种称为 RLHF(reinforcement learning from human feedback,人类反馈强化学习)的技术进行进一步改进,使系统更能够有帮助地遵循指令。因为指令调整的 LLMs 已经被训练成有益、诚实和无害的,所以与基础LLMs相比,它们更不可能输出有问题的文本,如有害输出。
  • 当您使用指令微调 LLM 时,请类似于考虑向另一个人提供指令,假设它是一个聪明但不知道您任务的具体细节的人。当 LLM 无法正常工作时,有时是因为指令不够清晰。所以学好如何更好地提问,即如何做prompt工程师至关重要的
  • 在这里插入图片描述

2、编写prompt的原则与策略

2个原则:

  • 1、编写清晰、具体的指令
  • 2、给模型时间去思考

2.1、编写清晰、具体的指令

清晰与具体的指令将引导模型给出更准确详细的输出!

2.1.1、策略一:使用分隔符清晰地表示输入的不同部分

你可以使用任何明显的标点符号将特定的文本部分与prompt的其余部分分开,分隔符可以是:`,"",<>。这样是为了防止特定的文本与prompt冲突,导致prompt不明确。

如 输入一段 prompt 让 chatgpt 来总结:
【注:下面代码中使用 \ 来使文本适应屏幕大小以提高阅读体验,GPT 并不受 \ 的影响,但在你调用其他大模型时,需额外考虑 \ 是否会影响模型性能。】

text = f"""
你应该提供尽可能清晰、具体的指示,以表达你希望模型执行的任务。\
这将引导模型朝向所需的输出,并降低收到无关或不正确响应的可能性。\
不要将写清晰的提示与写简短的提示混淆。\
在许多情况下,更长的提示可以为模型提供更多的清晰度和上下文信息,从而导致更详细和相关的输出。
"""
# 需要总结的文本内容
prompt = f"""把用三个反引号括起来的文本总结成一句话。```{text}```"""

输出:
提供清晰具体的指示,避免无关或不正确响应,不要混淆写清晰和写简短,更长的提示可以提供更多清晰度和上下文信息,导致更详细和相关的输出。

2.1.2、策略二:要求一个结构化的输出

可以要求模型生成一个结构化的输出(如 Json、HTML 等格式),这可以使模型的输出更容易被我们解析。

prompt = f"""
请生成包括书名、作者和类别的3本虚构书籍清单,\
并以 JSON 格式提供,其中包含以下键:book_id、title、author、genre。
"""

生成如下:
{
  "books": [
    {
      "book_id": 1,
      "title": "The Shadow of the Wind",
      "author": "Carlos Ruiz Zafón",
      "genre": "Mystery"
    },
    {
      "book_id": 2,
      "title": "The Name of the Wind",
      "author": "Patrick Rothfuss",
      "genre": "Fantasy"
    },
    {
      "book_id": 3,
      "title": "The Hitchhiker's Guide to the Galaxy",
      "author": "Douglas Adams",
      "genre": "Science Fiction"
    }
  ]
}

2.1.3、策略三:要求模型检查是否满足条件

如果任务做出的假设不一定满足,我们可以告诉模型先检查这些假设,如果不满足,指示并停止执行。你还可以考虑潜在的边缘情况以及模型应该如何处理它们,以避免意外的错误或结果。

下面将让chatgpt判断prompt中是否包含明确的步骤指令,如果包含则按照给定格式重新编写指令,不包含则回答未提供步骤。

  • 有步骤的文本:
text_1 = f"""
泡一杯茶很容易。首先,需要把水烧开。\
在等待期间,拿一个杯子并把茶包放进去。\
一旦水足够热,就把它倒在茶包上。\
等待一会儿,让茶叶浸泡。几分钟后,取出茶包。\
如果你愿意,可以加一些糖或牛奶调味。\
就这样,你可以享受一杯美味的茶了。
"""
prompt = f"""您将获得由三个引号括起来的文本。如果它包含一系列的指令,则需要按照以下格式重新编写这些指令:
第一步 - ...
第二步 - …
…
第N步 - …
如果文本中不包含一系列的指令,则直接写“未提供步骤”。"
\"\"\"{text_1}\"\"\"
"""

输出:
第一步 - 把水烧开。
第二步 - 拿一个杯子并把茶包放进去。
第三步 - 把烧开的水倒在茶包上。
第四步 - 等待几分钟,让茶叶浸泡。
第五步 - 取出茶包。
第六步 - 如果你愿意,可以加一些糖或牛奶调味。
第七步 - 就这样,你可以享受一杯美味的茶了。
  • 无步骤的文本:

text_2 = f"""
今天阳光明媚,鸟儿在歌唱。\
这是一个去公园散步的美好日子。\
鲜花盛开,树枝在微风中轻轻摇曳。\
人们外出享受着这美好的天气,有些人在野餐,有些人在玩游戏或者在草地上放松。\
这是一个完美的日子,可以在户外度过并欣赏大自然的美景。
"""
prompt = f"""
您将获得由三个引号括起来的文本。如果它包含一系列的指令,则需要按照以下格式重新编写这些指令:
第一步 - ...
第二步 - …
…
第N步 - …

如果文本中不包含一系列的指令,则直接写“未提供步骤”。"
\"\"\"{text_2}\"\"\"
"""

输出:
未提供步骤。

2.1.4、策略四:提供少量示例

也就是gpt3里那种few-shot的方式,在要求模型执行实际任务之前,提供给它少量成功执行任务的示例

prompt = f"""
你的任务是以一致的风格回答问题。

<孩子>: 教我耐心。

<祖父母>: 挖出最深峡谷的河流源于一处不起眼的泉眼;最宏伟的交响乐从单一的音符开始;最复杂的挂毯以一根孤独的线开始编织。

<孩子>: 教我韧性。
"""

输出:
<祖父母>: 韧性就像是一棵树,它需要经历风吹雨打、寒冬酷暑,才能成长得更加坚强。在生活中,我们也需要经历各种挫折和困难,才能锻炼出韧性。记住,不要轻易放弃,坚持下去,你会发现自己变得更加坚强。

2.2、给模型时间去思考

引导模型在得出最终答案前进行一系列相关推理,指示模型花更多时间思考问题,这意味着它在任务上花费了更多的计算资源。防止模型在短时间内或用少量文字得出可能得出错误的结论。

2.2.1、策略一:指定完成任务所需的步骤

对于一些复杂的任务,给模型提供该任务的一系列步骤,有助于生成更满意的结果。

text = f"""
在一个迷人的村庄里,兄妹杰克和吉尔出发去一个山顶井里打水。\
他们一边唱着欢乐的歌,一边往上爬,\
然而不幸降临——杰克绊了一块石头,从山上滚了下来,吉尔紧随其后。\
虽然略有些摔伤,但他们还是回到了温馨的家中。\
尽管出了这样的意外,他们的冒险精神依然没有减弱,继续充满愉悦地探索。
"""

prompt_2 = f"""
1-用一句话概括下面用<>括起来的文本。
2-将摘要翻译成英语。
3-在英语摘要中列出每个名称。
4-输出一个 JSON 对象,其中包含以下键:English_summary,num_names。

请使用以下格式:
文本:[要总结的文本]
摘要:[摘要]
翻译:[摘要的翻译]
名称:[英语摘要中的名称列表]
输出 JSON:[带有 English_summary 和 num_names 的 JSON]

Text: <{text}>
"""

输出:
摘要:兄妹杰克和吉尔在迷人的村庄里冒险,不幸摔伤后回到家中,但仍然充满冒险精神。
翻译:In a charming village, siblings Jack and Jill set out to fetch water from a mountaintop well. While climbing and singing, Jack trips on a stone and tumbles down the mountain, with Jill following closely behind. Despite some bruises, they make it back home safely. Their adventurous spirit remains undiminished as they continue to explore with joy.
名称:Jack,Jill
输出 JSON:{"English_summary": "In a charming village, siblings Jack and Jill set out to fetch water from a mountaintop well. While climbing and singing, Jack trips on a stone and tumbles down the mountain, with Jill following closely behind. Despite some bruises, they make it back home safely. Their adventurous spirit remains undiminished as they continue to explore with joy.", "num_names": 2}

2.2.2、策略二:指导模型在下结论之前找出一个自己的解法

有时候你直接问模型,比如:“判断我的解决方案是否正确,现在要解决一个xx问题,我的解决方案是xx。”;模型很有可能被我的解决方案误导为是正确的,但实际上你的解决方案是错的。这时候如果先让模型自己先找出一个解决方案,再和我的解决方案对比,这样得出的解决方案才更可能是经过模型思考的。

  • 模型犯错例子:
prompt = f"""
判断学生的解决方案是否正确。

问题:
我正在建造一个太阳能发电站,需要帮助计算财务。

    土地费用为 100美元/平方英尺
    我可以以 250美元/平方英尺的价格购买太阳能电池板
    我已经谈判好了维护合同,每年需要支付固定的10万美元,并额外支付每平方英尺10美元
    作为平方英尺数的函数,首年运营的总费用是多少。

学生的解决方案:
设x为发电站的大小,单位为平方英尺。
费用:

    土地费用:100x
    太阳能电池板费用:250x
    维护费用:100,000美元+100x
    总费用:100x+250x+100,000美元+100x=450x+100,000美元
"""

输出:
学生的解决方案是正确的。
  • 模型回答正确例子:
prompt = f"""
请判断学生的解决方案是否正确,请通过如下步骤解决这个问题:

步骤:

    首先,自己解决问题。
    然后将你的解决方案与学生的解决方案进行比较,并评估学生的解决方案是否正确。在自己完成问题之前,请勿决定学生的解决方案是否正确。

使用以下格式:

    问题:问题文本
    学生的解决方案:学生的解决方案文本
    实际解决方案和步骤:实际解决方案和步骤文本
    学生的解决方案和实际解决方案是否相同:是或否
    学生的成绩:正确或不正确

问题:

    我正在建造一个太阳能发电站,需要帮助计算财务。 
    - 土地费用为每平方英尺100美元
    - 我可以以每平方英尺250美元的价格购买太阳能电池板
    - 我已经谈判好了维护合同,每年需要支付固定的10万美元,并额外支付每平方英尺10美元
    作为平方英尺数的函数,首年运营的总费用是多少。

学生的解决方案:

    设x为发电站的大小,单位为平方英尺。
    费用:
    1. 土地费用:100x
    2. 太阳能电池板费用:250x
    3. 维护费用:100,000+100x
    总费用:100x+250x+100,000+100x=450x+100,000

实际解决方案和步骤:
"""

输出:
正确的解决方案和步骤:
1. 计算土地费用:100美元/平方英尺 * x平方英尺 = 100x美元
2. 计算太阳能电池板费用:250美元/平方英尺 * x平方英尺 = 250x美元
3. 计算维护费用:10万美元 + 10美元/平方英尺 * x平方英尺 = 10万美元 + 10x美元
4. 计算总费用:100x美元 + 250x美元 + 10万美元 + 10x美元 = 360x + 10万美元

学生的解决方案和实际解决方案是否相同:否

学生的成绩:不正确

3、局限性

  • 模型偶尔会一本正经地胡说八道,也就是会生成一些看似真实实则并不正确或存在的虚假内容,又称为 “hallucination” 即幻觉。
  • 所以学好构建prompt的技巧有利于在构建自己的LLM应用程序时避免这种情况。
  • 在你希望模型根据文本生成答案的情况下,另一种减少幻觉的策略是先要求模型找到文本中的任何相关引用,然后要求它使用这些引用来回答问题,这种追溯源文档的方法通常对减少幻觉非常有帮助。







参考链接:
[1] OpenAI
[2] 吴恩达老师的:DeepLearning.AI
[3] DataWhale
[4] https://learn.deeplearning.ai/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/559065.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

js 解析map (处理后端返回对象拼接)

返回的数据 需要的展示效果 解析如下&#xff1a; { title: ‘销售属性’, align: ‘left’, dataIndex: ‘xsshuxing’, width: 200, render(value, record) { let keyValue ‘’; { for (var key in record.otherAttr) { console.log(‘属性&#xff1a;’ key ‘,值&…

EIS-Net

我们提出了一种新的领域泛化框架&#xff08;称为EISNet&#xff09;&#xff0c;该框架利用来自多源领域图像的外在关系监督和内在自我监督学习&#xff0c;学习如何同时在不同领域中进行泛化。 具体而言&#xff0c;我们采用多任务学习范式&#xff0c;通过特征嵌入来构建我…

AI智慧安监视频平台EasyCVR视频出现不能播放的情况排查与解决

EasyCVR基于云边端协同&#xff0c;可支持海量视频的轻量化接入与汇聚管理。平台兼容性强、拓展度高&#xff0c;可提供视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、H.265自动转码、平台级联等功能。 有用户反…

如何动态生成列表视图?

UE5 插件开发指南 前言0 什么是列表视图?1 如何动态生成?1.0 指定ListView生成的条目前言 这里将其拆分成两个问题来分析: (1)什么是列表视图? (2)如何动态生成? 0 什么是列表视图? 列表视图就是用来展示一系列对象的UI列表,在UE编辑器的UserWidget设计窗口中可以找到…

linux 安装 ffmpeg

linux 安装 ffmpeg windows上安装&#xff0c;直接下载压缩包解压。linux安装&#xff0c;找了半天各种技术文章&#xff0c;说最好编译安装&#xff0c;按照步骤安装编译环境编译成功了&#xff0c;但是使用的时候总要安装各种外部库&#xff0c;转码转不了等等问题...... 最…

城市生命线监测系统包括哪些内容?

城市排水、供水、燃气、供热、桥梁、隧道、综合管廊等基础设施是城市正常运转的基石&#xff0c;被称为“城市生命线”。城市生命线一旦出现故障或事故&#xff0c;将会给城市和居民带来巨大的经济和生活损失。通过对城市生命线的实时监测和预警&#xff0c;可以及时发现潜在的…

第十五届“中国电机工程学会杯”数学建模竞赛

第十五届电工杯5月26号就要开始啦&#xff0c;今天给大家回顾第十四届全国大学生电工数学建模竞赛A题&#xff0c;主要从赛题重述和问题分析与代码实战展开。第十五届全国大学生电工数学建模竞赛已经开始报名了哦&#xff0c;后续我也会分享对应的建模思路哦&#xff0c;大家记…

Leetcode452. 用最少数量的箭引爆气球

Every day a Leetcode 题目来源&#xff1a;452. 用最少数量的箭引爆气球 解法1&#xff1a;排序 贪心 题解&#xff1a;用最少数量的箭引爆气球 我们首先随机地射出一支箭&#xff0c;再看一看是否能够调整这支箭地射出位置&#xff0c;使得我们可以引爆更多数目的气球。…

CVPR论文解读 | 点云匹配的旋转不变变压器

原创 | 文 BFT机器人 传统的手工特征描述符通常具有内在的旋转不变性&#xff0c;但是最近的深度匹配器通常通过数据增强来获得旋转不变性。 然而&#xff0c;由于增强旋转数量有限&#xff0c;无法覆盖连续SO&#xff08;3&#xff09;空间中所有可能的旋转&#xff0c;因此这…

VC6.0的工程设置解读Project--Settings

做开发差不多一年多了&#xff0c;突然感觉对VC的工程设置都不是很清楚&#xff0c;天天要和VC见面&#xff0c;虽然通常情况下一般都不会修改工程设置&#xff0c;但是还是有必要对它的一些设置项的来龙去脉有一定的了解&#xff0c;所以狂查资料&#xff0c;稍作整理&#xf…

(仿真)创建 URDF 机器人模(1)

继上一篇基础篇的结束&#xff0c;不用看以前的也可以&#xff0c;这里是不受前面的影响的。 如果你没有这个目录&#xff0c;就创建一个catkin_ws文件夹 然后里面再一个src文件夹就ok了&#xff0c;我在基础篇第一篇的时候就有这个文件夹了&#xff0c;所有我现在是直接进入 …

【 计算机组成原理 】第七章 外围设备

系列文章目录 第一章 计算系统概论 第二章 运算方法和运算器 第三章 多层次的存储器 第四章 指令系统 第五章 中央处理器 第六章 总线系统 第七章 外围设备 第八章 输入输出系统 文章目录 系列文章目录前言第七章 外围设备7.1 外围设备概述7.1.1 外围设备的一般功能7.1.2 外围…

zabbix安装部署、三分钟分钟部署zabbix监控(超详细)

zabbix安装部署 1&#xff0c;快速安装部署zabbix2&#xff0c;一键脚本安装zabbix 1&#xff0c;快速安装部署zabbix 1&#xff0c;关闭防火墙&#xff0c;selinux systemctl stop firewalld systemctl disable firewalld setenforce 0 #临时 sed -i s/SELINUXenforcing/SE…

运维宝典大全

运维宝典大全 网络拓展Linux 概述什么是LinuxUnix和Linux有什么区别&#xff1f;什么是 Linux 内核&#xff1f;Linux的基本组件是什么&#xff1f;Linux 的体系结构BASH和DOS之间的基本区别是什么&#xff1f;Linux 开机启动过程&#xff1f;Linux系统缺省的运行级别&#xff…

Jmeter性能测试 -3 Jmeter使用中的一些问题

请求内容出现乱码的处理方法 1 内容编码&#xff1a;utf-8 2 请求头添加编码 Content-Type: application/json;charsetutf-8 3 请求体为参数类型时&#xff0c;勾选参数“编码”&#xff0c;编码为urlencoded编码。当参数值为非字符&#xff08;汉字、特殊符号&#xff09;时…

全面了解Java连接MySQL的基础知识,快速实现数据交互

全面了解Java连接MySQL的基础知识&#xff0c;快速实现数据交互 1. 数据库的重要性2. MySQL数据库简介2.1 MySQL数据库的基本概念2.2 MySQL的基本组成部分包括服务器、客户端和存储引擎。2.3 安装MySQL数据库2.3.1安装MySQL数据库2.3.2 下载MySQL安装程序2.3.3 运行MySQL安装程…

API接口|了解API接口测试|API接口测试指南

part1.什么是API接口 API接口是指应用程序接口&#xff08;Application Programming Interface&#xff09;&#xff0c;它是一组定义、控制和描述软件程序中不同组件之间交互的方式和规则。 API接口允许不同的软件系统之间进行信息共享和相互访问&#xff0c;而无需了解在其…

QT6之QTimeZone

一、简介 QTimeZone 标识时间表示与 UTC 的关系&#xff0c;也可以表示 UTC、本地时间和与 UTC 的固定偏移量。 QTimeZone&#xff08;自 Qt 6.5 起&#xff09;统一了它们与一般时间系统的表示&#xff0c;大多数操作系统普遍支持的一个时区被指定为本地时间。 总结&#x…

bim精装修常用软件【建模助手】有什么功能?

大家好&#xff0c;这里是BIM建模助手。 今天有个重磅消息要告诉大家&#xff0c;那就是BIM建模助手的【精装模块】上线啦&#xff01; 为了辅助BIMer快速设计出精装修的房屋效果&#xff0c;我们开发了【精装模块】&#xff0c;无论是装饰面层、铺排瓷砖、布置吊顶、统计出量…

chatgpt赋能Python-python_kazoo

Python Kazoo: 优质的分布式应用程序开发工具 什么是Python Kazoo&#xff1f; Python Kazoo是一个Python库&#xff0c;它提供了高级别的API&#xff0c;使得分布式应用程序的开发更加容易。Kazoo是基于Zookeeper实现的&#xff0c;它是一个分布式系统协调器&#xff0c;为分…