【AI】prompt engineering

news2025/4/18 3:45:37

prompt engineering ## prompt engineering ## prompt engineering ## prompt engineering

一、定义

Prompt 工程(Prompt Engineering)是指在使用语言模型(如 ChatGPT、文心一言等)等人工智能工具时,设计和优化输入提示(prompts)的过程。这些输入提示是用户向模型提出的文本指令,用于引导模型生成满足特定需求的高质量输出,比如回答问题、生成文本内容(故事、诗歌、代码等)。

二、 概念
样本提示

样本提示是指在prompt engineering过程中,通过向大模型定数量的示例,以便引导大模型生成特定的、高

质量的输出。从提供样本数量的角度,可以分为zero-shot和few-shot,此外我们基于实际使用,增加了一种

新的定义:full-shot,即全量样本。

zero-shotfew-shotfull-shot
定义指在没有提供任何示例的情况下,
利用经过大量数据训练并调整指令
的大型语言模型(LLM)来执行任
务。
few-shot是指通过在提示中提供少量示
例来引导模型进行上下文学习,使大模
型捕获示例的特征,输出更符合预期的
结果。
是指通过枚举所有可能性来制作样
本,输入大模型,让大模型在样本的
范围内返回内容。
prompt举例翻译任务:
请将用户给定的内容进行中文和
英文互译
情感分析:
请分析用户给定内容的情感,属于正
面、负面或者中性,示例:
我今天感觉棒极了!–正面
这真是糟糕透顶的一天。–负面
今天是星期三。–中性
根据用户偏好中每周运动天数安排
周计划的运动日和休息日
{{exercise_days}为0时,每周运
动日应为0天,休息日为7天。
{{exercise_days}为1时,每周运
动日应为1天,休息日为6天。
{{exercise_days}为2时,每周运
动日应为2天,休息日为5天。
{{exercise_days}为3时,每周运
动日应为3天,休息日为4天。
{{exercise_days}为4时,每周运
动日应为4天,休息日为3天。
{{exercise_days}}为5时,每周运
动日应为5天,休息日为2天。
{{exercise_days}为6时,每周运
动日应为6天,休息日为1天。
{{exercise_days}为7时,每周运
动日应为7天,休息日为0天。
使用场景适用于模型已经在大量数据上进行
了训练,能够理解和执行某些任务
的场景。如:
判断内容的情感倾向或者正面/负
适用于模型在没有足够数据的情况下,
难以准确执行任务的场景。如:
物体识别、特征识别
适用于可能性数量较小且确定的场
景,限定大模型自由发挥的空间,确
保生成结果不超出预设范围。
思考方式
  1. Chain - of - Thought (COT)
    • 定义
      • 思维链(Chain - of - Thought)是一种在自然语言处理中用于提升语言模型推理能力的技术。它通过在提示(prompt)中加入中间推理步骤,引导语言模型像人类一样逐步思考并解决问题,而不是直接给出答案。
    • 工作原理
      • 以一个数学文字题为例,如 “小明有 5 个苹果,小红的苹果数是小明的 3 倍少 2 个,问小红有几个苹果?”。传统的 prompt 可能只是简单地将问题输入给语言模型,要求其输出答案。而在 COT 中,prompt 会这样设计:“首先,我们知道小明有 5 个苹果。然后,计算小明苹果数的 3 倍,即 5×3 = 15 个。接着,因为小红的苹果数是小明的 3 倍少 2 个,所以用 15 - 2 = 13 个。所以,小红有 13 个苹果。”
      • 通过这种逐步推理的提示,语言模型能够更好地理解问题的解决逻辑,并且在遇到类似的推理问题时,按照这种思维链模式进行思考和回答。
    • 应用场景
      • 数学和逻辑推理问题:在解决复杂的数学方程式、几何证明以及逻辑谜题等方面表现出色。例如,在证明几何定理时,思维链可以引导模型从已知条件出发,逐步推导出结论。
      • 知识问答和文本理解:对于需要深度理解和推理的知识问答,如历史事件的因果分析、科学原理的解释等,COT 可以帮助模型提供更有条理的回答。例如,在回答 “工业革命对社会结构产生了什么深远影响?” 时,模型可以通过思维链先阐述工业革命带来的生产力变化,再说明这种变化如何导致社会阶层的分化和重组等。
检索增强生成(Retrieval-Augmented Generation, RAG)

检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合信息检索和生成模型的技术,旨在提高生成式模型的准确性和信息丰富性。传统的生成模型(如GPT-3)在生成文本时主要依赖于训练数据中的知识,而检索增强生成通过引入外部知识库或文档库,能够在生成过程中动态获取相关信息,从而生成更为准确和上下文相关的内容。

RAG 的基本流程包括以下几个步骤:

  1. 检索阶段:在生成文本之前,系统会根据输入查询从一个大型的外部文档库中检索出与查询相关的文档或信息片段。这通常使用信息检索技术,如向量检索(如使用 ByteGraph)。
  2. 生成阶段:将检索到的相关文档或信息片段与原始输入一起传递给大语言模型,以生成最终的输出文本。大语言模型会利用这些附加信息来提高生成内容的准确性和相关性。

这种方法的优点在于:

  • 增强知识覆盖:通过访问外部知识库,生成模型可以利用最新的信息,而不局限于训练数据。
  • 提高准确性:检索到的相关信息可以帮助生成模型避免常识性错误或过时的信息。
  • 灵活性:可以根据不同的任务或领域,动态调整检索的文档库,以适应不同的需求。

RAG 在问答系统、对话系统和内容生成等领域有广泛的应用,尤其是在企业内部需要高准确性和实时信息的场景中表现出色。

工具(Tooling)

大语言模型最初主要用于来生成文本。为了增强其功能和实用性,现代大语言模型可以与外部工具(也称为“函数(function)”或“API”)集成。这种集成使得模型能够执行更复杂的任务,超越其原始的文本生成能力。

工具(Tools)通常是外部的API或函数,提供特定的功能或服务。大语言模型可以通过调用这些工具来获取信息或执行特定任务。例如,模型可以调用一个天气API来获取实时天气信息,或者调用一个计算器函数来执行复杂的数学运算。工具的集成与调用包括:

  • API调用:模型通过HTTP请求与外部API进行通信。API通常提供RESTful接口,模型可以发送请求并解析响应。
  • 插件系统:如 Coze 这样的平台为大语言模型提供插件系统和自动化流程系统,使得模型可以动态加载和使用不同的工具。
  • 函数调用:在某些实现中,模型可以直接调用预定义的函数,这些函数可以是本地的或远程的。

大模型工具的使用,可以:

  • 扩展能力:通过工具集成,模型的能力可以大大扩展,能够处理更广泛的任务。
  • 实时性:工具可以提供实时数据和信息,使得模型的输出更加准确和相关。
  • 专业性:通过调用专门的工具,模型可以在特定领域提供更专业和深入的服务。

典型的应用场景包括:

  • 数据查询分析:数据查询分析领域可以执行通过可以执行 SQL 的工具访问企业内部的数据,调用飞书的 API 接口生成飞书文档,并提醒飞书联系人关注。
  • 客户服务:在客户服务中,模型可以调用CRM系统API来获取客户和订单信息,从而提供个性化的服务。
  • 金融分析:在金融领域,模型可以调用市场数据API来分析股票趋势和进行投资建议。
SerpApi: Google Search API

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2331242.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无需libpacp库,BPF指令高效捕获指定数据包

【环境】无libpacp库的Linux服务器 【要求】高效率读取数据包,并过滤指定端口和ip 目前遇到两个问题 一是手写BPF,难以兼容,有些无法正常过滤二是性能消耗问题,尽可能控制到1% 大方向:过滤数据包要在内核层处理&…

react实现上传图片到阿里云OSS以及问题解决(保姆级)

一、优势 提高上传速度:前端直传利用了浏览器与 OSS 之间的直接连接,能够充分利用用户的网络带宽。相比之下,后端传递文件时,文件需要经过后端服务器的中转,可能会受到后端服务器网络环境和处理能力的限制,…

Python 字典和集合(常见的映射方法)

本章内容的大纲如下: 常见的字典方法 如何处理查找不到的键 标准库中 dict 类型的变种set 和 frozenset 类型 散列表的工作原理 散列表带来的潜在影响(什么样的数据类型可作为键、不可预知的 顺序,等等) 常见的映射方法 映射类型…

Matlab轴承故障信号仿真与故障分析

1.摘要 本文介绍了一个基于Matlab的轴承故障信号仿真与分析程序,旨在模拟和分析轴承内圈故障信号的特征。程序首先通过生成故障信号、共振信号和调制信号,添加噪声和离散化处理,构建模拟的振动信号,并保存相关数据。通过快速傅里…

Linux 进程 | 概念 / 特征 / 状态 / 优先级 / 空间

注: 本文为 “Linux 进程” 相关文章合辑。 未整理去重。 Linux 进程概念(精讲) A little strawberry 于 2021-10-15 10:23:55 发布 基本概念 课本概念:程序的一个执行实例,正在执行的程序等。 内核观点&#xff…

重回全面发展亲自操刀

项目场景: 今年工作变动,优化后在一家做国有项目的私人公司安顿下来了。公司环境不如以前,但是好在瑞欣依然可以每天方便的买到。人文氛围挺好,就是工时感觉有点紧,可能长期从事产品迭代开发,一下子转变做项…

3D珠宝渲染用什么软件比较好?渲染100邀请码1a12

印度珠宝商 Mohar Fine Jewels 和英国宝石商 Gemfields 在今年推出了合作珠宝系列——「Emeralds in Full Bloom」,它的灵感源自花草绽放的春季田野,共有 39 件作品,下面这个以植物为主题的开口手镯就是其中一件。 在数字时代,像这…

【数据结构】邻接矩阵完全指南:原理、实现与稠密图优化技巧​

邻接矩阵 导读一、图的存储结构1.1 分类 二、邻接矩阵法2.1 邻接矩阵2.2 邻接矩阵存储网 三、邻接矩阵的存储结构四、算法评价4.1 时间复杂度4.2 空间复杂度 五、邻接矩阵的特点5.1 特点1解析5.2 特点2解析5.3 特点3解析5.4 特点4解析5.5 特点5解析5.6 特点6解析 结语 导读 大…

【嵌入式-stm32电位器控制以及旋转编码器控制LED亮暗】

嵌入式-stm32电位器控制LED亮暗 任务1代码1Key.cKey.hTimer.cTimer.hPWM.cPWM.hmain.c 实验现象1任务2代码2Key.cKey.hmain.c 实验现象2问题与解决总结 源码框架取自江协科技,在此基础上做扩展开发。 任务1 本文主要介绍利用stm32f103C8T6实现电位器控制PWM的占空比…

Uniapp 集成极光推送(JPush)完整指南

文章目录 前言一、准备工作1. 注册极光开发者账号2. 创建应用3. Uniapp项目准备 二、集成极光推送插件方法一:使用UniPush(推荐)方法二:手动集成极光推送SDK 三、配置原生平台参数四、核心功能实现1. 获取RegistrationID2. 设置别…

2025年常见渗透测试面试题-sql(题目+回答)

网络安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 SQLi 一、发现test.jsp?cid150 注入点的5种WebShell获取思路 1. 文件写入攻击 2. 日志文件劫持 3.…

【RabbitMQ】队列模型

1.概述 RabbitMQ作为消息队列,有6种队列模型,分别在不同的场景进行使用,分别是Hello World,Work queues,Publish/Subscribe,Routing,Topics,RPC。 下面就分别对几个模型进行讲述。…

StarRocks 助力首汽约车精细化运营

作者:任智红,首汽约车大数据负责人 更多交流,联系我们:https://wx.focussend.com/weComLink/mobileQrCodeLink/334%201%202/ffbe5 导读: 本文整理自首汽约车大数据负责人任智红在 StarRocks 年度峰会上的演讲&#xf…

痉挛性斜颈康复助力:饮食调养指南

痉挛性斜颈患者除了积极治疗,合理饮食也能辅助缓解症状,提升生活质量。其健康饮食可从以下方面着手: 高蛋白质食物助力肌肉修复 痉挛性斜颈会导致颈部肌肉异常收缩,消耗较多能量,蛋白质有助于肌肉的修复与维持。日常可…

mysql镜像创建docker容器,及其可能遇到的问题

前提,已经弄好基本的docker服务了。 一、基本流程 1、目录准备 我自己的资料喜欢放在 /data 目录下,所以老规矩: 先进入 /data 目录: cd /data 创建 mysql 目录并进入: mkdir mysql cd mysql 2、镜像查找 docke…

JavaEE——线程的状态

目录 前言1. NEW2. TERMINATED3. RUNNABLE4. 三种阻塞状态总结 前言 本篇文章来讲解线程的几种状态。在Java中,线程的状态是一个枚举类型,Thread.State。其中一共分为了六个状态。分别为:NEW,RUNNABLE,BLOCKED,WAITING,TIMED_WAITING, TERMI…

RuntimeError: Error(s) in loading state_dict for ChartParser

一 bug错误 最近使用千问大模型有一个bug,报错信息如下 raise RuntimeError(Error(s) in loading state_dict for {}:\n\t{}.format( RuntimeError: Error(s) in loading state_dict for ChartParser:Unexpected key(s) in state_dict: "pretrained_model.em…

2025 年安徽交安安全员考试:利用记忆宫殿强化记忆​

安徽考生在面对交安安全员考试繁杂的知识点时,记忆宫殿是强大的记忆工具。选择一个熟悉且空间结构清晰的场所作为记忆宫殿,如自己居住的房屋。将房屋的不同区域,如客厅、卧室、厨房等,分别对应不同知识板块,像客厅对应…

安全编码课程 实验6 整数安全

实验项目 实现安全计数器:实现 Counter 结构,确保计数范围为 0~100。 实验要求: 1、使用 struct 封装计数值value; 2、计数器初值为 0; 3、increment() 方法增加计数,但不能超过 100; 4、decrem…

解决上传PDF、视频、音频等格式文件到FTP站点时报错“将文件复制到FTP服务器时发生错误。请检查是否有权限将文件放到该服务器上”问题

一、问题描述 可以将文本文件(.txt格式),图像文件(.jpg、.png等格式)上传到我们的FTP服务器上;但是上传一些PDF文件、视频等文件时就会报错“ 将文件复制到FTP服务器时发生错误。请检查是否有权限将文件放到该服务器上。 详细信息: 200 Type set to l. 227 Entering Pas…