【大模型基础_毛玉仁】3.5 Prompt相关应用

news2025/3/28 6:01:24

目录

    • 3.5 相关应用
      • 3.5.1 基于大语言模型的Agent
      • 3.5.2 数据合成
      • 3.5.3 Text-to-SQL
      • 3.5.4 GPTs


3.5 相关应用

Prompt工程应用广泛,能提升大语言模型处理基础及复杂任务的能力,在构建Agent、数据合成、Text-to-SQL转换和设计个性化GPTs等方面不可或缺。

.

3.5.1 基于大语言模型的Agent

智能体(Agent)是能自主感知并行动以达成目标的实体,作为实现通用人工智能(AGI)的有力手段,被期望在多样化环境中完成复杂任务并展现类人智能。

传统Agent依赖简单启发式策略函数,在受限环境中学习操作,难以复制人类决策过程,限制了其能力与应用范围。基于大语言模型的Agent展现出强大决策能力,拥有全面通用知识,即便缺乏训练数据,也能进行规划、决策、工具调用等复杂行动。

Prompt工程在Agent中至关重要。Agent系统以大语言模型为核心控制器,依赖Prompt完成规划、决策、行动等操作。其框架包括:配置模块(Profile)、记忆模块(Memory)、计划模块(Planning)和行动模块(Action),Prompt工程技术贯穿整个流程,为各模块提供支持。

图3.30: 基于大语言模型的Agent框架流程示意图
在这里插入图片描述

在Agent中:

  • 配置模块:利用Prompt工程的角色扮演技术定义Agent角色,将其背景、技能等信息嵌入交互Prompt;

  • 记忆模块:作为存储中心,通过检索增强等技术并借助上下文学习优化查询,将获取的记忆添加到交互Prompt中辅助决策;

  • 计划模块:借助Prompt工程的思维链和上下文学习技术,将复杂任务分解为子任务并调控粒度;

  • 行动模块:将计划转化为行动步骤,通过工具API接口生成并执行代码以实现目标。这四个组件分工协作完成复杂任务。

.

3.5.2 数据合成

数据质量是决定大语言模型性能的关键因素之一,因为“Garbage in, Garbage out”,即模型表现高度依赖训练数据的质量,无论模型架构、训练算法和计算资源多么优秀。然而,获取高质量数据面临挑战:

  • 公共领域:高质量语言数据预计2026年左右耗尽;

  • 特定领域:垂直数据因隐私保护和标注难度等问题难以大量提供,限制了模型的进一步发展。

数据合成作为补充或替代真实数据的手段,因可控、安全、低成本等优势受关注,特别是利用大语言模型生成训练数据成为研究热点。

通过Prompt工程技术,利用大语言模型的思维和指令跟随能力合成高质量数据,Self-Instruct是代表性方法。它通过构建Prompt,多步骤调用大语言模型,依据少量指令数据合成大量多样化指令数据。

如金融场景中,先人工标注少量金融指令数据,再用Self-Instruct方法调用大语言模型,将数据扩展至数万条且保持高质量和多样性。

图3.31: Self-Instruct 流程示例图
在这里插入图片描述

Self-Instruct 包含构建任务池、指令生成、指令分类、数据生成、数据过滤五个步骤。

  • 任务池:存储初始及后续生成的指令数据;

  • 指令生成:参考任务池样例生成指令部分;

  • 指令分类:将指令分为分类任务和生成任务,不同模式下生成数据方式不同;

  • 数据生成:根据已有指令生成输入和回答部分;

  • 数据过滤:去除低质量数据,保证指令数据质量。

它从有限的手动编写任务种子集开始,通过与大语言模型交互,不断生成指令数据,扩充原始数据集。

.

3.5.3 Text-to-SQL

Text-to-SQL:将自然语言查询翻译成可执行SQL语句。

C3是最早使用大语言模型进行零样本Text-to-SQL的方法,其核心是Prompt工程设计,包括三个关键部分:清晰提示(ClearPrompting)、提示校准(Calibration with Hints)和一致输出(Consistent Output)。

图3.33: C3 方法整体框架图
在这里插入图片描述

在模型输入端,清晰提示包含:

  • 清晰布局:通过明确符号划分指令、上下文和问题,提升模型理解能力;

  • 清晰上下文:设计零样本Prompt,指示模型从数据库中召回相关信息,提高SQL生成准确性。

为应对模型固有偏差,C3采用提示校准策略,利用包含历史对话的上下文提示,将先验知识纳入模型,通过设定模型为SQL专家角色并引导其遵循预设提示,有效校准偏差。

在模型输出端,C3采用输出校准,应用Self-Consistency方法对多种推理路径采样,选择最一致的答案,增强输出稳定性,保持SQL查询一致性。

.

3.5.4 GPTs

GPTs是OpenAI推出的支持用户自定义的GPT应用,允许用户通过编写Prompt, 添加工具等方式创建定制版的GPT应用,也可以使用别人分享的GPTs模型。

.


其他参考:【大模型基础_毛玉仁】系列文章


声明:资源可能存在第三方来源,若有侵权请联系删除!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2321327.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

deepseek搭建本地私有知识库dify安装介绍docker compose图文教程

按照官方介绍,打开教程安装。下载源码, # 假设当前最新版本为 0.15.3 git clone https://github.com/langgenius/dify.git --branch 0.15.3 进入docker目录, cd dify/docker 网络科学的直接执行命令就可以了。 docker compose up -d 镜…

右击没有Word、PPT、Excel功能

右击没有Word、PPT、Excel功能 导航 文章目录 右击没有Word、PPT、Excel功能导航一、问题描述二、事情经过三、解决方案其他思路分享 一、问题描述 ​ 在安装并激活了office之后,业务反馈右击没有出现新建Word功能,仅有Word文档 二、事情经过 ​ 按道…

DeepSeek R1 本地部署指南 (6) - Windows 本地部署使用 GPU 运行

DeepSeek R1 本地部署指南 (1) - Windows 本地部署 上一篇,安装好 Windows 本地步骤后,如果发现在任务管理器中 GPU 显示 0%。 1.在命令行中输入: ollama ps 显示: PROCESSOR CPU 2.安装 CUDA Toolkit CUDA Toolkit Downloads htt…

婚姻的解构与重构 | 一场关于选择与责任的探索

注:本文为 “婚姻的解构与重构” 相关文章合辑。 未整理。 明明渴望爱情 为何反感催婚? 原创 常 晋 人民日报评论 2024 年 04 月 22 日 12:29 北京 没有催促指责,也毫无批评之意。面对单身、失业的 30 岁女儿,只是鼓励孩子&…

jangow靶机攻略

配置网卡 VMware需要配置,不配置扫不到ip,VirtualBox正常打开ip会直接显示出来 网卡配置都改成NAT 打开虚拟机,第一个框选第二行,回车 选第二个,按e键 进入下一个框后,将ro 后面的修改为 rw signin init/bin/bash 按…

自动化测试框架维护成本高怎么办

自动化测试框架维护成本高,可以通过优化测试用例设计、引入持续集成(CI)策略、强化代码规范和审查机制、建立明确的维护计划、定期进行技术债务清理等方式来降低成本。 其中,优化测试用例设计尤其关键,它不仅能提高测试…

日事清在敏捷开发中的实战应用:SCRUM框架下可视化项目管理+高效沟通机制驱动灵活迭代

一、行业背景 在快速发展的互联网行业中,软件开发模式经历了显著的演变。传统的瀑布式开发模式,以其线性和阶段性的特点,曾长期占据主导地位。然而,随着市场对软件迭代速度和灵活性的要求日益提高,敏捷开发模式应运而…

Buildroot 增加系统启动项并解决后台无法获取输入(串口)

Buildroot 增加自启动项 概述增加模块源码结构编写测试程序编译测试增加系统自启动一个问题解决方案:显式指定输入设备 其他/etc/init.d 目录下的 SXXxxx 文件作用解析‌ 概述 Buildroot 是一款轻量级、高度可定制的开源工具集,专为嵌入式系统打造。它通…

数据库取证分析

目录 一.多表关联 1.一对多联结 2.子查询 二.数据库示例分析 1.多表关联 三.选择SQL分析的原因 四.数据库概述 五.SQL语言 一.多表关联 1.一对多联结 2.子查询 二.数据库示例分析 1.多表关联 三.选择SQL分析的原因 四.数据库概述 五.SQL语言 1.select 字段

【深度技术揭秘】 Android SystemUI锁屏界面动态布局重构:横竖屏智能适配指南

1. 问题背景与需求拆解 在Android 13系统定制中,发现平板横屏锁屏界面存在两大视觉问题: 时钟控件尺寸过大,与竖屏样式不统一 解锁图标位置异常,横向居中而非顶部居中(如图示) 需实现: 横竖屏…

制作PaddleOCR/PaddleHub的Docker镜像

背景 在落地RAG知识库过程中,遇到了图文识别、图片表格内容识别的需求。但那时(2024年4月)各开源RAG项目还没有集成成熟的解决方案,经调研我选择了百度开源的PaddleOCR。支持国产! 概念梳理 PaddleOCR 百度飞桨的OCR…

Ubuntu部署Docker搭建靶场

前言 我们需要部署Docker来搭建靶场题目,他可以提供一个隔离的环境,方便在不同的机器上部署,接下来,我会记录我的操作过程,简单的部署一道题目 Docker安装 不推荐在物理机上部署,可能会遇到一些问题&…

【DFS】羌笛何须怨杨柳,春风不度玉门关 - 4. 二叉树中的深搜

本篇博客给大家带来的是二叉树深度优先搜索的解法技巧,在后面的文章中题目会涉及到回溯和剪枝,遇到了一并讲清楚. 🐎文章专栏: DFS 🚀若有问题 评论区见 ❤ 欢迎大家点赞 评论 收藏 分享 如果你不知道分享给谁,那就分享给薯条. 你们的支持是我不断创作的…

搭建Redis主从集群

主从集群说明 单节点Redis的并发能力是有上限的,要进一步提高Redis的并发能力,就需要搭建主从集群,实现读写分离。 主从结构 这是一个简单的Redis主从集群结构 集群中有一个master节点、两个slave节点(现在叫replica)…

WSL2增加memory问题

我装的是Ubuntu24-04版本,所有的WSL2子系统默认memory为主存的一半(我的电脑是16GB,wsl是8GB),可以通过命令查看: free -h #查看ubuntu的memory和swap (改过的11GB) 前几天由于配置E…

git 合并多次提交 commit

在工作中,有时候在反复修改代码中(比如处理MR的检视意见,或者为了推送到测试环境,先 commit到自己的远程分支上)不免会有多次 commit,这样发起 MR 的时候,就会有一堆 commit 信息,看…

如何分析和解决服务器的僵尸进程问题

### 如何分析和解决服务器的僵尸进程问题 #### **一、僵尸进程的定义与影响** **僵尸进程(Zombie Process)** 是已终止但未被父进程回收资源的进程。其特点: - **状态标识**:在进程列表(如 ps 或 top)中标…

XXL-Job 二次分片是怎么做的?有什么问题?怎么去优化的?

XXL-JOB二次分片机制及优化策略 二次分片实现原理 XXL-JOB的二次分片是在分片广播策略的基础上,由开发者自行实现的更细粒度数据拆分。核心流程如下: 初次分片:调度中心根据执行器实例数量(总分片数n)分配分片索引i&…

java版嘎嘎快充玉阳软件互联互通中电联云快充协议充电桩铁塔协议汽车单车一体充电系统源码uniapp

演示: 微信小程序:嘎嘎快充 http://server.s34.cn:1888/ 系统管理员 admin/123456 运营管理员 yyadmin/Yyadmin2024 运营商 operator/operator2024 系统特色: 多商户、汽车单车一体、互联互通、移动管理端(开发中) 另…

Spatial Multiplexing Power Save

802.11n中添加的PSMP,SMPS机制。 SM 节能功能可让 STA 在大部分时间内仅通过一条活动接收链运行,从而达到节能目的。 空间复用省电(Spatial Multiplexing Power Save)模式下,节点会关闭多余的天线,仅仅使用一根天线进…