怎么用【指令工程】调优大模型?

news2024/9/24 19:20:09

如今,大模型有很多,对于大模型的调优方式也有很多,你是否也在纠结?那么该怎么用【指令工程】调优大模型?本文总结了相关内容,一起来看看吧。

img

你是否曾在大模型的调优选择感到非常纠结,不知如何做选择?

不必担心,在研究数个月后,我为你从众多方法中精选出四种主流且有效的调优方式:提示词工程、模型微调、强化学习人工干预、预训练(顺序由易到难)。

通过本文,你将搞定每种方法在实际应用中的具体效果与适用场景,以及详细的训练步骤,从此在大模型调优的道路上驾轻就熟。(喜欢的话可以关注和收藏,计划连载5篇大模型实操干货)

话不多说,我们先从指令工程(prompt engEngineering)调优开始。

01 指令工程的定义与效果

提示词工程是指在使用大型预训练语言模型(如GPT-4或BERT)时,精心设计输入的提示词(或称为引导语),可以显著改变模型的输出。

这意味着,通过仔细设计问题的提法,我们可以引导模型向我们预期的方向发展,从而产出能解决你领域问题的回答。

02 指令工程适用和不适用的场景

适用的场景

这种方法特别适合于模型快速部署的场合,它可以在不进行复杂的算法修改或耗时的模型重训练的情形下,快速适应新任务。适合场景包括但不限于:

  • 聊天机器人的快速应对策略。
  • 知识查询系统中问题的智能转化。
  • 为创意写作提供灵感启迪。

不适用的场景:

但当遇到以下情况时,仅靠提示词工程可能效果不佳:

  • 任务对模型理解的深度要求高,如复杂的文本推理或长篇文章的生成。
  • 模型的基础训练数据与当前任务差异极大,共享知识非常少时。
  • 当模型需要处理高度技术性或专业性强的内容时。

03 指令工程调试(模型调优)

五步调优法:

确定目标任务:首先清晰定义模型需要完成的具体任务,比如生成新闻摘要。

设计试验性提示词:根据目标任务,设想几种不同的提示词,比如“如何用五句话概括这篇文章的要点?”

img什么样的人,适合做B端产品经理?要想成为优秀的B端产品经理,懂业务和懂产品是两个很重要的标准。B端赛道非常细分,产品迭代和推广的速度也很慢,这就产生了大量工作机会…查看详情 >

进行实验调试:

  1. 输入设计好的提示词。
  2. 观察模型的输出结果。(类似我输入我的提示词,来验证输出的文案)
  3. 记录下输出的相关指标,如准确性、速度和相关性。

分析并优化:根据模型输出的质量,调整提示词的用法或内容,迭代以优化结果。

固化最佳实践:一旦找到效果最好的提示词结构,将其作为常规应用的标准操作。

高质量 prompt 核心要点:具体、丰富、少歧义。

04 指令工程的示例:文章优化助手

假设我想让模型按照我的要求输出具有固定结构化的文章,有三个因素:

  1. 基于我提供的原始标题,让其再输出吸引人的标题
  2. 基于我提供文章方向,如人工智能丰富三个文章子标题
  3. 基于我选择的标题和文章方向来写四部分内容:开头,子标题引申的内容(不少于1000个字),结尾总结,以及我固定的结束语

优化后的prompt(可自用)

# 角色

你是一个能创作爆款文章的作家。

## 技能

### 技能 1:创作吸引人的标题

– 基于用户给出的标题和文章方向,创作出三个吸引人、简单、让人有冲动想看的爆款文章标题。

### 技能 2:写文章

– 基于用户给出题目和文章方向,文章结构的基础上进行写作,且可以需要自由发挥3个新的文章结构。并且需要标记你新增加的3个结构,最后让用户来选择结构,选择后就可以对结构来创作了。

### 技能 3:按部就班地写文章

– 整个文章内容需要分为四个部分:

第一部分:文章的开头,不超过200字,必须吸引人

第二部分:根据用户选择的文章结构来扩展内容,每个部分的内容至不少于1000字符,需要立体且丰富,生动形象吸引眼球。

第三部分:文章的结尾,需要用一句话总结全文,不超过200个字,并引用名人名言或论文的金句来结尾

第四部分:结束语,只能输出”希望带给你一些启发,加油。”

## 要求

– 整个文章至少包含2000个字

– 爆款标题不超过20个字,最好处于10个字左右

– 新增加的文章结构(子标题)长度不超过10个字,内容立体且丰富,吸引人

– 总结部分不超过200个字

– 结束语,只能输出”希望带给你一些启发,加油。”

– 只能回答与文章输出相关的问题。如果收到与文章输出无关的问题,需要回复“我是一名写爆款文章的智能助手,如果你需要其他帮助,可以寻找其他智能体。”

– 一步一步的输出文章,先确认标题,后确认框架,最后基于用户给的标题来依次输出四部分内容。

## 示例

标题:AI算法,支持向量机用起来就是这么简单

文章方向:人工智能算法

文章结构:

\1. 支持向量机在人工智能算法的地位和作用

\2. 支持向量机的算法原理

\3. 支持向量机的算法案例

\4. 支持向量机算法的应用步骤

\5. 支持向量机算法的适用边界和优缺点

输出:

第一部分:

人工智能的世界,神秘且魔力无穷….

第二部分:

子标题1:人工智能的权杖:支持向量机

“支持向量机在人工智能算法中起到的关键作用”

子标题2:支持向量机:让算法变得简单

“揭开支持向量机的神秘面纱”

第三部分:

总结,“掌握支持向量机,就是掌握了AI的一把钥匙”

物理学家费曼曾经说过,“我认为我理解了一个事物的标准是我能够把它解释清楚。”

第四部分:

希望带给你一些启发,加油。

最后的话

总得来说,指令工程调优大模型的优势在于其简便性和既定模型的直接应用,无需复杂的技术调整或重训练;而其劣势在于可能缺乏必要的针对性和深度理解,对于需要细致控制的复杂任务可能效果有限。

一个优质的prompt,需要你不断的调试,来摸索一个合适的度,因为它是大模型“幻觉”的纠偏器,引领者。

希望带给你一些启发,加油。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1920772.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python实战Elasticsearch的核心技巧详解

概要 Elasticsearch 是一个分布式的搜索引擎,可以用于全文搜索、结构化搜索、分析等多种场景。它基于Lucene构建,提供了强大的搜索功能和数据分析能力。本文将详细介绍如何使用Python实现与Elasticsearch的交互,包括安装、配置、基本操作和实际应用示例。 安装和配置 安装…

【MybatisPlus】QueryWapper和LambdaQueryWrapper的区别

【MybatisPlus】QueryWapper和LambdaQueryWrapper的区别 (一)MyBatisPlus的条件查询构造器QueryWrapperLambdaQueryWrapper优缺点使用场景 (二)Lambda的概念(三)QueryWrapper如何进化成LambdaQueryWrapper的…

【排序算法】计数排序

目录 一.基本思想 二.缺陷及优化 三.代码实现 四.特性总结 1.可以排序负数 2.适合范围集中的整数 3.时间复杂度:O(Nrange) 4.空间复杂度:O(range) 5.稳定性:稳定 一.基本思想 根据待排序数组a创建一个新的数组count,该数组…

这个软件可无限制免费领取金币,领取后即可自由实现AI文生图,AI Chat及其AI文生PPT等AI功能

目前AI文生图工具浩如烟海,不过基本上都是限制使用,每天只能使用几次到十几次,如果还想继续使用,那么只能花钱购买,这对于绝大多数人来说确实是一个痛点,那么有没有一款软件可以实现使用自由呢?…

【在线词典】项目实现

15_Dictionary 在线词典 搭建客户端-服务器架构 准备必要的资源 整理原始数据 整理英汉双语对照表,将XLSX格式转换成CSV格式,准备好vocabulary_list.csv文件备用 注意:CSV格式的文件必须使用UTF-8的字符集; 建立mydatabase.…

第17周:天气预测

目录 前言 一、前期准备 1.1 导入库 1.2 导入数据 1.2.1 数据介绍 1.2.2 数据导入 二、探索式数据分析(EDA) 2.1 数据相关性探索 2.2 是否会下雨 2.3 地理位置与下雨的关系 2.4 湿度和压力对下雨的影响 2.5 气温对下雨的影响 三、数据预处理…

Windows 零散记录

文章目录 一、鼠标焦点丢失 一、鼠标焦点丢失 如:打字时没打完鼠标焦点中途就消失了 解决: 1、windowsR 组合键打开运行,输入regedit打开注册表 2、找到目录 HKEY_CURRENT_USER\Control Panel\Desktop\ForegroundLockTimeout 设置锁定超时时…

starRocks搭建

公司要使用新的大数据架构,打算用国产代替国外的大数据平台。所以这里我就纠结用doris还是starrocks,如果用doris,因为是开源的,以后就可以直接用云厂商的。如果用starrocks就得自己搭建,但是以后肯定会商业化&#xf…

ARM功耗管理之多核处理器启动

安全之安全(security)博客目录导读 思考:SecureBoot?多核处理器启动流程?PSCI启动方式? 一般嵌入式系统使用的都是对称多处理器(Symmetric Multi-Processor, SMP)系统,包含了多个cpu, 这几个cp…

脑电图 (EEG) :语音脑机接口(BCI)的理想选择

运动性语言障碍是一种严重的医疗状况,它让患者几乎或完全失去说话能力。这种状况在帕金森病患者中的发生率为90%,在中风患者中的发生率为45.2%,在肌萎缩侧索硬化症(ALS)患者中的发生率为95%。典型的针对语言障碍的沟通…

轮转数组(超详细!)

前言: 小编在上一篇文章的时候拿过轮转数组作为例子来讲述复杂度,但是小编并没有给出这个题目的正确解答,既然读者朋友已经了解复杂度了(不了解也没关系,可以看小编上一篇文章),下面&#xff0c…

木舟0基础学习Java的第十六天(异常,分类,自定义异常,注意事项)

异常 异常概述:异常是Java程序运行过程中出现的错误 异常分类:API查找Throwable 1.Error(服务器宕机,数据库崩溃等) 2.Exception C(异常的继承体系)API查RuntimeException 运行时异常:一般是程序员的错误异常可以让我们发现错…

LiveNVR监控流媒体Onvif/RTSP用户手册-用户管理:编辑、添加用户、关联通道、重置密码、删除、过滤搜索

LiveNVR监控流媒体Onvif/RTSP用户手册-用户管理:编辑、添加用户、关联通道、重置密码、删除、过滤搜索 1、用户管理1.1、添加用户1.2、关联通道1.3、重置密码1.4、编辑1.5、删除1.6、过滤搜索 2、RTSP/HLS/FLV/RTMP拉流Onvif流媒体服务 1、用户管理 1.1、添加用户 点击用户管理…

【源码开源】C#桌面应用开发:串口调试助手

c#桌面应用开发 1、环境搭建和工程创建:参照番茄定时器项目 工程创建参照 2、界面布局设计 3、具体功能函数 (1)端口扫描: private void btn_com_scan_Click(object sender, EventArgs e){//端口号扫描ReflashPortToComboBox(…

【JavaWeb程序设计】JavaBean(二)

目录 一、请设计并实现下面的Web应用 1. 运行结果 2. inputNumber.jsp代码 3. ComputerBean.java代码 4. handleCompute 5. lookResult.jsp 二、基于MVC模式完成用户注册功能,不允许添加重名用户,使用AJAX技术在用户填写时进行检查并提示是否重复&…

【产品经理】WMS多仓调拨转移说明

对于仓储管理来说,越来越多企业开始应用WMS进行系统化的管理,以提升仓库的作业效率。本文作者从业务流程和基础功能两个方面展开介绍,希望对你有帮助。 一、业务流程 。在线下业务流程拓展,仓库不断增多的过程中,由于…

[leetcode]circular-array-loop 环形数组是否存在循环

. - 力扣&#xff08;LeetCode&#xff09; class Solution { public:bool circularArrayLoop(vector<int>& nums) {int n nums.size();auto next [&](int cur) {return ((cur nums[cur]) % n n) % n; // 保证返回值在 [0,n) 中};for (int i 0; i < n; i…

Apache AGE 运算符

运算符 字符串特定比较运算符 测试数据 SELECT * FROM cypher(graph_name, $$ CREATE (:Person {name: John}),(:Person {name: Jeff}),(:Person {name: Joan}),(:Person {name: Bill}) $$) AS (result agtype);Starts With 对字符串执行区分大小写的前缀搜索。 SELECT * …

Vue2-集成Element-ui、Fontawesome、Axios介绍与使用

文章目录 前期准备Element UI介绍Element-ui安装使用Fontawesome介绍Fontawesome安装使用Axios介绍Axios安装使用本篇小结 更多相关内容可查看 前期准备 脚手架生成vue2项目&#xff1a;NodeJS安装并生成Vue脚手架(保姆级) Element UI介绍 Element UI 是一个基于 Vue.js 2.0…

【Node.js安装教程】

Node.js安装教程 第一步&#xff1a;下载 下载链接&#xff1a;https://nodejs.org/zh-cn 第二步&#xff1a;安装 **方法一&#xff1a;**建议安装在默认路径 方法二&#xff1a;如果不是默认安装路径可能会出现一系列问题&#xff1a;这时可以选择卸载重装或者配置环境变量…