ChatGPT 学习笔记 | 什么是 Prompt-tuning?

news2025/1/15 23:32:06

文章目录

  • 一、前言
  • 二、主要内容
  • 三、总结

🍉 CSDN 叶庭云https://yetingyun.blog.csdn.net/


一、前言

Prompt-tuning is an efficient, low-cost way of adapting an AI foundation model to new downstream tasks without retraining the model and updating its weights.

提示调优是一种高效且低成本的方法,它能在无需重新训练模型和更新权重的前提下,将 AI 基础模型适配至新的下游任务。

基础模型旨在引领下一波人工智能企业应用的浪潮(未来的人工智能是灵活、可重复使用的人工智能模型,可以应用于几乎任何领域或行业任务)。

这些大型、可重复使用的模型已经在互联网的广泛知识上进行了预训练,使它们更容易定制,用于分析法律合同或检测金融文件中的欺诈行为。

MJ 生成,Artificial Intelligence; Big Models; Training; Fine Tuning; Cool; Future; Technology; Masterpieces


二、主要内容

在 ChatGPT 火爆出圈之前,微调是重新部署这些预训练模型用于专门任务的最佳方法。您会收集和标记目标任务的示例,然后对模型进行微调,而不是从头开始训练一个全新的模型。但是随着基础模型不断增大,出现了一种更简单、更高效、更节能的技术:Prompt-tuning

在 Prompt-tuning 中,最佳线索或前端提示被提供给您的 AI 模型,以为其提供特定任务的上下文。这些提示可以是由人类引入的额外单词,也可以是引入到模型嵌入层中的 AI 生成的数字。就像填字游戏的提示一样,这两种提示类型都会引导模型朝着所需的决策或预测方向发展。Prompt-tuning 允许一家数据有限的公司将大型模型定制为垂直领域的任务。它还消除了更新模型的数百亿(甚至万亿)个权重或参数的需要。

重新部署 AI 模型而无需重新训练可以将计算成本和能源使用减少至少 1000 倍,从而节省数千美元。IBM 的 David Cox 表示,这种 “Prompt-tuning” 可以快速为特定需求创建一个强大的模型,同时也可以加快速度和进行实验。Prompt-tuning 是一种通过给模型提供提示来生成输出的方法,起源于大型语言模型,但现在已扩展到其他基础模型,如处理其他序列数据类型(包括音频和视频)的 Transformers。Prompt 可以是文本片段、图像、语音流或静态图像或视频中的像素块。

IBM 的 MIT-IBM 实验室专家 Ramewsar Panda 表示:“这是一种从这些大型模型中提取知识的快速和可持续的方法。我们不会触及模型。它是冻结的。”

一个面向专门任务的,无数据的前置提示,是指在特定任务中提供指导和信息的线索,而不依赖于实际数据。最初,通过手工设计的方式,即所谓的提示工程,来设计提示。假设您想要为翻译任务调整一个语言模型。您给模型提供目标任务的描述或几个示例。例如,“将英语翻译成法语”,并使用提示:“cheese”(奶酪)。然后模型输出其预测结果:“fromage”(奶酪)。这个手动提示使模型从其记忆库中检索出其他法语单词。如果任务足够困难,可能需要数十个提示。

Prompt Engineering 是在 OpenAI 发布 GPT(Generative Pretrained Transformer)之后出现的,它是一个比之前任何语言模型都大 10 倍的大模型。在 2020 年的一篇论文中,OpenAI 的研究人员展示了 GPT-3 的规模为 1750 亿个参数,使其能够在推理时只需引入少量的文字即可执行专门的任务。在没有重新训练的情况下,GPT-3 的表现几乎与在标记数据上进行微调的模型一样好

手工制作的提示可能很快会被由一串数字组成的优秀 AI 设计的提示所取代。在随后的一篇论文中,谷歌研究人员介绍了所谓的 “软” 提示,由 AI 设计,胜过了人工设计的 “硬” 提示。大约在同一时间,斯坦福的研究人员引入了前缀调整(Prefix-tuning),这是另一种自动提示设计方法,允许模型逐个学习任务。前缀调整将软提示与注入到深度学习模型层中的提示相结合,以增加灵活性。虽然前缀调整更高效,但这两种技术都可以让您冻结模型并跳过昂贵的重新训练。

与硬提示不同,由 AI 设计的软提示对人眼来说是无法识别的。每个提示都由一个 Embeddings 或数字字符串组成,它从更大的模型中提取知识。高级或任务特定的提示作为额外训练数据的替代品。研究人员最近估计,一个好的语言分类器的 Prompt 相当于数百到数千个额外的数据点。Prompt-tuning 的一个缺点是其缺乏可解释性。人工智能发现了针对特定任务进行优化的提示,但无法解释为什么选择了这些 Embeddings。与深度学习模型本身一样,软提示也是不透明的。Panda 说:“你正在学习提示,但是对于模型如何帮助你,了解得很少。这仍然是一个谜。”

Prompt-tuning 的新兴应用。基础模型正在发现新的企业应用,从药物和材料发现到解读汽车手册等技术文档。与此同时,Prompt-tuning 也在不断发展。多任务学习是指基础模型需要快速切换任务,例如从回答客户问题到识别在线评论中的负面评论。研究人员正在探索创建通用提示的方法,以便可以轻松地复用。Panda 表示:“将多任务迁移学习应用于提示,可以将任务共享的知识整合到单个提示中,以便快速适应模型。”

在 2023 ICLR 上,Panda 和他的同事展示了他们的多任务提示调优(MPT)方法优于其他方法,甚至比针对特定任务进行微调的模型表现更好。Panda 表示,与花费数千美元重新训练一个拥有 20 亿参数的专门任务模型相比,MPT 可以以不到 100 美元的成本为您定制模型。另一个正在兴起的研究领域涉及到 AI 模型在不断学习新任务和概念时即时寻找提示。获取新知识涉及到在新数据上更新模型,但有时旧知识会被覆盖,这被称为灾难性遗忘。CODA-Prompt 是一种技术,可以发现连续的、以前从未见过的任务的提示,比如对绘画、绘画和照片进行分类,而不会使模型忘记最初学到的知识。CODA-Prompt 是一种灵活的提示方式,用于持续学习,可以在出现错误时进行修正,而不会保留数据并违反隐私法规。这种技术的共同开发者、IBM 研究员 Leonid Karlinsky 表示:“在用户数据的聊天会话中可能会观察到错误, CODA-Prompt 可以让您在不保留个人数据的情况下纠正错误。”

最近,IBM 研究人员在 2022 年 NeurIPS 会议上发的论文,旨在利用 AI 设计的提示来对抗大型语言和视觉模型中的种族和性别偏见,从而显示出减轻算法偏见的快速和低成本工具的潜力。一种方法称为 FairIJ,它识别出模型训练集中最具偏见的数据点,并通过附加到模型原始提示的提示将它们排除在外。研究人员发现,在薪资预测任务中经过 FairIJ 调整的模型比几种顶级偏见缓解方法实现了更准确、更少偏见的结果。另一种方法:FairReprogram,通过附加到原始提示上的提示,为在美容杂志上训练的 AI 提供了与性别敏感性培训相当的训练。为了重新定位一个错误地学习将只有金发女性与 “女性” 联系起来的分类器,IBM 的研究人员在一张有棕色头发的女性照片上添加了一个由黑色像素组成的 AI 设计边框。他们发现,这些像素能够欺骗模型,使其扩大对女性的概念,包括那些有棕色头发的女性。

Prompt-tuning 不仅可以减少将大型模型定制到新应用程序的成本,IBM 的 Cox 表示,它还可以纠正模型的行为:在这种情况下,减轻偏见。Prompt-tuning 让你既能拥有蛋糕,又能吃掉它。你可以更快速、更可持续地将你的模型适应于专门的任务,同时更容易地找到和解决问题。


三、总结

Prompt-tuning 是一种高效、低成本的方法,可以将 AI 基础模型快速适配于新的下游任务,而无需重新训练模型和更新权重。通过给 AI 模型提供最佳线索或前端提示,可以将大型模型定制并适配于垂直领域的任务,同时减少计算和能源使用。

Prompt-tuning 还可以用于多任务学习、持续学习和减轻算法偏见等领域的研究


📚️ 参考链接:

  • IBM Research - What is prompt-tuning?
  • Niklas Heidloff - Introduction to Prompt Tuning
  • 沈向洋:致 AI 时代的我们 —— 请不要忽视写作的魅力

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1052574.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

redo日志(下)

title: “redo日志(下)” createTime: 2022-03-06T15:52:4108:00 updateTime: 2022-03-06T15:52:4108:00 draft: false author: “ggball” tags: [“mysql”] categories: [“db”] description: “” redo log的刷盘时机 log buffer 空间不足时&…

No167.精选前端面试题,享受每天的挑战和学习

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云课上架的前后端实战课程《Vue.js 和 Egg.js 开发企业级健康管理项目》、《带你从入…

通用返回结果类ResultVO

1. 定义通用返回结果类 ​ 定义ResultVO类&#xff0c;作返回给前端的对象结构&#xff0c;主要有4个字段 code : 错误码 data : 内容message : 消息description : 具体描述 import lombok.Data; import java.io.Serializable;/*** 通用返回结果类* param <T>*/ Data …

ABAP Web dynpro layout动态可见

ABAP Web dynpro layout动态可见 新增的元素设置不可见 在视图初始化方法中下&#xff0c;获取选中数据&#xff0c;当选中数据不在配置表中&#xff0c;对该视图中容器的子元素显示出来 效果图&#xff1a; 完整代码&#xff1a; DATA lo_nd_nod_pay_info TYPE REF TO if_…

Cocos Creator3.8 实战问题(一)cocos creator prefab 无法显示内容

问题描述&#xff1a; cocos creator prefab 无法显示内容&#xff0c; 或者只显示一部分内容。 creator编辑器中能看见&#xff1a; 预览时&#xff0c;看不见内容&#xff1a; **问题原因&#xff1a;** prefab node 所在的layer&#xff0c;默认是default。 解决方法&…

CentOS上网卡不显示的问题

文章目录 1.问题描述 1.问题描述 ifconfig下看不到ens33网卡了。systemctl status network #查看网卡状态报下面的问题网上说的解决方式有以下三种&#xff1a; 第一种&#xff1a; 和 NetworkManager 服务有冲突&#xff0c;这个好解决&#xff0c;直接关闭 NetworkManger 服…

简单三步 用GPT-4和Gamma自动生成PPT PDF

1. 用GPT-4 生产PPT内容 我想把下面的文章做成PPT&#xff0c;请你给出详细的大纲和内容 用于谋生的知识&#xff0c;学生主要工作是学习&#xff0c;成年人的工作是养家糊口&#xff0c;这是基本的要求&#xff0c;在这之上&#xff0c;才能有更高的追求。 不要短期期望过高…

26940-2011 牡蛎干 思维导图

声明 本文是学习GB-T 26940-2011 牡蛎干. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围 本标准规定了牡蛎干的要求、试验方法、检验规则、标签、包装、贮存和运输要求。 本标准适用于养殖或野生牡蛎(Ostrea spp.)为原料&#xff0c;经取肉、…

9.30国庆作业1

消息队列实现进程之间通信方式代码&#xff0c;现象 接收消息 #include<myhead.h>//消息结构体 typedef struct {long msgtype; //消息类型char data[1024]; //消息正文 }Msg_ds;#define SIZE sizeof(Msg_ds)-sizeof(long) //正文大小int main(int a…

小谈设计模式(7)—装饰模式

小谈设计模式&#xff08;7&#xff09;—装饰模式 专栏介绍专栏地址专栏介绍 装饰模式装饰模式角色Component&#xff08;抽象组件&#xff09;ConcreteComponent&#xff08;具体组件&#xff09;Decorator&#xff08;抽象装饰器&#xff09;ConcreteDecorator&#xff08;具…

数据集划分——train_test_split函数使用说明

当我们拿到数据集时&#xff0c;首先需要对数据集进行划分训练集和测试集&#xff0c;sklearn提供了相应的函数供我们使用 一、讲解 快速随机划分数据集&#xff0c;可自定义比例进行划分训练集和测试集 二、官网API 官网API sklearn.model_selection.train_test_split(*a…

ubuntu安装PhotoPrism,并开启安卓照片同步

之前安装了黑群晖7.2&#xff0c;并开启了Photo&#xff0c;照片同步用的挺好。唯一的缺陷是群晖的照片搜索太弱鸡了&#xff0c;基本上关键字搜索是一点不可用&#xff0c;常见的“花”&#xff0c;“山”&#xff0c;“文件”&#xff0c;“证件”都是不可用的。 后来了解到了…

NLP 02 RNN

一、RNN RNN(Recurrent Neural Network),中文称作循环神经网络它一般以序列数据为输入通过网络内部的结构设计有效捕捉序列之间的关系特征,一般也是以序列形式进行输出。 传统神经网络(包括CNN)&#xff0c;输入和输出都是互相独立的。但有些任务&#xff0c;后续的输出和之前…

《Operating Systems: Three Easy Pieces》 操作系统【一】 虚拟化 CPU

&#xff08;一&#xff09;操作系统介绍 1.虚拟化 CPU 书上代码 &#xff1a; #include <stdio.h> #include <stdlib.h> #include <sys/time.h> #include <assert.h> #include "common.h"int main(int argc, char *argv[]) {if (argc ! …

TensorFlow学习1:使用官方模型进行图片分类

前言 人工智能以后会越来越发达&#xff0c;趁着现在简单学习一下。机器学习框架有很多&#xff0c;这里觉得学习谷歌的 TensorFlow&#xff0c;谷歌的技术还是很有保证的&#xff0c;另外TensorFlow 的中文文档真的很友好。 文档&#xff1a; https://tensorflow.google.cn/…

使用 gst-element-maker 创建一个完全透传的 videofilter 插件

系列文章目录 创建 gstreamer 插件的几种方式 使用 gst-template 创建自己的 gstreamer 插件 使用 gst-plugins-bad 里面的 gst-element-maker 工具创建gstreamer 插件 使用 gst-element-maker 创建一个完全透传的 videofilter 插件 文章目录 系列文章目录前言一、使用gst-ele…

亿图脑图新版本支持思维导图一键生成PPT、音视频等格式,办公提效再升级

近日&#xff0c;国产思维导图软件——亿图脑图MindMaster发布了全新版本V10.9.0&#xff0c;本次亿图脑图的升级给用户带来了极大的惊喜。全新升级的亿图脑图MindMaster不仅支持20格式的文件智能解析成思维导图&#xff0c;还支持思维导图一键生成PPT、音频、视频等内容形式&a…

公认黑客守则

1、不要恶意的破坏任何系统&#xff0c;恶意的破坏他人的软件或服务器将要承担法律责任&#xff0c;如果你只是使用计算机&#xff0c;也是非法的&#xff0c;千万不要破坏别人的文件或数据 2、不要修改别人的任何系统文件&#xff0c;如果你是为了进入而修改它&#xff0c;请在…

计算机视觉与深度学习-Transformer-【北邮鲁鹏】

目录 引入基本组成编码器多头自注意力机制&#xff08;Multi-Head Self-Attention&#xff09;多头自注意力的计算过程头数与维度关系前馈神经网络&#xff08;Feed-Forward Neural Network&#xff09; 编码器中的ADD&NORM加法操作&#xff08;Addition&#xff09;归一化…

三、2023.9.29.C++面向对象.3

文章目录 33、简述一下什么是面向对象&#xff1f;34、简述一下面向对象的三大特征&#xff1f;35、简述一下 C 的重载和重写&#xff0c;以及它们的区别&#xff1f;36、说说 C 的重载和重写是如何实现的&#xff1f;37、说说构造函数有几种&#xff0c;分别什么作用?38、只定…