[论文笔记]P-tuning v2

[论文笔记]P-tuning v2

news2026/2/14 15:56:54

引言

今天带来第五篇大模型微调论文笔记P-tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Across Scales and Tasks。

作者首先指出了prompt tuning的一些不足，比如在中等规模的模型上NLU任务表现不好，还不能处理困难的序列标记任务，缺乏统一应用的能力。

然后作者发现经过适当优化的prompt tuing可以在各种模型规模和自然语言理解任务中都具有普遍有效性。仅需要调整0.1%-3%的参数就可以达到媲美(全量)微调的效果。

作者的P-tuning v2是一种深度提示微调(Deep Prompt Tuning)的优化并适配了NLU。

总体介绍

图1

提示微调(prompt tuning)仅调整连续的提示，但在模型规模不是足够大时，它的表现还是不能媲美全量微调，尤其是少于10B的模型。

本文的主要贡献是经过适当优化的提示微调可以在各种模型规模和自然语言理解任务中与全量微调相媲美。

P-tuning v2可以将它视为专为生成和知识探索而设计的深度提示微调的优化和适配实现。最显著的改进是将连续提示应用于预训练模型的每一层，而不仅仅是输入层。深度提示微调增加了连续提示的容量，并在各种设置下缩小了与微调的差距，特别是对于小型模型和困难任务。

背景知识

提示微调

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1032514.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【学习草稿】背包问题

【学习草稿】背包问题

一、01背包问题图解详细解析 （转载） https://blog.csdn.net/qq_37767455/article/details/99086678 ：Vi表示第 i 个物品的价值，Wi表示第 i 个物品的体积，定义V(i,j)：当前背包容量 j，前 i 个物…

阅读更多...

Vue中的自定义指令详解

Vue中的自定义指令详解

文章目录自定义指令自定义指令-指令的值（给自定义指令传参数） 自定义指令自定义指令：自己定义的指令，可以封装一些dom 操作，扩展额外功能（自动聚焦，自动加载，懒加载等复杂的指令封…

阅读更多...

2006-2022年上市公司彭博ESG数据

2006-2022年上市公司彭博ESG数据

2006-2022年彭博ESG数据 1、时间：2006-2022年 2、指标： Stkcd、Year、BloombergS、BloombergESG、BloombergE、BloombergG 3、指标解释： 彭博企业社会责任披露指数(Bloomberg ESG Disclo-sure Scores)，包括ESG综合得分以及环境、社…

阅读更多...

Mac使用CMakeList编译ImGUi项目

Mac使用CMakeList编译ImGUi项目

文章目录创建项目1.下载ImGui2.下载GLAD3.下载GLFW4.编译项目5.运行截图创建项目我这里创建一个demo，opengl这个是可以跨平台的，所以在mac上使用ImGui的opengl3示例 1.下载ImGui 我使用的是docking版本的，这个版本支持停靠功能&#xff…

阅读更多...

Python学习 day01（注意事项）

Python学习 day01（注意事项）

注释变量数据类型的转换运算符 / 的结果为浮点数。若// 的两边有一个为浮点数，则结果为浮点数，否则为整数。字符串

阅读更多...

JavaScript - canvas - 将图片保存到本地

JavaScript - canvas - 将图片保存到本地

效果示例项目结构： 源码： <!DOCTYPE html> <html><head><meta charset"utf-8"><title>将图片保存到本地</title></head><body><canvas id"canvas"></canvas><b…

阅读更多...

第一百五十一回自定义组件综合实例：游戏摇杆二

第一百五十一回自定义组件综合实例：游戏摇杆二

文章目录内容回顾实现方法位置细节示例代码我们在上一章回中介绍了如何实现游戏摇杆相关的内容，本章回中将继续介绍这方面的知识.闲话休提，让我们一起Talk Flutter吧。内容回顾我们在上一章回中介绍了游戏摇杆的概念以及实现方法，并且通过示例代码演示了实现游戏摇杆的…

阅读更多...

《计算机视觉中的多视图几何》笔记（9）

《计算机视觉中的多视图几何》笔记（9）

现在进入本书的part 2了，标题是Two-View Geometry。第9-14章都隶属于part 2，这一部分涵盖了两个透视图的几何形状知识，这些视图可以像在立体设备中同时获取，或者例如通过相对于场景移动的相机顺序获取。这两种情况在几何上是等价的…

阅读更多...

Java基于SpringBoot的校园博客系统

Java基于SpringBoot的校园博客系统

第一章：简介本系统主要根据博主的需求做出分析，让博主更好的在线查看校园博客系统信息等，管理员后台管理系统数据等功能。从这个系统的操作来说，能够有效的进行信息的添加、修改、查询、删除一些校园博客系统信息，在…

阅读更多...

【深度学习实验】前馈神经网络（七）：批量加载数据（直接加载数据→定义类封装数据）

【深度学习实验】前馈神经网络（七）：批量加载数据（直接加载数据→定义类封装数据）

目录一、实验介绍二、实验环境 1. 配置虚拟环境 2. 库版本介绍三、实验内容 0. 导入必要的工具包 1. 直接加载鸢尾花数据集 a. 加载数据集 b. 数据归一化 c. 洗牌操作 d. 打印数据 2. 定义类封装数据 a. __init__(构造函数：用于初始化数据集对象) b.…

阅读更多...

基础课-排列组合

基础课-排列组合

1.排列 2.组合定义从n个不同元素中，任意取出m(m<n)元素并为一组，叫做从n个不同元素中取出m个元素的一个组合注意:1.不同元素 2.只取不排 3.相同组合:元素相同 3.把位置当成特殊元素这个元素不一定入选的时候，把位置当特殊元素 4.插空…

阅读更多...

【AI视野·今日Sound 声学论文速览第九期】Thu, 21 Sep 2023

【AI视野·今日Sound 声学论文速览第九期】Thu, 21 Sep 2023

AI视野今日CS.Sound 声学论文速览 Thu, 21 Sep 2023 Totally 1 papers 👉上期速览✈更多精彩请移步主页 Interesting: 📚Auto-ACD,大规模文本-音频数据集自动生成方法。基于现有的大模型和api构建了一套大规模高质量的音频文本数据收集方法&#xff0c…

阅读更多...

HTTP参数类型中的Query和Body参数

HTTP参数类型中的Query和Body参数

在接口中常见到query参数和body参数，那么它对应的传参方式是？ ★ query查询参数 ---> params ---> route.params.参数 ★ body请求体参数 ---> data ---> route.query.参数总结： GET请求只能传Query参数， POST请…

阅读更多...

无聊的一篇博客（如何通过路由器登陆页对固定机器进行网速干扰，如何帮熊孩子戒网瘾）

无聊的一篇博客（如何通过路由器登陆页对固定机器进行网速干扰，如何帮熊孩子戒网瘾）

1. 路由器登陆页面，按钮解析，获取按钮。 2. JavaScript与上传的脚本。 // 获取要点击的按钮A和按钮B元素var isRunning true; // 初始状态为false// 定义一个函数来模拟点击按钮A和按钮B function clickButtons() {if (isRunning) {// 随机生成一个延时…

阅读更多...

【AI视野·今日Robot 机器人论文速览第三十五期】Mon, 18 Sep 2023

【AI视野·今日Robot 机器人论文速览第三十五期】Mon, 18 Sep 2023

AI视野今日CS.Robotics 机器人学论文速览 Mon, 18 Sep 2023 Totally 44 papers 👉上期速览✈更多精彩请移步主页 Interesting: 📚GelSplitter, 基于近红外与可见光融合实现高精度surfaceNormal重建的触觉传感器。(from 华中科技大学) 基于分光镜的紧凑型…

阅读更多...

jupyterlab开发环境最佳构建方式

jupyterlab开发环境最佳构建方式

文章目录背景jupyterlab环境构建运行虚拟环境构建以及kernel映射验证总结背景从jupyter notebook切换到了jupyter lab. 这里记录一下本地环境的最佳构建方式. jupyter lab 安装在jupyterlab-local的anaconda 虚拟环境中.建立多个其他虚拟环境安装各种python包实现环境隔离,…

阅读更多...

【01】FISCOBCOS的系统环境安装

【01】FISCOBCOS的系统环境安装

我们选择ubuntu系统 01 https://www.ubuntu.org.cn/global 02 03下载最新版 04等待下载 00提前准备好VM，点击创建新的虚拟机 01选择自定义安装 02一直下一步到 03 04 05其他的默认即可 06 07 08 09 10 11一直默认到下面 12 13等待安装安装后重启即可…

阅读更多...

华为OD机试 - 构成正方形的数量 - 数据结构map（Java 2023 B卷 100分）

华为OD机试 - 构成正方形的数量 - 数据结构map（Java 2023 B卷 100分）

目录专栏导读一、题目描述二、输入描述三、输出描述四、Java算法源码五、效果展示1、输入2、输出3、说明华为OD机试 2023B卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试（JAVA）真题（A卷B卷）》。 …

阅读更多...

【AI视野·今日Robot 机器人论文速览第三十八期】Thu, 21 Sep 2023

【AI视野·今日Robot 机器人论文速览第三十八期】Thu, 21 Sep 2023

AI视野今日CS.Robotics 机器人学论文速览 Thu, 21 Sep 2023 Totally 39 papers 👉上期速览✈更多精彩请移步主页 Daily Robotics Papers Model-free tracking control of complex dynamical trajectories with machine learning Authors Zheng Meng Zhai, Mohammad…

阅读更多...

11:STM32---spl通信

11:STM32---spl通信

目录一:SPL通信 1:简历 2:硬件电路 3:移动数据图 4:SPI时序基本单元 A : 开/ 终条件 B:SPI时序基本单元 A:模式0 B:模式1 C:模式2 D:模式3 C:SPl时序 A:发送指令 B: 指定地址写 C:指定地址读二: W25Q64 1:简历 2: 硬件电路 3:W25Q64框图 4: Flash操作注意…

阅读更多...

推荐文章

最新文章