Rethinking the Role of Demonstrations: What Makes In-Context LearningWork?

news2026/2/12 11:41:04

背景

这篇论文主要验证了prompt demos对模型的作用是什么，主要几个方面的影响：
1.prompt demo的input和label的映射关系对结果影响非常小，模型没有从mapping关系中学到太多信息。这是比较反直觉的
2.模型从input输入的数据空间和label输出的数据空间中，学习到了大量的信息，对模型预测结果的效果提升起到了关键作用
3.prompt demo序列的总体结构信息，对模型结果影响较大。
4.meta learning会放大prompt demo的作用，模型会学习demo中更加简单的方面。
在这里插入图片描述

消融实验

1.demos的正确率是否对结果有影响。

demos的正确率对模型效果影响不大。
在这里插入图片描述

2.demos的数量k是否影响模型效果

1.随着k的增长，模型效果也在增加
2.模型在k>8之后，效果随着k的增长，效果不明显，说明8个左右的demo，已经提供了足够的信息。
在这里插入图片描述

3.demo的质量是否影响模型效果

1.可以看到影响不大

在这里插入图片描述

为什么in-context learning起作用？

1.prompt demo的input和label的映射关系对结果影响非常小，模型没有从mapping关系中学到太多信息。这是比较反直觉的
2.模型从input输入的数据空间和label输出的数据空间中，学习到了大量的信息，对模型预测结果的效果提升起到了关键作用
3.prompt demo序列的总体结构信息，对模型结果影响较大。
4.meta learning会放大prompt demo的作用，模型会学习demo中更加简单的方面。

在这里插入图片描述

继续讨论

在这里插入图片描述

6.1模型是否从demo中学习到了知识。

1.如果严格的定义学习从input-label关系中的话，其实是没有学习到的。
2.如果从模型去适应demo的input-label数据空间和demo的格式的话，其实是学习到了相应的知识。
在这里插入图片描述

6.2模型的能力

1.模型其实已经从他自身的目标中学习到了input-label的映射关系。

6.3 zero-shot的效果提升

1.可能可以通过非监督学习提升效果。

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/956404.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

VR全景与家居行业碰撞在一起，会迸发怎样的火花？

VR全景与家居行业碰撞在一起，会迸发怎样的火花？

元宇宙的热度一直在持续，由于前几年疫情反复，很多人只能居家办公，这也让很多线下实体行业非常难做，元宇宙的兴起可以带动线下行业把生意做起来，那么家居行业、元宇宙、VR全景这些元素碰撞在一起，会迸发出怎…

阅读更多...

从Instagram到TikTok：利用社交媒体平台实现业务成功

从Instagram到TikTok：利用社交媒体平台实现业务成功

自 2000年代初成立和随后兴起以来，社交媒体一直被大大小小的品牌用作高度针对性的营销工具，自 Facebook推出近二十年以来，这些网站继续彻底改变企业处理广告的方式。在这篇博文中，我们将讨论订阅企业应该如何从整体上对待社交媒…

阅读更多...

秋云qiun chart 使用echart配置格式化柱形图数据

秋云qiun chart 使用echart配置格式化柱形图数据

dataLabel数据文字格式化  <!-- formatter…

阅读更多...

Java 面试 - Redis

Java 面试 - Redis

Redis Redis 是基于键值对的非关系型数据库。Redis 拥有string、hash、list、set、zset等多种数据结构, redis具有惊人的读写性能, 其优秀的持久化机制是的它在断电和机械故障时也不会发生数据丢失, 可以用于热点数据存放, 还提供了键过期、发布订阅、食物、流水线、LUA脚本等多…

阅读更多...

在node项目中通过jsencrypt实现内容加密

在node项目中通过jsencrypt实现内容加密

上来肯定先引入第三方依赖 npm install jsencrypt然后我们创建一个js文件叫 rsaEncrypt.js 参考代码如下 import JSEncrypt from jsencrypt/bin/jsencrypt.min// 密钥对生成 http://web.chacuo.net/netrsakeypairconst publicKey MFwwDQYJKoZIhvcNAQEBBQADSwAwSAJBANL378k…

阅读更多...

echarts的click事件

echarts的click事件

目录前言一、click事件前言在使用echarts的过程中，最常用的则是不同系列所对应的click返回参数的不同一、click事件在以下图中，其实是两个不同系列的数据，一个是图中的钟表，一个是下面的图 const option {grid: {left: …

阅读更多...

Visual Studio软件_MSC_VER值（MSVC编译器版本）的获取方法

Visual Studio软件_MSC_VER值（MSVC编译器版本）的获取方法

本文介绍查看Visual Studio软件_MSC_VER值的方法。 _MSC_VER是微软公司推出的C/C 编译器——MSVC编译器的一个内置宏，其值表示当前Visual Studio软件中MSVC编译器的具体版本。不同的Visual Studio软件版本对应着不同的MSVC编译器版本——无论是不同发布年份的版本&…

阅读更多...

RT-Thread程序内存分布

RT-Thread程序内存分布

一般MCU包含的存储空间有：片内Flash与片内RAM，RAM相当于内存，Flash相当于硬盘。编译器会将一个程序分类分为好几个部分，分别存储在MCU不同的存储区。 Keil工程在编译完之后，会有相应的程序占用的空间提示信息。 lin…

阅读更多...

螺旋矩阵、旋转矩阵、矩阵Z字打印

螺旋矩阵、旋转矩阵、矩阵Z字打印

螺旋矩阵 #include <iostream> #include <vector> void display(std::vector<std::vector<int>>&nums){for(int i 0; i < nums.size(); i){for(int j 0; j < nums[0].size(); j){std::cout<<nums[i][j]<< ;}std::cout<<…

阅读更多...

【SpringSecurity】八、集成图片验证码

【SpringSecurity】八、集成图片验证码

文章目录 1、生成图片验证码2、创建验证码过滤器3、将过滤器加入SpringSecurity过滤链4、修改登录页 SpringSecurity是通过过滤器链来完成的，接下来的验证码，可以尝试创建一个过滤器放到Security的过滤器链中，在自定义的过滤器中比较验证码。…

阅读更多...

Linux系统下Web文件系统搭建

Linux系统下Web文件系统搭建

背景为了方便和协作者共享文件和方便文件统一管理及下载，比如分享API文档，因此搭建一个简易的基于Apache服务的Web文件系统，使用浏览器进行文件访问及下载。部署Apache服务器本文的linux开发环境是Ubuntu 18.04 安装 sudo apt instal…

阅读更多...

Collections和CollectionUtils集合操作

Collections和CollectionUtils集合操作

0.引入依赖 <dependency><groupId>org.apache.commons</groupId><artifactId>commons-collections4</artifactId><version>4.4</version> </dependency> 一.Collections用法： 01、排序操作 reverse(List list)…

阅读更多...

C++面试题（丝）-计算机网络部分（1）

C++面试题（丝）-计算机网络部分（1）

目录 1计算机网络 53 简述epoll和select的区别，epoll为什么高效？ 54 说说多路IO复用技术有哪些，区别是什么？ 55 简述socket中select，epoll的使用场景和区别，epoll水平触发与边缘触发的区别？…

阅读更多...

学术加油站｜基于端到端性能的学习型基数估计器综合测评

学术加油站｜基于端到端性能的学习型基数估计器综合测评

编者按本文系东北大学李俊虎所著，也是「 OceanBase 学术加油站」系列第 11 篇内容。「李俊虎：东北大学计算机科学与工程学院在读硕士生，课题方向为数据库查询优化，致力于应用 AI 技术改进传统基数估计器，令数据库选…

阅读更多...

第五章树与二叉树五、哈夫曼树（定义与构造方法），哈夫曼编码

第五章树与二叉树五、哈夫曼树（定义与构造方法），哈夫曼编码

一、带权路径长度 1.结点的权:有某种现实含义的数值（如:表示结点的重要性等） 2.结点的带权路径长度:从树的根到该结点的路径长度(经过的边数）与该结点上权值的乘积。 3.树的带权路径长度:树中所有叶结点的带权路径长度之和。（W…

阅读更多...

740914L、740928LD、740912D插头式比例控制线圈放大器

740914L、740928LD、740912D插头式比例控制线圈放大器

740912、740912D、740912L、740912LD 740914、740914D、740914L、740914LD 740924、740924D、740924L、740924LD 740928、740928D、740928L、740928LD 770212、770214、770214N、770223 一般情况下选用的线圈，在工作的工程中，一般是不可能发生问题的…

阅读更多...

关于PMP！被问到发疯的10个问题！！

关于PMP！被问到发疯的10个问题！！

最近很多人都在问我PMP证书相关的几个问题，我大致整理出来，统一回答。 1）这是个什么证书？2）到底有什么用？3）考下来需要多少钱？4）能不能不报班自己学？5&#…

阅读更多...

【HarmonyOS】一文教你如何使用低代码平台网格布局动态加载数据

【HarmonyOS】一文教你如何使用低代码平台网格布局动态加载数据

【关键字】低代码平台、AGC、API6、网格布局、数据模型【写在前面】正式开工之前，先来说一下今天要实现的内容，今天会实现一个网格布局的展示，我会创建一个数据模型，然后网格列表的数据从数据模型中获取，从而实现…

阅读更多...

固定资产管理措施怎么写

固定资产管理措施怎么写

固定资产管理措施是指企业在进行固定资产管理时所采取的各种措施和方法。以下是一些常见的固定资产管理措施：　　建立完善的固定资产管理制度。制定明确的资产采购、使用、维护、报废等流程和标准，确保资产管理的规范性和透明度。　　采用先进的资产管理…

阅读更多...

在 .NET 8 Preview 7 中推出 .NET MAUI：键盘加速键

在 .NET 8 Preview 7 中推出 .NET MAUI：键盘加速键

作者：David Ortinau 排版：Alan Wang .NET MAUI 现已在 .NET 8 Preview 7 中推出，它引入了键盘加速键以及更多的修复和改进。这是我们发布 .NET 8 候选版本和正式发布（GA）版本之前的最后一个预览版本。随着发布日期的公…

阅读更多...

推荐文章

最新文章