GOOGLE|只有大模型才能理解你举的例子(In-context learning)是什么

news2024/11/23 19:20:28

一、概述

title:LARGER LANGUAGE MODELS DO IN-CONTEXT LEARNING DIFFERENTLY

论文地址:https://arxiv.org/abs/2303.03846

参考:https://www.xiaohongshu.com/user/profile/5f01057f0000000001003c91/640aa237000000001303d871

1.1 Motivation

  1. 背景知识:in-context learning,不需要训练模型,而只是给几个样例(任务的题目和相应答案答案)。
  2. 研究in-context learning (ICL)如何受到先验语义信息和输入标签映射的影响的,以及通过比较一系列不同大小的模型,发现in-context learning只在大模型里面有用。

1.2 Methods

  1. 利用两个实验来验证(ICL with flipped labels + ICL with semantically- unrelated label)
  2. ICL with flipped labels(input–label mappings that contradict prior knowledge,输入与模型先验知识矛盾):利用翻转的label信息作为输入,评估大小模型的输出受输入信息的影响程度(模型会有先验知识,看是否正的能理解当前输入的信息,覆盖原始先验知识)。
  3. ICL with semantically-unrelated label:将模型的label设置成与语义不相关的,例如将boo/bar之类的答案变成negative/positive,迫使模型学习输入和label的映射关系,来验证是否真正的学到了语义中的信息。

1.3 Conclusion

  1. flipped labels实验结论【大模型可以通过in-context learning覆盖原始模型中的先验知识,小模型不能】:虽然小型语言模型忽略上下文中呈现的翻转标签,并因此主要依赖于来自预训练的语义先验,但是当呈现与先验相矛盾的上下文中样本时,大型模型可以覆盖语义先验,尽管大型模型可能拥有更强的语义先验。
  2. ICL with semantically-unrelated label【大语言模型能学习输入和label的映射关系,小的也不行】:大语言生孩子能学习线性分类任务。
  3. ICL 加强了语义先验(模型内部)的使用和学习输入-标签映射的能力,但更多的是前者。
  4. 大模型还能做高纬度的线性分类任务,小模型不行。

二、详细内容

2.1 如何设置实验来验证模型是否理解上下文中的真正含义?

Regular ICL:正常的ICL,给几个Negtive, Positive的例子,要你输出新的样本的结果。

Flipped-label ICL:将示例的label翻转过来,看对于新的例子,能否输出翻转的label。

SUL-ICL:将label设置成和语义不相关,看对于新的例子,能否按照上下文给出的例子推出新的映射关系。

2.2 尝试的模型

尝试了不同大小的模型,PaLM个模型只有大小不同,数据什么都一样。

2.3 使用不相关label映射时,小模型精度影响更大

当用不相关的label映射时,小模型精度下降的比较多,说明小模型受先验语义信息的依赖要更多一些,大模型更能学习上下文中的信息

2.4 大模型才具有相关涌现能力

大模型在上下文中学习样例的能力更强

有些任务能力只在大模型中才能看到

2.5 与仅做pretraining的语言模型相比,指令调整的语言模型更擅长学习输入-标签映射

同样大小,instruction-tuned模型遵循指令的能力更强。

2.6 翻转label实验的时候,instruction-tuned的模型比pretrain的模型表现更差,说明其更依赖模型的先验知识

  • 指令调优要么增加了模型在可用时依赖语义先验的程度,要么为模型提供更多的语义先验,因为指令调谐模型在翻转label是表现更差
  • 我们得出结论,尽管指令调整提高了学习输入标签映射的能力,但它同时加强了语义先验的使用,类似于Min等人(2022a)中的发现。

2.7 大模型甚至能做线性分类

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/526589.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java高阶数据结构 图补充-拓扑排序

拓扑排序 文章目录 Java高阶数据结构 & 图补充-拓扑排序1. 什么是拓扑排序2. 拓扑排序算法思想-卡恩算法3. 拓扑排序代码实现3.1 遍历链表计算入度3.2 挑选一个入度为0的顶点3.3 输出顶点3.4 判断循环结束是否为全-13.4 *kahn*方法3.5 测试 Java高阶数据结构 & 图补充…

python内置函数,推导式

abs:取绝对值 data abs(-10) pow:次方 data pow(2,5) sum:求和 num_list p[1,2,10,20] res sum(num_list) divmod取商和余数: v1,v2 divmod&…

第七届福州大学信息安全竞赛——shellcode1 绕过strlen检查,绕过沙箱检查,执行orw shellcode拿到flag

题目自取: 链接:https://pan.baidu.com/s/1HrMqh-lX-mkfueVeLzoEJg 提取码:oyel 介绍下这可恶的沙箱机制 这是一道非常让人蛋疼的题目,之前我只听说过沙箱,但是并没有自己实际接触过沙箱这个保护机制,大…

基于PKI的物联网安全服务体系建设

文章目录 1. PKI 概况1.1 PKI 简介1.2 CA 介绍1.2.1 CA证书包含主要内容1.2.1 CA 的工作原理1.2.2 主流的CA机构 1.4 PKI 应用场景 2. PKI 在物联网领域中的应用2.1 物联网PKI架构包含组件2.2 物联网PKI证书链 3. 创建自签CA证书3.1 自签名根证书创建3.2 创建云平台证书3.3 创建…

甘肃非煤矿山电子封条 智慧矿山 opencv

甘肃非煤矿山电子封条 智慧煤矿接入国家矿山安全平台是通过pythonopencv网络模型,甘肃非煤矿山电子封条pythonopencv网络模型对关键位置(回风井口、运人井口、车辆出入口)对现场人员行为、数量、穿戴着装及设备状态各数据进行实时监控分析。p…

【连续介质力学】特征值和特征向量问题

特征值和特征向量问题 二阶张量和一个向量(单位向量 n ^ ′ \hat n n^′)的点积会得到一个向量,也就是说,将一个二阶张量投影到某个方向所得到的向量的方向实际上与 n ^ ′ \hat n n^′ 的方向不一样: 特征值和特征向…

IDEA添加.gitignore忽略不需要提交的文件

问题 git上传的时候,我们已经将 xxx 文件添加到了.gitignore 中,但是在push 后,远程仓库还是会显示此文件,比如我们在.gitignore文件当中添加了不需要提交的target目录,但是提交的时候,还是会被提交。 原因…

2023.5.14总结

这周平时在刷蓝桥杯的题目,周天打了一场2021年陕西省的省赛的重现赛。 重现赛我们没打满,打了三个小时,A了四个,不过应该也差不多了。 登录—专业IT笔试面试备考平台_牛客网 以前没学过数论分块,今天学了学。对于一些向…

Hadoop上传及下载数据流程

网络拓扑及机架感知 网络拓扑 节点距离:两个节点到达共同父节点的距离和 机架感知 ( 副本节点的选择 ) 例如:500个节点,上传数据my.tar.gz,副本数为3, 根据机架感知,副本数据…

防止攻击者对您使用合法工具

恶意行为者越来越多地利用合法工具来实现其目标,其中包括禁用安全措施、横向移动和传输文件。使用常用工具可以让攻击者逃避检测。 虽然端点产品可以将定制工具或恶意软件标记为恶意软件,但商业上可用的工具通常被组织标记为干净或列入允许列表。 这让…

MacBook Pro合上盖子不休眠的问题简单分析

15年款的MacBook Pro每次不用的时候都是直接合上盖子(开着一堆程序)系统会自动休眠,但是升级了新系统Sierra之后就发现合上盖子竟然没有休眠(第二次打开盖子后发现掉了50%多的电,而且温度比较高)&#xff0…

软考A计划-真题-分类精讲汇总-第十一章(多媒体基础)

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例 👉关于作者 专注于Android/Unity和各种游戏开发技巧,以及各种资源分享&am…

MySQL只有information_schema一个数据库

背景:centos新安装的mysql数据库。使用DbEaver连接mysql库时,发现左边不显示表。使用命令框mysql -uroot回车登录时,发现只能看到information_schema一个数据库了。 原因:   因为mysql数据库的user表里,存在用户名为…

Julia入门-1、使用C++调用Julia脚本语言

文章目录 0、开发环境1、测试Julia环境2、调用Julia脚本语言准备3、使用C++调用Julia脚本语言(1)使用C++调用简单的Julia脚本语言(2)使用C++调用复杂的Julia脚本语言0、开发环境 操作系统: ①Windows 10 开发编译器: ①VS 2015 Professional ②VS Code + julia-vscode插件(…

《计算机网络—自顶向下方法》 第六章Wireshark实验:IP 协议分析

IP 协议(Internet Protocol),又译为网际协议或互联网协议,是用在 TCP/IP 协议簇中的网络层协议。主要功能是无连接数据报传送、数据报路由选择和差错控制。IP 协议是 TCP/IP 协议族的核心协议,其主要包含两个方面&…

Spring Boot 配置文件总结

前言 Spring Boot 中提供一个全局的配置文件:application.properties,这个配置文件的作用就是,允许我们通过这个配置文件去修改 Spring Boot 自动配置的默认值。 Spring Boot 支持两种格式的配置文件:application.properties 和…

C/C++每日一练(20230515) 区间和的个数、BST最近公共祖先、最接近元素

目录 1. 区间和的个数 🌟🌟🌟 2. 二叉搜索树的最近公共祖先 🌟 3. 找最接近元素 🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏…

前端路由、vue-router常见用法、路由重定向、动态路由匹配、声明式导航 编程式导航 、导航守卫

前端路由、vue-router常见用法、路由重定向、动态路由匹配、声明式导航 & 编程式导航 、导航守卫 前端路由的概念与原理前端路由 vue-router 的基本使用vue-router 的常见用法路由重定向动态路由匹配声明式导航 & 编程式导航导航守卫 后台管理案例 前端路由的概念与原理…

mysqld之mha高可用

1.MHA的相关知识 1.1 什么是 MHA MHA(MasterHigh Availability)是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。 MHA 的出现就是解决MySQL 单点故障的问题。 MySQL故障切换过程中,MHA能做到0-30秒内自动完成故障切换操作。 MHA能在…

C语言设计三子棋

引入 谈到三子棋,大家应该都不陌生,学生时代我们大多人都爱拿作文本有事没事就跟同桌下两把,只要任意一方三点连成一线,就可以胜利。今天我作为一个计算机方面的博主,将会用C语言实现这个简单的小游戏(人机…