【In-Context Learning】Meta-learning via Language Model In-context Tuning

news2025/1/22 21:57:43

In-Context Learning是最近比较火热的方向,其主要针对超大规模模型(例如1750B参数量的GPT-3模型),在只提供少量标注样本作为提示的前提下,即可以实现很惊艳的效果。本文将元学习引入到In-Context Learning中。
论文PDF:https://doi.org/10.18653/v1/2022.acl-long.53

一、动机

本文提出in-context tuning(ICT)用于few-shot learning

  • 目前,向语言模型通过prompting可以在小样本场景下得到很大的成功。例如GPT-3

For example, to coax the model into performing sentiment classification on the target input “This movie is a waste of time”, we prompt the LM with the sequence “I like the movie! Positive review? Yes. Horrible Movie! Positive review? No. This movie is a waste of time. Positive review? ___”, and predict “positive” if the next word is more likely to be “Yes” rather than “No”.

  • 然而原始的语言模型在预训练时并没有针对in-context进行优化

raw LMs are not optimized for in-context FSL during pre-training, and exhibit undesirable behavior when used for FSL

  • 先前工作发现prompting会过度受到(oversensitive)样本选取以及instruction本身影响

Previous work has also shown that prompting raw LMs is often oversensitive to example choices and instruction wording

二、方法

在训练(fine-tuning)阶段,给定一系列的训练task,每一个task都有相应的instruction,以及该task对应的少量样本(输入/输出对)。在测试阶段,给定一个新的unseen task,以及该task对应的instruction和少量样本(输入/输出对),旨在让模型能够对测试样本预测其类别。如下图,给定一个情感分析task:
在这里插入图片描述

在训练时,直接对instruction I T I_T IT、若干少量标注数据 S T S_T ST 以及target样本 x t a r g e t T x_{target}^T xtargetT 进行拼接,并基于in-context learning训练目标进行优化,预测对应类别 y t a r g e t T y_{target}^T ytargetT

在这里插入图片描述

三、实验

(1)baseline模型
Raw In-context Learning

与in-context tuning一样,给定unseen task的instruction、少量标注样本(输入/输出对)和样本输入,直接预测样本的输出。此时没有fine-tuning过程,属于zero-shot learning场景。

Instruction-tuning + Fine-tuning

给定若干种类的task,基于instruction以及样本的输入,用于训练。在fine-tuning阶段,给定unseen task的instruction以及K个样本,进行fine-tuning。

Instruction-tuning

此时只有instruction和样本的输入,属于zero-shot learning场景。

MAML

给定若干task的instruction和一个样本输入,用于训练并预测目标。其与传统的MAML一样,只是训练目标变为instruction tuning

在这里插入图片描述

  • In-context tuning比原始的in-context learning效果好,说明直接对in-context learning obective进行训练是有效的;
  • MAML的效果超越了instruction-tuning,说明MAML是可以充分利用few-shot example来实现task adaptation;而本文提出的方法超越了MAML,则说明in-context tuning可以充分利用预训练语言模型的归纳偏置(inductive bias)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/43631.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业实践开源的动机

文章来源:” 夜天之书 “微信公众号 作者:tison 随着开源软件全面占据软件供应链的各个阶段,商业公司开发基础软件或业务逻辑的时候,已经避不开对软件的使用了。经过一段时间对开源软件的使用,以及开源吞噬软件的趋势…

海量Redis数据库优化,vivo如何实现成本与性能的平衡

概述 随着数字化技术的创新以及时延敏感型应用的持续落地,越来越多的数据需要实现实时或近实时的处理,这推动了 Redis 等内存数据库的广泛应用。此类数据库对于内存容量有着较高的要求,在数据快速增长的背景下,大内存池构建意味着…

分布式监控平台——Zabbix

市场上常用的监控软件: 传统运维:zabbix、 Nagios云原生环境: Prometheus (go语言开发的) 一 Zabbix概述 作为一个运维,需要会使用监控系统查看服务器状态以及网站流量指标,利用监控系统的数据…

二叉树的遍历-树-数据结构和算法(Java)

1 树的遍历方式 1.1 深度优先 事实上,深度优先搜索属于图算法的一种,英文缩写为DFS即Depth First Search.其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能访问一次. 那么对于树来说,"深度优先…

使用阿里云国际版负载均衡管理多台服务器上的流量

有效处理多云服务器设置的流量和数据传输负载可能是一个复杂的过程。然而,这是完全必要的,因为业务关键型应用程序需要高度可用的解决方案来管理繁重的工作负载。阿里云服务器负载均衡器(SLB) 简化了工作负载在服务器、网络链路和其他资源之间的分配&…

[附源码]SSM计算机毕业设计闲置物品交易管理系统JAVA

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

mac系统废纸篓可以恢复么,mac不小心清空了废纸篓怎么找回

在使用Mac电脑的过程中,有可能会出现各种意外,其中误删文件是很常见的一种。如果你不小心删除了废纸篓里还有用的文件,mac系统废纸篓可以恢复么? 一、我不小心删除了重要文件,还清倒了废纸篓 案例分享:mac…

软件测试面试题-一个前后端都能修改的bug,应该由谁修改?

其实这个问题还是问得比较有水平的一道面试题。 有很多人说,要不前端修改吧。那难道后端就不能修改吗? 之后又有人说,要不后端修改吧,那难道前端就不能修改吗? 瞬间求职者一脸懵逼。。。。 这道题该怎么去回答呢&…

在国内CDMP认证认可度如何?

随着数字化转型的深入,中国企业不再唯技术论,开始进行转型的整体思考和创新突破。数据是构成数字化业务重要材料,是企业运营变革和竞争优势塑造的核心动力,是实现数字化转型的坚实基础。越来越多的国内企业认识到数据治理知识在企…

spring复习04,静态代理动态代理,AOP

spring复习04,静态代理动态代理,AOP概念引入java代理模式静态代理静态代理模式的好处:静态代理模式的缺点:动态代理jdk动态代理1. InvocationHandler接口2. Proxy类jdk动态代理代码AOPAOP的概念spirng中aop的实现方式一:spring原生的接口方式二&#xff…

基于树莓派的freeRDP桌面云终端的简单实现

VDI虚拟桌面云系统可以通过RmoteFX, PCoIP,HDX等远程桌面显示协议将服务器端的虚拟操作系统桌面环境在远程云终端上显示出来。商用的VDI系统需要部署服务器端虚拟机管理软件如System Center, XenServer等软件,购买价格不菲的服务器硬件,以及500~1000元之间的云终端接入设备。…

模糊控制算法实例matlab程序

参考文献《智能控制——刘金锟》 以水位的模糊控制为例。如图4一4所示,设有一个水箱,通过调节阀可向内注水和向外抽水。设计一个模糊控制器,通过调节阀门将水位稳定在固定点附近。按照日常的操作经验,可以得到基本的控制规则为&am…

TikTok营销策略 如何打造TikTok爆款视频?

最近,电商商家们总在问,如何打造出TikTok爆款视频,以吸引更多浏览量,刺激TikTok变现。这里不难发现,视频创作也只是一种TikTok营销方式,今天就来说说如何打造TikTok爆款视频。TikTok视频营销策略一——清晰…

模型案例推荐:电力大数据项目案例模型分享

电力行业大数据项目模型 电力高架线路巡检绝缘子缺陷智能检测 涉及关键技术: 语义分割 目标检测 图像增强 图像切分 主要工具:Python 技术大类:计算机视觉 主要业务问题: 随着我国经济的高速发展,国民用电量逐年增…

SpringCloud - Sleuth分布式请求链路跟踪

文章目录一.概述二.zipkin搭建三.Sleuth链路监控实现1. payment8001生产者修改2. Consumer80消费者修改3. 测试一.概述 在微服务框架中,一个由客户端发起的请求在后端系统中会经过多个不同的的服务节点调用来协同产生最后的请求结果,每一个前段请求都会…

【信息检索与数据挖掘】期末笔记(一)

文章目录什么是信息检索词项-文档矩阵倒排索引构建过程前三步最后一步布尔检索模型布尔查询的处理查询优化如何存储词典哈希表树有序检索模型对基本布尔操作的扩展短语查询和位置索引短语查询第一个解决方案第二个解决方案更快的索引表合并什么是信息检索 信息检索是从大规模非…

nuxt3:我们开始吧!

一、背景介绍 2022 年 11 月 16 日,全球最大的 Nuxt 会议 Nuxt Nation 2022 在线举行,并正式发布了 Nuxt.js 3.0 的第一个稳定版本。Nuxt 3 是基于 Vite、Vue3 和 Nitro 的 Nuxt 框架的现代重写,具有一流的 Typescript 支持,是两…

深入浅出的给大家分析下现在做抖音短视频还来得及吗?

2500字,需要一些耐心用心读完,让自己对于未来更清晰一些! 大家好,我是我赢助手短视频运营,专注于短视频运营和创作;今天给大家分享下现在还来得及做短视频吗?深入浅出的给大家分析下这个问题。…

加缪——人生到底有什么意义?生命的意义就是生命本身

核心问题:人生到底有什么意义?如果人生没有意义,那么人是否应该自杀? 如果不是,那么人要以什么样的态度活着? 目录 一、《局外人》 二、名言 三、「个人感悟」对活着意义的幡然醒悟 四、《西西弗神话》…

SpringBoot+Vue实现前后端分离的校园健康检测管理系统

文末获取源码 开发语言:Java 使用框架:spring boot 前端技术:JavaScript、Vue.js 、css3 开发工具:IDEA/MyEclipse/Eclipse、Visual Studio Code 数据库:MySQL 5.7/8.0 数据库管理工具:phpstudy/Navicat JD…