基于生成模板的动态前缀微调事件抽取(ACL2022)

news2025/1/16 21:53:57

1、写作动机:

尽管将事件抽取任务转换为具有提示的序列生成问题越来越多,但基于生成的方法仍存在两个重大挑战,包括使用欠佳的提示和静态事件类型信息。

欠佳的提示:手动为每种事件类型设计提示,没有调优,在很大程度上影响模型性能。

静态事件类型信息:在抽取特定类型的事件时,最近的基于生成的方法将只接收有关正在运行的事件类型的相同事件类型信息,而不考虑其他可能的事件类型之间的关联。

2、概述:

提出了一种基于生成模板的动态前缀的事件提取,记作GTEE- D YNPREF。使用预训练的编码-解码器语言模型BART,按一种类型提取事件记录进行条件生成。对于每个事件类型,我们首先初始化一个特定于类型的前缀,它由一个可调向量序列组成,作为transformer 的历史值。特定于类型的前缀为单一类型提供了可调的事件类型信息。然后,我们将上下文信息与所有特定于类型的前缀集成起来,以学习特定于上下文的前缀,并动态地组合所有可能的事件类型信息。

3、基本模型架构:

对于句子中的每个事件类型ei,将事件填充到模板,构建序列,用于条件生成。若没有事件类型ei的事件记录,generation ground truth是Trigger <trg>,否则,事件类型被填充到模板中。如果几个论元被归类为相同的角色,那么这些论元按照span排序,然后由'and'连接。如果有多个事件类型,按触发词的span排序,并且填充的序列将由一个新的单独的标记<OUT_SEP>连接。

条件生成子任务由预训练的编码器-解码器语言模型BART或者T5建模。

分析:根据事件本体O,通过模板匹配和插槽映射来解析事件记录,并不是所有生成的输出序列都是有效的,对于每个生成序列,首先尝试解析触发词,若失败了,跳过该序列;若不能匹配<IN_SEP>或模板的论元部分,将跳过论元解析,只保留一个触发词。

发现:通过调查解析的事件时,作者发现模型即使对于不相关的事件类型也有生成事件记录的偏差。 当输入上下文不包含任何事件记录时,这将在很大程度上影响precision分数和 F1 分数。

解决方式:通过单独训练一个不相关分类器IC来缓解这个问题。以上下文C作为输入,我们通过将编码的[ CLS ] 向量作为二分类器提供给MLP来调整BERT模型,以查看上下文是否包含任何事件记录或与本体O \mathcal{O}O完全无关。


4、动态前缀微调:

用特定于任务的前缀和特定于上下文的前缀进行动态前缀调优,以缓解基于生成的事件抽取中的两个主要挑战。

4.1特定类型的静态前缀:

使用特定于事件类型的前缀STAPREF,它是一对两个transformer激活序列{ sp , sp ′ },每个序列分别包含L个连续D维向量作为编码器和解码器的历史值。从编码器和解码器输入的角度来看,在子任务Sei,C 中,编码器-解码器LM中序列X和Y 的前缀实际上是预先添加的。

具体做法:先为本体O 中的每个事件类型ei 初始化一对特定于任务的前缀{ spei , spei ′ } ,然后在条件生成子任务Sei,C中,将相应的特定于任务的前缀{ spei , spei ′ }作为编码器和解码器的transformer activations。使用可训练的嵌入张量P ∈ R ∣ E ∣ × L × D 来建模特定的上下文前缀sp。对于事件类型ei,前缀向量在索引t的值为:

4.2特定于上下文的动态前缀:

dpc与sp具有相同的序列长度L,对于每个位置t ,通过多头注意,根据上下文特定信息c,动态加入本体O中事件类型为ei​的所有前缀向量sp^{ei}_t,计算出前缀向量dp_c^t。为了计算特定于上下文的信息c ,应用BERT模型作为上下文编码器,将上下文c 作为输入,并将[CLS]向量作为c 。

5、实验结果:

5.1监督学习:

5.2迁移学习:

5.3消融实验:

5.4内在评估:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1392441.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据库的安全管理

数据库的安全管理 一、实验目的 掌握用户账号的创建、查看、修改、删除的方法。掌握用户权限设置方法。掌握角色的创建、删除方法。 二、实验内容用户账号的创建、查看、修改、删除的SQL语句。用户权限设置SQL语句。角色的创建、删除SQL语句。 三、实验步骤在本地主机创建用户…

代码随想录-刷题第五十七天

42. 接雨水 题目链接&#xff1a;42. 接雨水 思路&#xff1a;本题十分经典&#xff0c;使用单调栈需要理解的几个问题&#xff1a; 首先单调栈是按照行方向来计算雨水&#xff0c;如图&#xff1a; 使用单调栈内元素的顺序 从大到小还是从小到大呢&#xff1f; 从栈头&…

c语言:用一个宏,可以将一个整数的二进制位的奇数位和偶数位交换。

题目 用一个宏&#xff0c;可以将一个整数的二进制位的奇数位和偶数位交换。 如&#xff1a;01&#xff0c;是1&#xff0c;交换完是10&#xff0c;是2. 思路 1.分别取出奇数位上的数字和偶数位上的数字 举个例子&#xff1a;1001 0110 1001 0110 奇…

(Matlab)基于CNN-Bi_LSTM的多维回归预测(卷积神经网络-双向长短期记忆网络)

目录 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 亮点与优势&#xff1a; 二、实际运行效果&#xff1a; 三、部分代码展示&#xff1a; 四、完整程序数据分享&#xff1a; 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 本代码基于Matlab平…

Databend 开源周报第 128 期

Databend 是一款现代云数仓。专为弹性和高效设计&#xff0c;为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务&#xff1a;https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展&#xff0c;遇到更贴近你心意的 Databend 。 使用 Databend …

dpwwn:01

靶机下载地址 dpwwn: 1 ~ VulnHub 信息收集 # nmap -sn 192.168.1.0/24 -oN live.nmap Starting Nmap 7.94 ( https://nmap.org ) at 2024-01-14 22:24 CST Nmap scan report for 192.168.1.1 (192.168.1.1) Host is up (0.00014s latency). MAC Address: 00:50:56:C0:…

机器学习与数据科学-专题1 Python正则表达式-【正则表达式入门-1】

文章目录 第一关相关知识任务要求代码 第二关相关知识任务要求代码 第三关相关知识注意任务描述代码 第一关 相关知识 为了完成本关任务&#xff0c;你需要掌握&#xff1a; 在 Python 中使用正则表达式&#xff1b; 最基础正则表达式&#xff1b; 正则匹配函数。 在 Python…

grep 在运维中的常用可选项

一、对比两个文件 vim -d <filename1> <filename2> 演示&#xff1a; 需求&#xff1a;&#xff5e;目录下有两个文件一个test.txt 以及 text2.txt,需求对比两个文件的内容。 执行后会显示如图&#xff0c;不同会高亮。 二、两次过滤 场景&#xff1a;当需要多…

为什么有些赤霞珠葡萄酒会出现“青椒”的味道?

有几种著名的赤霞珠口味与葡萄栽培和气候影响密切相关&#xff0c;最广为人知的是吡嗪引起的草本或青椒味&#xff0c;在未成熟的葡萄中更普遍。所有赤霞珠葡萄中都存在吡嗪化合物&#xff0c;随着葡萄的继续成熟&#xff0c;它们逐渐被阳光破坏。 对于人类口感来说&#xff0…

vue3-事件处理

事件监听 DOM 事件监听指令 v-on 简写 v-on:click"handler" 或者 click"handler"事件处理器 (handler) 的值可以是&#xff1a; 内联事件处理器&#xff1a;比如 click 方法事件处理器&#xff1a;一个指向组件上定义的方法的属性名或是路径。 在内联…

Python爬虫实战:IP代理池助你突破限制,高效采集数据

当今互联网环境中&#xff0c;为了应对反爬虫、匿名访问或绕过某些地域限制等需求&#xff0c;IP代理池成为了一种常用的解决方案。IP代理池是一个包含多个可用代理IP地址的集合&#xff0c;可以通过该代理池随机选择可用IP地址来进行网络请求。 IP代理池是一组可用的代理IP地址…

[Linux 进程(四)] 再谈环境变量,程序地址空间初识

文章目录 1、前言2、环境变量2.1 main函数第三个参数 -- 环境参数表2.2 本地环境变量和env中的环境变量2.3 配置文件与环境变量的全局性2.4 内建命令与常规命令2.5 环境变量相关的命令 3、程序地址空间 1、前言 上一篇我们讲了环境变量&#xff0c;如果有不明白的先读一下上一…

IOS-高德地图路径绘制-Swift

本文展示的是在IOS开发中调用高德地图进行驾车路径绘制&#xff0c;开发语言是Swift。 IOS高德地图集成请看&#xff1a;IOS集成高德地图Api 使用路径规划功能需要集成高德地图的搜索功能。 pod AMapSearch定义AMapSearchAPI 定义主搜索对象 AMapSearchAPI &#xff0c;并继承…

2023年第十四届蓝桥杯软件赛省赛总评

报名明年4月蓝桥杯软件赛的同学们&#xff0c;如果你是大一零基础&#xff0c;目前懵懂中&#xff0c;不知该怎么办&#xff0c;可以看看本博客系列&#xff1a;备赛20周合集 20周的完整安排请点击&#xff1a;20周计划 每周发1个博客&#xff0c;共20周。 在QQ群上交流答疑&am…

K8s(一)Pod资源——Pod介绍、创建Pod、Pod简单资源配额

目录 Pod概述 pod网络 pod存储 pod和容器对比 创建pod的方式 pod运行方式分类 Pod的创建 Pod的创建过程 通过kubectl run来创建pod 通过yaml文件创建&#xff0c;yaml文件简单写法 Pod简单操作 Pod的标签labels Pod的资源配额resource 测试 Pod概述 Kubernetes …

类加载器和双亲委派

java默认的类加载机制是委派机制&#xff0c;委派过程如下&#xff1a; 从缓存中加载如果缓存中没有&#xff0c;则从父类加载器中加载。如果父类加载器中的没有&#xff0c;则从当前加载器加载如果没有&#xff0c;则抛出异常 类加载器只能加载在自己的指定目录下的二进制类流…

使用虚拟机安装AIX7.2【re】

背景 同事的项目需要在aix上安装和配置db2&#xff0c;然而客户还没有将PowerPC端末开通使用&#xff0c;所以项目的设计阶段打算在虚拟机上进行检证&#xff0c;让我帮忙准备环境。 这是什么 AIX 7.2 是 IBM 开发的一款高级交互式执行系统&#xff08;Unix系统&#xff09;&a…

[GN] nodejs16.13.0版本完美解决node-sass和sass-loader版本冲突问题

项目场景&#xff1a; npm install 运行vue项目时候 问题描述 项目场景&#xff1a;sass-loader &#xff0c;node-sass出错 ! ERESOLVE unable to resolve dependency tree npm ERR! npm ERR! While resolving: smoore-mes-web1.4.0 npm ERR! Found: webpack3.12.0 npm ER…

数字电源简介

数字电源简介 定义主要应用场景数字电源的基本组成常见算法常见电源拓扑PFCLLC 数字电源与模拟电源对比参考链接 定义 常见定义有以下四种&#xff1a; 通过数字接口控制的开关电源&#xff0c;强调的是数字电源的“通信”功能。可通过I2C或类似的数字总线来对数字信号进行控…

MySQL的Explain详解(查询计划)

MySQL中的EXPLAIN语句用于分析SELECT语句的执行计划。通过使用EXPLAIN&#xff0c;我们可以了解到MySQL如何处理查询、选择索引等信息&#xff0c;从而优化查询性能。 Expain出来的信息总共有10列&#xff0c;分别是id、select_type、table、type、possible_keys、key、key_le…