【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架
【论文原文】:A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction
【作者信息】:Sheng, Jiawei and Guo, Shu and Yu, Bowen and Li, Qian and Hei, Yiming and Wang, Lihong and Liu, Tingwen and Xu, Hongbo
论文:https://aclanthology.org/2021.findings-acl.14.pdf
代码:https://github.com/JiaweiSheng/CasEE
博主关键词:重叠事件抽取,联合学习,类型语义
推荐论文:无
摘要
事件抽取(Event extraction, EE)是一项重要的信息抽取任务,旨在抽取文本中的事件信息。现有方法大多假设事件出现在句子中没有重叠,这不适用于复杂的重叠事件抽取。本文系统地研究了现实事件重叠问题,即一个词可能作为多种类型的触发词或具有不同作用的论元。为了解决上述问题,我们提出了一种新的联合学习框架,该框架具有级联解码,用于重叠事件抽取,称为CasEE。具体而言,CasEE依次执行类型检测、触发词抽取和论元抽取,其中重叠的目标根据前者的特定预测分别抽取。所有子任务都在一个框架中联合学习,以捕获子任务之间的依赖关系。对公共事件抽取基准FewFC的评估表明,CasEE在重叠事件抽取方面比以前的竞争方法取得了显著改进。
1、简介
事件抽取(EE)是自然语言理解中一个重要而又具有挑战性的任务。给定一个句子,事件抽取系统应该识别句子中出现的事件类型、触发词和论元。作为一个例子,图1(b)展示了一个Share Reduction类型的事件,由“reduced”触发。有几种说法,如“Fuda Industry”在事件中发挥了“subject”作用。
然而,事件经常在句子中复杂地出现,其中触发词和论点可能在句子中有重叠。这个文章聚焦在一个具有挑战性和现实意义的问题:重叠事件抽取。一般来说,我们将所有重叠的情况分为三种模式**:1)一个词可以在多个事件中作为不同事件类型的触发词**。图1(a)显示了“获得(acquire)”的token同时触发投资(Investment)事件和股份转让(Share Transfer)事件。2)一个词可以作为论元,在多个事件中扮演不同的角色。图1(a)显示,“盛悦网络(Shengyue Network)”在投资事件中扮演客体(object)角色,在股权转让(Share Transfer)事件中扮演主体(subject)角色。3)一个词可以作为论元在一个事件中扮演不同的角色。从图1(b)可以看出,“福达实业(Fuda Industry)”在一个事件中既是主体(subject)角色,又是目标(object)角色。为简单起见,在下文中,我们将模式1)称为重叠触发词问题,将模式2)和模式3)称为重叠论元问题。在中国金融事件抽取数据集中,FewFC (Zhou et al, 2021),约有13.5% / 21.7%的句子存在重叠的触发词/论元问题。
现有的大部分EE研究假设事件出现在句子中没有重叠,这并不适用于复杂的重叠场景。通常,目前的EE研究可以大致分为两个类别:1)传统联合方法(Nguyen等人, 2016;刘等人,2018;Nguyen和Nguyen, 2019),通过统一的解码器同时抽取触发词和论元,并且只标记一次句子。然而,由于标签冲突,它们无法抽取重叠的目标,其中一个token可能有多个类型化标签,但只能分配一个标签。2)管道方法(Chen等人, 2015;Yang等人,2019;Du和Cardie, 2020b),在不同的阶段依次抽取触发词和论元。Yang等人(2019)试图以管道方式解决重叠论元问题,但忽略了重叠触发词问题。然而,管道方法忽略了触发词和论元之间的特征级依赖关系,并受到错误传播的影响。据我们所知,现有的EE研究忽视了重叠问题或只关注一个重叠问题。很少有研究同时解决上述三种重叠模式。
为了解决上述问题,我们提出了CasEE,一种用于重叠事件抽取的Cascade解码联合学习框架。具体来说,CasEE通过一个共享的文本编码器和三个用于类型检测、触发词抽取和论元抽取的解码器来实现事件抽取。为了抽取跨事件的重叠目标,CasEE依次解码三个子任务,根据前者的预测进行触发词抽取和论元抽取。这种级联解码策略根据不同的条件抽取事件元素,使重叠的目标分阶段抽取。条件融合函数用于显式地模拟相邻子任务之间的依赖关系。所有的子任务解码器被联合学习,以进一步建立子任务之间的连接,从而通过下游子任务之间的特征级交互来改进共享文本编码器。
本文的贡献有三个方面:
(1)我们系统地研究了EE中的重叠问题,并将其分为三种模式。据我们所知,这篇论文是第一批同时处理所有三种重叠模式的论文之一。
(2)我们提出了一种新型的带有级联解码的联合学习框架CasEE,以同时解决所有三种重叠模式。
(3)我们在中国公开的金融事件抽取基准——FewFC上进行了实验。实验结果表明,与现有的竞争方法相比,CasEE在重叠事件抽取方面取得了显著的改进。
2、模型
图2展示了CasEE的细节。CasEE采用一个共享的BERT编码器来捕获文本特征,三个解码器用于类型检测、触发词抽取和论元抽取。由于与之前的管道方法相比,所有子任务都是联合学习的(Yang等人,2019;Li等人,2020),CasEE可以捕获子任务之间的特征级依赖关系。对于预测,CasEE在级联解码过程中按顺序预测事件类型、触发词和论元。
3、实验结果
所有方法在FewFC数据集上的性能如表2所示。从表中可以看出:
(1)与联合序列标记方法相比,CasEE在F1分数上表现更好。CasEE在AC F1评分上分别比BERT-CRF提高4.5%和BERT-CRF-joint提高4.3%。此外,由于序列标记方法存在标签冲突,对于多标签token只能预测一个标签,CasEE在评价指标的召回率上有较高的结果。结果证明了CasEE在重叠事件抽取方面的有效性。
(2)与管道方法相比,我们的方法在F1分数上也优于管道方法。结果表明,与PLMEE相比,CasEE在TC和AC的F1评分上分别提高了3.1%和2.6%,说明解决EE重叠触发词问题的重要性。尽管基于MRC的基线可以抽取重叠的触发词和论元,但CasEE仍然取得更好的效果。具体来说,CasEE相对强基线MQAEE-2提高了4.1%。原因可能是CasEE共同学习子任务的文本表示,在子任务之间构建有用的交互和连接。结果表明,CasEE优于上述管线基线。
CasEE:全文阅读