EventGraph:Event Extraction as Semantic Graph Parsing 论文解读

news2025/1/12 23:17:12

EventGraph: Event Extraction as Semantic Graph Parsing

论文:2022.case-1.2.pdf (aclanthology.org)

代码:huiling-y/EventGraph (github.com)

期刊/会议:CASE 2022

摘要

事件抽取涉及到事件触发词和相应事件论元的检测和抽取。现有系统经常将事件抽取分解为多个子任务,而不考虑它们之间可能的交互。在本文中,我们提出了EventGraph,这是一个用于事件抽取的联合框架,它将事件编码为图。我们将事件触发词和论元表示为语义图中的节点。事件抽取因此成为一个图解析问题,它具有以下优点:1)事件检测和论元抽取联合进行;2)从一段文本中检测和抽取多个事件;3)捕获事件论元和触发词之间的复杂交互。在ACE2005上的实验结果表明,我们的模型与现有的系统相比具有竞争力,并且在论元抽取方面有了很大的改进。此外,我们从ACE2005创建了两个新的数据集,其中保留了事件论元的整个文本跨度,而不仅仅是头部单词。

1、简介

事件抽取旨在根据预定义的事件本体,将非结构化文本中的事件相关信息抽取为结构化形式(即触发词和论元)(Ahn, 2006;Doddington et al, 2004)。在这些类型的本体中,事件由事件触发词来表示,并由一组预定义的论元类型组成。图1显示了一个包含两个事件的句子示例,一个由“friendly-fire”触发的Attack事件和一个由“died”触发的Die事件;这两个事件共享相同的论元,但每个事件在特定事件中扮演不同的角色。例如,U.S.是死亡事件中的Agent,但在Attack事件中扮演Attacker的角色。

与将事件抽取划分为独立的子任务相反,我们利用语义依赖分析的最新进展(Dozat和Manning, 2018;Samuel和Straka, 2020),并开发了一个端到端事件图解析器,称为EventGraph。我们采用直观的图形编码来表示单个事件图中某段文本的事件提及,并直接从原始文本生成这些事件图。我们在ACE2005 (LDC2006T06)上评估我们的EventGraph系统。我们的模型与最先进的模型取得了具有竞争力的结果,并大大提高了事件论元抽取的结果。这项工作的主要贡献是:

  1. 我们提出EventGraph,这是一个文本到事件的框架,它将事件抽取作为语义图解析来解决。该模型不依赖于任何特定于语言的特性或特定于事件的本体,因此可以很容易地应用于新的语言和新的数据集。
  2. 我们设计了一种直观的图编码方法来表示单个事件图中的事件结构。
  3. 我们的方法的通用性允许轻松解码完整的触发词和论元提及。我们从ACE2005中创建了两个新颖且更具挑战性的数据集,并提供了相应的基准测试结果。

2、相关工作

我们的工作与事件抽取和语义解析两个研究方向密切相关。

有监督事件抽取是自然语言处理中的一个研究领域。获取事件的结构化信息有不同的方法,主流的方法可以分为:1)基于分类的方法:将事件抽取作为几个分类子任务,或者以基于管道的方式分别求解(Ji and Grishman, 2008;Li等,2013;刘等,2020;Du和Cardie, 2020;Li等人,2020)或联合推断多个子任务(Yang和Mitchell, 2016;Nguyen等人,2016;刘等,2018;Wadden等人,2019;Lin et al, 2020);2)基于生成的方法:将事件抽取作为序列生成问题(Paolini等人,2021;Lu等,2021;Li等,2021;Hsu等,2022);3)提示提示方法:受自然语言理解任务的启发,这些方法利用了“离散提示(discrete prompts)”(Shin等人,2020;Gao等,2021;Li和Liang, 2021;Liu et al, 2022)。

语义表示解析近年来引起了人们的极大兴趣(openen等人,2014,2015,2020)。与语法依赖表示不同,这些语义表示关键不是树,而是一般的图,其特征是可能有多个入口点(根),并且不一定是连接的,因为不是每个标记都是图中的节点。在开发能够产生这种语义图的基于迁移和基于图的依赖解析器的变体方面,已经取得了相当大的进展(Hershcovich等人,2017;多扎特和曼宁,2018年;塞缪尔和斯特拉卡,2020年)。

在当前环境中,语义解析器在NLP任务中的应用已经超越了意义表示解析。这些方法依赖于将特定于任务的表示重新表述为语义依赖关系图。例如,Yu等人(2020)利用Dozat和Manning(2018)的解析器来预测命名实体的跨度,而Kurtz等人(2020)将否定解析任务(Morante和Daelemans, 2012)描述为具有良好结果的图解析任务。最近,Barnes et al.(2021)提出了一种依赖解析方法来从文本中抽取意见元组,称为结构化情感分析,最近致力于这项任务的共享任务证明了图解析方法对情感分析的有用性(Barnes et al, 2022)。与我们的工作最相似的是Samuel等人(2022)的工作,该工作采用PERIN解析器(Samuel和Straka, 2020)直接从原始文本解析为情感图。

3、事件图表示

我们采用一种有效的“标记边缘(label-edge)”表示,用于句子范围内的事件图编码。事件图中的每个节点都对应于一个事件触发词或一个论元,该论元锚定在句子中的唯一文本跨度上,除了顶部节点,它只是每个事件图的虚拟节点。边仅在顶部节点和事件触发词之间或事件触发词和论元之间受到约束,对应的边标签作为事件类型或论元角色。“标记边缘”编码具有以下能力:1)多个事件提及;2)嵌套结构(论元或触发词论元之间的重叠);3)单个论元的多个论元角色。以图2中的事件图为例,句子中包含两个事件提及,它们共享相同的论证“the hills above Chamchamal”,但角色不同,论元“coalition”嵌套在论元“coalition figher jets”中。
在这里插入图片描述

4、事件解析

EventGraph是PERIN (Samuel和Straka, 2020)的改编,PERIN是用于文本到图解析的通用排列不变框架。给定事件图的“标记边缘”编码,我们通过定制PERIN的模块来创建EventGraph,如图3所示,其中包含三个分类器,分别用于生成节点、锚点和边。每个输入序列由EventGraph的四个模块处理,生成最终的结构化表示。

编码器:我们使用large XLM-R (Conneau et al, 2020)作为编码器,以获得输入序列的上下文化表示;每个token通过在子词上学习的子词注意层获得上下文嵌入。

查询生成(query generator):我们使用线性转换层将每个嵌入的token映射到 n n n个查询。

解码器:解码器是一个Transformer编码器层的堆叠(Vaswani等人,2017),没有位置编码,这是置换不变的(非自回归);解码器通过建模query之间的相互依赖关系来处理和增强每个token的query。

解码头:它由三个分类器组成:a)节点分类器是一个线性分类器,通过对每个token的增强查询进行分类来预测节点的存在;由于为每个token生成多个查询,单个token可以生成多个节点;b)anchor biaffine分类器(Dozat和Manning, 2017)在每个token的增强查询和上下文嵌入之间使用deep biaffine attention,将预测的节点映射到表面token;C)edge biaffine分类器使用两个deep biaffine attention模块来处理生成的节点,并预测一对节点与边缘标签之间的边缘是否存在。

给定一段文本,EventGraph生成相应的图,从节点和边中抽取事件提及的结构化信息并不费力。

5、实验

5.1 数据集

ACE 2005:ACE05-E、ACE05-E+、ACE05-E++、ACE05-E+++。

5.2 评估指标

Trigger classification (Trg-C)、Argument classification (Arg-C): precision、recall、F1。

5.3 对比模型

DYGIE++、ONEIE、TEXT2EVENT、GTEE-GYNPREF。

5.4 实施细节

我们的代码构建在PERIN解析器之上(Samuel和Straka, 2020)。关于我们的训练设置和超参数设置的细节在附录a中给出。对于每个数据集,我们用5个不同的随机种子训练5个模型,并报告相应结果的均值和标准差。

6、结果和讨论

7、总结

本文提出了一种新的事件抽取方法——语义图解析。我们所提出的EventGraph在事件触发词分类任务上已经在ACE2005上取得了具有竞争力的结果,在论元角色分类任务上获得了最好的结果。我们还提供了一个图形表示来更好地可视化事件提及,并提供了一个有效的工具来促进图转换。我们从ACE2005中创建了两个新的数据集,包括触发词和论元的全文跨度,并提供相应的基准测试结果。我们表明,尽管添加了更多更长的文本序列,EventGraph仍然优于之前在更有限的数据集上测试的模型。在未来的工作中,我们将尝试不同的预训练语言模型,并进行更详细的错误分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/384652.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

黑盒测试重点复习内容

黑盒测试一、等价类划分边界值分析法二、判定表法一、等价类划分边界值分析法 对于各种输入或者输出,必须考虑等价类和边界值,并补充一些特殊值,如空值、空格、0、异常格式等特殊值。 基本概念: 有效等价类:满足需求…

K_A14_003 基于STM32等单片机驱动APDS9960手势运动模块 串口与OLED0.96双显示

K_A14_003 基于STM32等单片机驱动APDS9960手势运动模块 串口与OLED0.96双显示一、资源说明二、基本参数参数引脚说明三、驱动说明时序对应程序:四、部分代码说明1、接线引脚定义1.1、STC89C52RCAPDS9960手势运动模块1.2、STM32F103C8T6APDS9960手势运动模块五、基础知识学习与相…

实例解析Java反射

反射是大多数语言里都必不不可少的组成部分,对象可以通过反射获取他的类,类可以通过反射拿到所有方法(包括私有),拿到的方法可以调用,总之通过“反射”,我们可以将Java这种静态语言附加上动态特…

【OpenCV】车牌自动识别算法的设计与实现

写目录一. 🦁 设计任务说明1.1 主要设计内容1.1.1 设计并实现车牌自动识别算法,基本功能要求1.1.2 参考资料1.1.3 参考界面布局1.2 开发该系统软件环境及使用的技术说明1.3 开发计划二. 🦁 系统设计2.1 功能分析2.1.1 车辆图像获取2.1.2 车牌…

研报精选230303

目录 【个股230303中泰证券_李子园】李子园:甜牛奶行业龙头,全国化加速推进中【行业230303中国银河】医药月报23or02:集采持续推进,控费仍是政策主基调【行业230303国联证券】银行行业专题研究:财富管理月报&#xff1…

征集令!寻找别出心裁的i.MX9352应用方案Demo

想要体验NXP全新的i.MX 9352这颗高性价比处理器吗?想要展示由你亲手打造的超炫酷的应用方案Demo吗?想要领取至高500元的京东E卡奖励吗?现在飞凌嵌入式全都给到你!面向全体工程师征集基于飞凌嵌入式OK-MX9352-C开发板设计的优质应用…

【Linux】Shell详解

😊😊作者简介😊😊 : 大家好,我是南瓜籽,一个在校大二学生,我将会持续分享Java相关知识。 🎉🎉个人主页🎉🎉 : 南瓜籽的主页…

Flutter Button 实例

大家好,我是 17。 在上篇文章 使用 Flutter Button 介绍了如何修改 button 的样式,本文来具体实践一下。 本文列举一些常用的 button 效果,以便在用到的时候方便使用。因为 ElevatedButton 最常用,所以大多以 ElevatedButton 举…

wifi 概率性自动断线(IpReachabilityMonitor)和 案例介绍

IpReachabilityMonitor机制,有时候会遇到用户反馈wifi 会概率性自动断线,最后发现是系统有开启IpReachabilityMonitor 机制,可能是在干扰严重环境下或相对弱信号下让系统误判导致下断线。 这篇博主写的非常好.wifi 概率性自动断线(IpReachabilityMonitor)_lost_provision…

Cesium+Vue3+vite 环境搭建(nvm安装使用),以及简单上手

目录 【nvm的安装和使用】 1、安装nvm 2、配置nvm 3、测试 一、Vite项目 1、创建一个新的Vite项目 解决问题:npm ERR! Unexpected token . 2、安装Cesium插件 3、项目配置 【1】在vite.config.js里进行配置 【2】清空style.css 【3】在App.vue里面进行全…

深度剖析指针(下)——“C”

各位CSDN的uu们你们好呀,今天小雅兰的内容还是我们的指针呀,上两篇博客我们基本上已经把知识点过了一遍,这篇博客就让小雅兰来带大家看一些和指针有关的题目吧,现在,就让我们进入指针的世界吧 复习: 数组和…

利用Albumentations工具包进行图像的数据增强(以yolo数据标注格式为例)

最近在看数据增强方法时,看到了这个有趣的工具包,研究了下并以yolo数据标注格式为例写了一个示例脚本。 该工具最大的好处是会根据你使用的数据增强方法自动修改标注框信息! import albumentations as A import cv2 import os""&…

【摄像头模块】口罩识别功能调试问题总结

文章目录一. 初始化二.程序烧录三.识别是否佩戴口罩小项目中常用到摄像头模块,文章内容疑问,可以私信交流 一. 初始化 1.初始界面为版本号,以及SD卡识别 如果未出现此界面,则可以按板子上的RST键,或者重新刷固件 …

C++动态规划之最长上升子序列

1 子序列与上升子序列1.1 子序列一个序列A{a1,a2,...an}中任意删除若干项,剩余的序列叫做A的一个子序列。例如序列A{1,3,5,4,2},删除其中的第3项和第5项,得到序列B{1,3,4},删除其中的第3项和第4项,得到序列C{1&#xf…

详述java的设计模式(三)

1.装饰者模式 装饰者模式(Decorator Pattern)允许向一个现有的对象添加新的功能,同时又不改变其结构。这种类型的设计模式属于结构型模式,它是作为现有的类的一个包装。 使用场景: 在不影响其他对象的情况下&#xff…

使用Python免费试用最新Openai API

一、背景介绍 3月2日凌晨,OpenAI放出了真正的ChatGPT API,不是背后的GPT-3.5大模型,是ChatGPT的本体模型!ChatGPT API价格为1k tokens/$0.002,等于每输出100万个单词,价格才2.7美金(约18元人民…

数据可视化展示:打工人常见职业病,颈腰椎病占比最高达66.51%

身体健康才是一切的根本。只有身体健健康康才能更好的去享受世间的美好,无论是谁都应当注重身体健康,而不是无度的挥霍它! 良好的身体,释放给工作,健壮的体魄,享受美好生活,良好的心态&#xff…

2023年独立站建站平台有哪些?

在当今互联网时代,网站已经成为了人们展示自我、宣传企业、交流信息的重要平台。如果您想要打造自己的网站,但是没有足够的技术和设计经验,那么独立站建站平台可能是一个不错的选择。下面介绍一些常见的独立站建站平台。 WordPress&#xff…

活动回顾(PPT+视频)|全球人工智能开发者先锋大会 Jina AI 的现场直击!

2 月 25 - 26 日,全球人工智能开发者先锋大会(GAIDC)在上海临港中心成功举办,Jina AI 的高级算法工程师参加「 AI 工程化 MLOps 论坛」为大家带来精彩的主题演讲《多模态 AI 应用开发新范式》,开源集市迎来近 500 位小…

Python机器学习实战(一)

文章目录基于逻辑回归实现乳腺癌预测基于k-近邻算法实现鸢尾花分类基于决策树实现葡萄酒分类基于朴素贝叶斯实现垃圾短信分类基于支持向量机实现葡萄酒分类基于高斯混合模型实现鸢尾花分类基于主成分分析实现鸢尾花数据降维基于奇异值分解实现图片压缩基于逻辑回归实现乳腺癌预…