【论文速递】CASE 2022 - EventGraph: 将事件抽取当作语义图解析任务

news2024/11/24 8:28:00

【论文速递】CASE 2022 - EventGraph: 将事件抽取当作语义图解析任务

【论文原文】:https://aclanthology.org/2022.case-1.2.pdf

【作者信息】:Huiling You, David Samuel, Samia Touileb, and Lilja Øvrelid

论文:https://aclanthology.org/2022.case-1.2.pdf
代码:https://github.com/huiling-y/EventGraph

博主关键词:事件抽取、语义图解析、AMR

推荐论文:http://t.csdn.cn/FXooE、http://t.csdn.cn/emLEW

摘要

事件抽取涉及到事件触发词和相应事件论元的检测和抽取。现有系统经常将事件抽取分解为多个子任务,而不考虑它们之间可能的交互。在本文中,我们提出了EventGraph,这是一个用于事件抽取的联合框架,它将事件编码为图。我们将事件触发词和论元表示为语义图中的节点。事件抽取因此成为一个图解析问题,它具有以下优点:1)事件检测和论元抽取联合进行;2)从一段文本中检测和抽取多个事件;3)捕获事件论元和触发词之间的复杂交互。在ACE2005上的实验结果表明,我们的模型与现有的系统相比具有竞争力,并且在论元抽取方面有了很大的改进。此外,我们从ACE2005创建了两个新的数据集,其中保留了事件论元的整个文本跨度,而不仅仅是头部单词。

1、简介

事件抽取旨在根据预定义的事件本体,将非结构化文本中的事件相关信息抽取为结构化形式(即触发词和论元)(Ahn, 2006;Doddington et al, 2004)。在这些类型的本体中,事件由事件触发词来表示,并由一组预定义的论元类型组成。图1显示了一个包含两个事件的句子示例,一个由“friendly-fire”触发的Attack事件和一个由“died”触发的Die事件;这两个事件共享相同的论元,但每个事件在特定事件中扮演不同的角色。例如,U.S.是死亡事件中的Agent,但在Attack事件中扮演Attacker的角色。

与将事件抽取划分为独立的子任务相反,我们利用语义依赖分析的最新进展(Dozat和Manning, 2018;Samuel和Straka, 2020),并开发了一个端到端事件图解析器,称为EventGraph。我们采用直观的图形编码来表示单个事件图中某段文本的事件提及,并直接从原始文本生成这些事件图。我们在ACE2005 (LDC2006T06)上评估我们的EventGraph系统。我们的模型与最先进的模型取得了具有竞争力的结果,并大大提高了事件论元抽取的结果。这项工作的主要贡献是:

  1. 我们提出EventGraph,这是一个文本到事件的框架,它将事件抽取作为语义图解析来解决。该模型不依赖于任何特定于语言的特性或特定于事件的本体,因此可以很容易地应用于新的语言和新的数据集。
  2. 我们设计了一种直观的图编码方法来表示单个事件图中的事件结构。
  3. 我们的方法的通用性允许轻松解码完整的触发词和论元提及。我们从ACE2005中创建了两个新颖且更具挑战性的数据集,并提供了相应的基准测试结果。

2、方法

EventGraph是PERIN (Samuel和Straka, 2020)的改编,PERIN是用于文本到图解析的通用排列不变框架。给定事件图的“标记边缘”编码,我们通过定制PERIN的模块来创建EventGraph,如图3所示,其中包含三个分类器,分别用于生成节点、锚点和边。每个输入序列由EventGraph的四个模块处理,生成最终的结构化表示。

编码器:我们使用large XLM-R (Conneau et al, 2020)作为编码器,以获得输入序列的上下文化表示;每个token通过在子词上学习的子词注意层获得上下文嵌入。

查询生成(query generator):我们使用线性转换层将每个嵌入的token映射到 n n n个查询。

解码器:解码器是一个Transformer编码器层的堆叠(Vaswani等人,2017),没有位置编码,这是置换不变的(非自回归);解码器通过建模query之间的相互依赖关系来处理和增强每个token的query。

解码头:它由三个分类器组成:a)节点分类器是一个线性分类器,通过对每个token的增强查询进行分类来预测节点的存在;由于为每个token生成多个查询,单个token可以生成多个节点;b)anchor biaffine分类器(Dozat和Manning, 2017)在每个token的增强查询和上下文嵌入之间使用deep biaffine attention,将预测的节点映射到表面token;C)edge biaffine分类器使用两个deep biaffine attention模块来处理生成的节点,并预测一对节点与边缘标签之间的边缘是否存在。

给定一段文本,EventGraph生成相应的图,从节点和边中抽取事件提及的结构化信息并不费力。

3、结果

【论文速递 | 精选】

论坛地址:https://bbs.csdn.net/forums/paper

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/392702.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

sql server 对比两个查询性能 ,理解Elapsed Time、CPU Time、Wait Time

分析 SET STATISTICS TIME ONyour sqlSET STATISTICS TIME OFF由上图分析: cpu time 是查询执行时占用的 cpu 时间。如果了解系统的多任务机制,就会知道系统会将整个 cpu 时间分为一个一个时间片,平均分配给运行的线程——一个线程在 cpu 上运行一段时间…

《PyTorch深度学习实践9》——卷积神经网络-高级篇(Advanced-Convolution Neural Network)

一、1∗11*11∗1卷积 由下面两张图,可以看出1∗11*11∗1卷积可以显著降低计算量。 通常1∗11*11∗1卷积还有以下功能: 一是用于信息聚合,同时增加非线性,1∗11*11∗1卷积可以看作是对所有通道的信息进行线性加权&…

Air101|Air103|Air105|Air780E|ESP32C3|ESP32S3|Air32F103开发板:概述及PinOut

1、合宙Air101(芯片及开发板) 合宙Air101是一款QFN32 封装,4mm x 4mm 大小的mcu。通用串口波特率,设置波特率为921600。 ​ 管脚映射表 GPIO编号 命名 默认功能及扩展功能 0 PA0 BOOT 1 PA1 I2C_SCL/ADC0 4 PA4 I2C_S…

前端必备技术之——AJAX

简介 AJAX 全称为 Asynchronous JavaScript And XML,就是异步的 JS 和 XML(现在已经基本被json取代)。通过 AJAX 可以在浏览器中向服务器发送异步请求,最大的优势:无刷新获取数据。AJAX 不是新的编程语言,而是一种将现有的标准组…

揭秘关键一环!数据安全服务大盘点

数据安全服务,数据安全体系建设的关键一环。通过数据安全服务解决数据安全建设难题,得到越来越多的重视。不久前,《工业和信息化部等十六部门关于促进数据安全产业发展的指导意见》发布,明确“壮大数据安全服务”,推进…

VScode 插件【配置】

写这篇博客的原因: vscode 很久以前的插件,忘记是干什么的了记录 vscode 好用的插件 插件介绍(正文开始) Auto Rename tag 开始/关闭标签内容 同步 Chinese (Simplified) VScode 中文化 CSS Peek 通过 html 代码查找到引用的样式…

Linux - 磁盘I/O性能评估

文章目录概述RAID文件系统与裸设备的对比磁盘I/O性能评判标准常用命令“sar –d”命令组合“iostat –d”命令组合“iostat –x”单独统计某个磁盘的I/O“vmstat –d”命令组合小结概述 RAID 可以根据应用的不同,选择不同的RAID方式 如果一个应用经常有大量的读操…

Flink(Java版)学习

一、Flink流处理简介 1.Flink 是什么 2.为什么要用 Flink 3.流处理的发展和演变 4.Flink 的主要特点 5.Flink vs Spark Streaming 二、快速上手 1.搭建maven工程 2.批处理WordCount 3.流处理WordCount 三、Flink部署 1.Standalone 模式 2.Yarn 模式 3.Kubernetes 部署 四、F…

PyTorch深度学习:60分钟入门

PyTorch深度学习:60分钟入门 本教程的目的: 更高层级地理解PyTorch的Tensor库以及神经网络。训练一个小的神经网络来对图像进行分类。 本教程以您拥有一定的numpy基础的前提下展开 Note: 务必确认您已经安装了 torch 和 torchvision 两个包。 这是一个基于Pytho…

Cannot resolve symbol ‘String‘或Cannot resolve symbol ‘System‘ ——IDEA

IDEA中运行报错,“Cannot resolve symbol ‘String‘”解决方案 ‘System‘解决 参考一:(31条消息) IDEA2021 提示“Cannot resolve symbol ‘String‘”解决方案_idea无法解析符号string_YT20233的博客-CSDN博客https://blog.csdn.net/CNMBZY/article…

docker 的安装与卸载

一 卸载旧版本的 Docker 1.列出系统中已安装的docker包 yum list installed | grep docker 示例 2.卸载docker yum -y remove docker-ce-cli.x86_64 yum -y remove docker-ce.x86_64 yum -y remove containerd.io 示例 二 Docker的安装 1.安装 Docker 所需的依赖&#…

虹科方案| 助力高性能视频存储解决方案-1

虹科电子科技有限公司是ATTO技术公司在中国的官方合作伙伴。依附于我们十多年的客户积累和方案提供经验,虹科与 ATTO共同致力于为数据密集型计算环境提供网络和存储连接以及基础架构解决方案,为客户提供更高性能的产品与服务。无论您的工作流程面临何种挑…

分页插件——PageHelper

文章目录1 分页查询——分页插件(PageHelper)1.1 概述1.2 代码实现1.2.1 在pom.xml引入依赖1.2.2 Mapper数据访问层实现1.2.3 Service业务逻辑层实现1.2.4 postman测试试2 带条件的分页查询——分页插件(PageHelper)2.1 需求2.2 代…

ubuntu 20.04安装ROS体验小海龟转圈圈

文章目录前言一、ros安装1、添加ROS软件源:2、添加密钥:3、安装ROS:4、初始化rosdep:5、设置环境变量:6、安装rosinstall二、体验小海龟案例1.键盘控制小海龟:1、新建一个终端运行ros2、新建终端启动小海龟的仿真器3、…

网络资源面经3

文章目录hive 与 mysql 的区别类加载器的种类,有什么机制,机制有何用处MapReduce实现wordcount流程full GC 和 old GC 区别避免频繁的Full GChive 与 mysql 的区别 数据存储位置 hive数据存储在hdfs上,mysql的数据存储在本地磁盘中。数据规模…

自排查Nginx域名失效

静态分离 用户访问域名——>Nginx——>网关——>微服务 问题: 访问域名后发现不能跳转到首页 检查: 1.检测hosts文件 结果:正确配置域名没有发现问题 2.检查Nginx配置(Nginx总配置、服务配置) Nginx总配置 服…

【需求响应】基于数据驱动的需求响应优化及预测研究(Matlab代码实现)

👨‍🎓个人主页:研学社的博客💥💥💞💞欢迎来到本博客❤️❤️💥💥🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密…

SpringBoot+Vue中使用AES进行加解密(加密模式等对照关系)

场景 若依前后端分离版本地搭建开发环境并运行项目的教程: 若依前后端分离版手把手教你本地搭建环境并运行项目_霸道流氓气质的博客-CSDN博客 在上面搭建起来前后端架构之后,在前后端分别进行AES方式的加解密。 AndroidJava中使用Aes对称加密的工具类…

内存泄漏分析及规避方法

啥是内存泄漏?内存泄漏就是堆内存中的某些对象,你虽然不再使用它们了,但是垃圾回收器还回收不了他们,长此以往内存就慢慢耗没了。内存泄漏怎么检测?如果你的服务经常占用内存很大,慢慢隔一段时间需要重启一…

Linux学习第十三节-软件包

1.分类 二进制包 rpm包 2.软件包管理 软件包之间的依赖关系 命令格式:rpm [选项] 软件包 常用选项: -q #仅查询软件是否安装 -qa #列出所有已经安装在系统中所有软件,可以和grep过滤指定的软件包 -qi #列出软件包详细信息&#xff0c…