【论文速递】COLING 2022 - 带有事件论元相关性的事件因果关系抽取

news2024/11/18 11:38:12

【论文速递】COLING 2022 - 带有事件论元相关性的事件因果关系抽取

【论文原文】:Event Causality Extraction with Event Argument Correlations

【作者信息】:Cui, Shiyao and Sheng, Jiawei and Cong, Xin and Li, Quangang and Liu, Tingwen and Shi, Jinqiao

论文:https://arxiv.org/pdf/2301.11621.pdf
代码:https://github.com/cuishiyao96/ECE

博主关键词:双网格标记方案、事件因果关系、类型增强

推荐论文:无

摘要

事件因果关系识别(ECI)是事件因果关系理解的重要任务,其目的是检测两个给定文本事件之间是否存在因果关系。然而,ECI任务忽略了关键的事件结构和因果关系组件信息,使其难以用于下游应用。在本文中,我们探索了一种新的任务,即事件因果关系抽取(ECE),旨在从纯文本中抽取因果事件对及其结构化事件信息。ECE任务更具挑战性,因为每个事件可以包含多个事件论元,在事件之间提出细粒度的相关性,以确定因果事件对。因此,我们提出了一种带有双网格标记方案(dual grid tagging scheme)的方法来捕获ECE的事件内和事件间论元相关性。在此基础上,我们设计了一种事件类型增强模型架构来实现双网格标记方案。实验证明了我们的方法的有效性,广泛的分析指出了ECE未来的几个方向。

1、简介

事件因果关系(Liu et al, 2020;Cao等人,2021)表示两个事件之间的明确因果关系,构成特定的因果事件对。如图1所示,Price Rise事件(全球油价上涨)和Cost Rise事件(国际航运业成本增加)之间存在因果关系。理解这样的事件因果关系可以促进各种下游应用,包括事件预测(Hashimoto等人,2014)、智能搜索(Rudnik等人,2019)和问题回答(Costa等人,2020),这对自然语言理解很重要。

近年来,它引起了事件因果关系识别(ECI)的研究兴趣(Liu et al., 2020; Cao et al.,2021;Zuo et al.,2021a,b, 2020;Tran Phu and Nguyen, 2021),旨在检测两个给定事件之间是否存在因果关系。尽管ECI任务取得了成功,但仍有两个问题未能解决。1)事件结构缺失,ECI中的每个事件仅使用反映其发生的单词或短语来表示,而忽略了显式的事件类型和事件论元(即参与事件的实体)。缺乏这样的事件结构将失去理解事件因果关系的有价值的线索。如图1所示,“oil”在Price Rise-type-cause事件中扮演了Product角色,这意味着对“shipping industry”产生了一个Cost Rise-type-effect事件。2)因果成分缺失(Causality Component Missing), ECI只预测给定事件对之间是否存在因果关系,忽略区分具体的因果事件因果成分。受这些问题的限制,ECI对事件之间的因果关系探究不足,这就需要对事件因果关系的认识进一步提升。

在CCKS(2021)中关于事件因果关系的讨论的激励下,我们制定了一个被称为事件因果关系抽取(ECE)的任务。如图1所示,ECE旨在端到端地从纯文本中抽取带有结构化事件信息的因果事件对。与ECI相比,ECE阐明了事件因果关系,包括事件结构,即事件类型和论元,以及具体的因果关系组件,使其更有信息性,以支持各种下游应用(Wang et al, 2021a)。

直观地说,可以通过依次抽取结构化事件,然后对它们的因果关系进行分类来实现ECE。不幸的是,这样的范例很容易出现冗余事件对问题,其中不可避免地会抽取与因果关系无关的事件,从而混淆因果关系决策。另一个有希望的方向是借用关系三元组抽取(RTE)的思想,它们共享类似的任务公式。然而,与以实体为中心的RTE任务相比,以事件为中心的ECE提出了新的挑战:1)事件内论元相关性(Intra-event Argument correlation)。具体而言,ECE侧重于事件,这是一种保持其论元之间相互关联的结构。例如在图1中,Demand Rise事件中的论元“new energy”和“Ammonia fuel”具有很强的语义相关性。虽然RTE侧重于单个实体,因此简单地采用RTE模型无法捕获此类相关性来派生事件结构。2)事件间论元相关性。具体地说,因果事件对中涉及的事件论元通常显示因果关系推断的语义相关性。如图1所示,发生在“worldwide” Region 的事件Pricing_Rise可以暗示发生在“international” region的事件Cost_Rise。结果表明,事件间论元相关性不仅为确定因果关系提供了重要线索,而且有利于可靠的因果事件抽取,且因果对之间相互确认。

在本文中,我们提出了一种名为DualCor的有效方法,它利用ECE的双网格标记方案探索了事件内和事件间的论元相关性。具体来说,DualCor包含两个关于事件类型和输入句子的网格标记表,分别派生因果事件的事件结构。在每个表中,DualCor根据不同的事件类型抽取结构化的事件论元,自然地考虑到事件内部论元的相关性。此外,在预测原因/结果表中的事件论元时,DualCor还预测它们对应的结果/原因事件论元,作为辅助论元来促进事件论元之间的相关性。通过确认另一个表中的辅助论元,DualCor匹配可靠的因果事件对作为预测。为了实现上述双网格标记方案,我们进一步设计了一种类型感知编码器,该编码器利用基本事件类型信息细化文本表示,以增强论元预测。我们在可感知类型的文本表示上进行双网格标记,以导出最终的因果事件对。总体而言,我们的主要贡献包括:

(1)为了促进对事件因果关系的理解,我们制定了一个新的任务,称为事件因果关系抽取(ECE),它继承了ECI,推动了对事件因果关系理解的研究。

(2)我们提出了一种新颖的方法DualCor,以利用ECE的事件内和事件间的论元相关性,并将其作为激励后续研究的基线。

(3)在ECE数据集上的实验反映了DualCor的有效性,广泛的分析显示了未来工作的潜在研究方向。

2、模型方法

本节介绍了我们提出的ECE双网格标记方案,包括标记方案及其解码策略。第5节介绍了模型的具体实现。

标记模式:一般情况下,我们为因果事件分别构建了两个网格标记表,每个表抽取了句子中可能发生的所有事件。在形式上,给定一个 n n n个token句和 m m m个预定义的事件类型,我们分别为原因和结果事件构造两个 m × n m × n m×n的网格表。如图2所示,每行表示同一事件类型中的论元,而每列表示根据事件类型分配给句子中的token的标记。

对于表格中的每一行,我们用一个{Cor-Rol-Bdy}形式的标签填充它,该标签由三个字段组成,分别是correlation-fieldrole-fieldboundary-field:

(1)对于boundary-field: B d y ∈ { S t a , E n d } Bdy∈\{Sta, End\} Bdy{Sta,End},我们设计它来表示论元跨度的起始位置和结束位置。例如,在图2(a)中,我们通过匹配Cor-Rol-StaCor-Rol-End标记来匹配论元“corn seeds”。

(2)对于role-field: R o l ∈ { R o l i } i Rol∈\{Rol_i\}_i Rol{Roli}i ( i i i为角色索引),我们设计它来表示一个事件中每个论元的事件角色,从而构成一个事件结构。例如,在图2(a)中,我们根据Price_Rising行中的Cor-Product-Bdy标签,将论元“corn seeds”确定为Price_Rising类型事件中的Product-role论元。

(3)对于correlation-field: C o r ∈ { I n t r a , I n t e r } Cor∈\{Intra, Inter\} Cor{Intra,Inter},我们设计它来表示因果事件对中的事件论元相关性。具体来说,Intra表示一个因果关系组件中属于同一事件的论元,而Inter表示另一个因果关系组件中的论元。例如,在预测原因表中的原因事件时,我们不仅预测具有原因事件类型的原因论元(标记为Intra),还预测潜在的结果论元(标记为Inter),作为因果对匹配中相互确认的辅助论元。图2(a)显示,我们不仅使用Intra为Price_Risetype原因事件预测论元“corn seeds”,而且还使用Inter标记作为影响事件论元预测“corn planting”。通过将论元“corn planting”与effect表中的Intra标记相匹配,我们可以派生一个Price_Rise类型和Profit_Decline类型的事件对。

在标记方案的基础上,该模型可以自然地抽取因果关系事件对及其论元。此外,该方案在单独的类型行中学习每种类型的事件论元,允许模型考虑与特定类型信息的内部事件论元相关性。此外,标记方案强制模型从一个因果关系组件中抽取论元,感知另一个因果关系组件中的论元,从而捕获事件之间的论元相关性。

解码策略:在标记方案的基础上,介绍了标记结果的解码策略。具体来说,我们将该过程分解为论元跨度解码、事件结构解码和因果对解码三个步骤。附录A还提供了这三个步骤的图形说明。

步骤1,论元跨度解码。为了推导因果事件的论元范围,我们采用了最接近的起始-结束匹配原则(Wei et al, 2020)。具体来说,对于在同一行中具有相同的correlation-field和role-filed的条目标签,我们根据位置字段将起始位置与最近的结束位置匹配,以获得候选论元跨度。例如,在图2(a)中,这一步应该预测“agriculture products”、“nationwide”、“corn seeds”、“corn planting”和“across the country”作为候选论元范围。

步骤2,事件结构解码。为了获得因果事件的事件结构,我们收集附加到相同事件类型的候选论元范围。具体来说,我们将事件论元与属于同一行的相关字段Intra合并,从而生成结构化的候选事件。例如,在图2(a)中,给定步骤1中的候选论元范围,该步骤应该选择带有Intra标记的“agriculture products”、“nationwide”和“corn seeds”作为price_rising类型的候选原因事件论元。

步骤3,因果对解码。为了获得因果关系对,我们匹配候选因果事件之间的事件间相关论元。具体来说,我们搜索同时关联相关字段Intra和Inter的两个事件表中同时出现的论元,然后确认因果事件论元。例如,在图2(a)中,给定步骤2中的候选事件论元,这一步应该选择“nationwide”和“corn seeds”作为真正的原因事件论元,因为在效果表中也存在带有Inter标记的“nationwide”和“corn seeds”(图2(b))。类似地,该步骤还选择“corn planting”、“across the country”作为profit_decline类型效应事件中的论元。相应地,它预测price_rise类型的原因和profit_decination类型的结果事件对,如图3所示。请注意,尽管“agriculture product”也是步骤2中price_rise类型事件的事件论元候选,但由于effect表中缺乏Inter correlation,因此它不包括在因果关系对中。

3、实验结果

1、Event-then-Causality方法效果普遍较差,没有不考虑因果关系,许多与因果关系无关的事件被错误地抽取出来,这将使因果关系决策混淆。

2、Event-with-Causality结果相对较好,但是没有考虑面向实体的关系建模策略不能充分地探究事件之间的内在相关性和相互相关性。

3、DualCor的效果最好。

【论文速递 | 精选】

论坛地址:https://bbs.csdn.net/forums/paper

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/375477.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android NDK动态加载SO库

背景对于一个普通的android应用来说,so库的占比通常都是巨高不下的,因为我们无可避免的在开发中遇到各种各样需要用到native的需求,所以so库的动态化可以减少极大的包体积,自从2020腾讯的bugly团队发部关于动态化so的相关文章后&a…

fuse:纠结的page下刷流程之fuse_writepage_in_flight

fuse:纠结的page下刷流程细节之fuse_writepage_in_flightfuse_writepage_in_flight硬爬代码自己理解消化作者本人如是说fuse_writepage_in_flight 先说下这个函数,位于fs/fuse/file.c,这里以4.19内核来分析。因为这个函数里面藏了很多小细节…

华为OD机试模拟题 用 C++ 实现 - 删除指定目录(2023.Q1)

最近更新的博客 【华为OD机试模拟题】用 C++ 实现 - 最多获得的短信条数(2023.Q1)) 文章目录 最近更新的博客使用说明删除指定目录题目输入输出示例一输入输出说明Code使用说明 参加华为od机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。 华为…

Macbook M1 安装PDI(Kettle) 9.3

Macbook M1 安装PDI(Kettle) 9.3 当前 PDI(Kettle)最新版为9.3,依赖Java JDK 11。因为没有专门用于 M1的程序,需要下载并安装x86_64架构的JDK及依赖软件,并 “强制在Intel模式下运行shell” 的方式来实现 Kettle 的正…

骨传导蓝牙耳机排行,盘点几款性能不错的骨传导耳机

随着蓝牙耳机的普及,骨传导耳机也越来越受到欢迎,很多人也都开始在了解并尝试骨传导耳机。相比于其他类型耳机,在舒适度、安全方面有一定优势。尤其是在户外运动时,或者长时间佩戴运动时,使用骨传导耳机可以避免耳朵因…

从“入门”到“专家”,一份3000字完整的性能测试体系的知识分享

随着科技的飞速发展,软件产品广泛应用于各个行业领域,人们对计算机和网络的依赖性越来越大,对新奇事物也越来越感兴趣,成千上万的用户活跃在庞大的网络系统中,这给提供服务的系统带来严重的负荷,"高并…

QT之图形视图框架概述——Graphics View Framework

QT之图形视图框架概述——Graphics View Framework1. 概述2. 核心类3. 事件传递4. Graphics View 坐标系统5. 参考1. 概述 Graphics View Framework是子Qt 4.2引入的,用来取代之前版本中的QCanvas。Graphics View Framework提拱了用于大量2D图形项的管理和交互的能…

Spring Boot 统一功能处理(用户登录权限效验-拦截器、异常处理、数据格式返回)

文章目录1. 统一用户登录权限效验1.1 最初用户登录权限效验1.2 Spring AOP 统一用户登录验证1.3 Spring 拦截器1.4 练习:登录拦截器1.5 拦截器实现原理1.6 统一访问前缀添加2. 统一异常处理3. 统一数据格式返回3.1 统一数据格式返回的实现3.2 ControllerAdvice 源码…

day21_IO

今日内容 上课同步视频:CuteN饕餮的个人空间_哔哩哔哩_bilibili 同步笔记沐沐霸的博客_CSDN博客-Java2301 零、 复习昨日 一、作业 二、File 三、IO流 四、字节输入&输出流 零、 复习昨日 见晨考 一、作业 见答案二、File 2.1 介绍 File,通过一个路径代表文件或者文件夹 …

Panda Farm:首个部署在 Arbitrum 上的轻量化 GameFi 游戏

在2月16日,Bitget平台宣布 Launchpad 重新启动,并推出了重启后的首个项目 Panda Farm(BBO),该 Launchpad 启动后得到了较高的关注。 Panda Farm 是部署在 Arbitrum 上的 GameFi应用,这可能首先意味着 Bitge…

技术干货 | Modelica建模秘籍之状态变量

在很多领域都有“系统”这个概念,它描述的往往是一些复杂关系的总和。假如我们将系统看做一个黑箱,那么,在系统的作用下,外界的输入有时会产生令人意想不到的输出,“蝴蝶效应”就是其中的典型案例。图1 一只南美洲亚马…

RPC编程:RPC框架设计目标

一:前导知识 Http是超文本传输协议,跨平台性非常好。Http可以传输文本,更多的时候传输的是文本,我们也是可以传输二进制的,我们基于Http进行下载的时候,就是走的Http协议。 Tcp协议,处理的时候…

OpenShift 4 - 使用辅助安装器安装单节点 OpenShift

文章目录单节点 OpenShift 和 OpenShift 辅助安装器单节点 OpenShiftOpenShift 辅助安装器使用辅助安装器安装单节点 OpenShift本文使用的安装环境准备环境在宿主机上安装 KVM 环境创建 SSH 证书根据集群配置,用辅助安装器生成 Discovery ISO用 Discovery ISO 启动 …

SpringBoot整合(五)HikariCP、Druid数据库连接池—多数据源配置

在项目中,数据库连接池基本是必不可少的组件。在目前数据库连接池的选型中,主要是 Druid ,为监控而生的数据库连接池。HikariCP ,号称性能最好的数据库连接池。 在Spring Boot 2.X 版本,默认采用 HikariCP 连接池。而…

黑客入门教程(非常详细)从零基础入门到精通,看完这一篇就够了

这篇文章没有什么套路。就是一套自学理论和方向,具体的需要配合网络黑白去学习。毕竟是有网络才会有黑白! 有自学也有培训! 1.打死也不要相信什么分分钟钟教你成为大黑阔的,各种包教包会的教程,就算打不死也不要去购买那些所谓的…

【C语言每日一题】判断字符串旋转结果(附加字符串左旋详解)

【C语言每日一题】—— 判断字符串旋转结果😎😎😎 目录 💡前言🌞: 💛字符串左旋题目💛 💪 解题思路的分享💪 😊题目源码的分享&#x1…

Aspose.Slides for .NET 授权须知

Aspose.Slides是一款用于生成,管理和转换PowerPoint幻灯片的本机API,可以使用多种格式,而不需要Microsoft PowerPoint。并且可在任何平台上操作PowerPoint演示文稿。 Aspose.Slides for .NET是一款.NET PowerPoint管理API,用于读…

资产设备防拆标签安全防护和资产定位解决方案

随着社会经济的发展和高新技术的日新月异,对各方面的安全要求也在不断地提高,以物联网安防、入侵报警和出入口控制、应急系统等为主的安全防范系统日益成为各类文物场所智能化弱电工程不可或缺的组成部分,是重点资产管理场所内加强管理和安全…

spring源码编译

spring源码编译1、安装gradle2、拉取源码3、配置gradle文件来源及镜像仓库4、预编译5、验证6、可能遇到的报错6.1、jdk.jfr不存在6.2、checkstyleMain6.3、org.gradle.api.artifacts.result.ComponentSelectionReason.getDescription()Ljava/lang/String6.4、其他jdk&#xff1…

做「增长」必须懂的6大关键指标

无论你所从事的是哪个行业,增长都不是一件易事,SaaS公司想要维持长期的增长更是难上加难。这是因为SaaS公司对未来回报的依赖程度更大,反观那些传统商业模式的公司,主要的收入来源都集中在产品购买交付的时点上,而客户…