ACL 2023长文 | 基于能量超球体模型提升以事件为中心的结构化预测

news2024/9/29 3:32:47

4f6a16428d3ad5a9d0b13d5d34b408f5.gif

ebf5d09495e08b606d90417048932f40.png

论文标题:

SPEECH: Structured Prediction with Energy-Based Event-Centric Hyperspheres

收录会议:

ACL 2023 Main Conference

论文链接:

https://arxiv.org/abs/2305.13617

开源链接:

https://github.com/zjunlp/SPEECH

8ade30f2a14ea05a336cb8c3e94ac4dc.png


总述

以事件为中心的结构化预测旨在输出事件的结构化组件。事件结构往往比较复杂,而且结构间存在多种依赖,比如 Token 之间的长距离依赖、触发词和事件类别之间的关联、以及事件类别和事件关系之间的依赖。

为了解决这些问题,本文提出了基于能量的超球体(SPEECH)以解决以事件为中心的结构化预测任务。SPEECH 使用基于能量的建模对事件结构化组件之间的复杂依赖进行建模,并使用简单但有效的超球体来表示事件类别。在 MAVEN-ERE 和 OntoEvent-Doc 两个事件数据集上进行的实验表明,SPEECH 模型在事件检测和事件关系抽取任务上表现不俗。

29431ed9fb64853a9208cb8f5aed1266.png

▲ 以事件为中心的结构化预测任务示例

3b0da332b3950b56dd17af407d1abbcb.png

方法

SPEECH 模型的设计灵感主要来源于万有引力定律和能量函数。如果把抽象的事件类别看成电子核/恒星,其对应的样本就可看成核外电子/行星。因此本文提出利用基于能量的超球体来建模事件类别及其样本。模型主要与 token、sentence、document 三种维度的能量相关联。

8485343c53b7a34ccda7c92e2beb0d8a.png

▲ SPEECH模型概览

(1)Token 级别的能量

能量函数:

db0c08c548149a25952bf7ff380e80c5.png

损失函数:

1db0ccca48efbab096c76f626671b0ba.png

这里主要考虑了 token 之间(local)和 token 类别之间(label)的能量。

(2)Sentence 级别的能量

本文用一个基于能量的超球体来表示每个事件,事件类别表示成球体质心,事件样本被尽可能约束在球体表面,超球体的度量公式表示为:

adddc12679f59b51c17d5f249f540fe6.png

能量函数:

da373a9f75062899737c44e0e7c50566.png

损失函数:

0e08c205184d430b8519f19f226bc996.png

这里主要考虑了事件之间(local)和事件类别之间(label)的能量。


(3)Document级别的能量

能量函数:

b735b73de65b6d2387c6e502d7f3a945.png

损失函数:

232504e83d4c0bd9cec86f9ca76f983c.png

这里主要考虑了事件对之间(local)和事件关系类别之间(label)的能量。

2f5f8049c342a2a3bd6e4459246a08b7.png

实验

本文主要在三类以事件为中心的结构化预测任务上进行了实验,用到的数据集是最新发布的 MAVEN-ERE 以及 OntoEvent-Doc。由于 MAVEN-ERE 没有直接发布测试集标签,本文的实验是在 MAVEN-ERE 的验证集以及 OntoEvent-Doc 的测试集上进行的。

(1)触发词分类(针对token)

ef12d1a7f7f4e198b864315f85e49bcb.png

(2)事件分类(针对event mention)

9ba0aa6160266ca1cd8ded5b9ae290b8.png

(3)事件关系抽取(针对event mention pair)

676f803c134d0e8f9a686e15686f30dd.png

可以发现 SPEECH 模型在 MAVEN-ERE 数据集的触发词分类以及事件分类任务上表现颇佳,在 OntoEvent-Doc 数据集的触发词分类以及事件关系分类上优势明显。总体来看 SPEECH 模型表现不俗,但其效果也会受到数据集以及数据分布的影响。

如果对本文工作感兴趣,文章详细信息可以查看论文。

更多阅读

61b709f87336988c00a90147f3d9f22a.png

bf360216d6a2acda0e38d4f5bbcb0ec2.png

8166dbdf1ce9b90af935e8587e793bfb.png

4dbb24406c0aea906654abe907dd4e10.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

ec9d1a0daa2fb23aea2e50da584c042b.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

901235be2cbb6c94f3d3b66140eb452d.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/711804.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

硬件知识:条码打印机5大接口类型介绍

目录 1、串口 2、并行接口 (并口) 3、USB接口 4、网口 5、PS/2接口 接口选择的不同,其打印输出的速度也不同。 条码打印机与计算机之间都是通过接口连接的,条码打印机常见的分为5种接口:串口(也有称之…

分布式学习第五条 Nginx + FastDFS

使用nginx和FastDFS可以实现下载,类似百度网盘,需要对环境进行配置,nginx作为代理服务器,fastDFS负责执行上传下载操作。 1. 文件上传下载流程 文件上传流程 文件下载流程 优化 优化思路: 直接让客户端连接fastDFS的存储节点, …

Flutter之 Bloc实战实现购物车功能

Flutter之 Bloc实现购物车功能 前言商品列表模块状态设置UI设计业务逻辑测试代码购物车模块状态设置业务逻辑UI设计加入购物车测试代码参考资料前言 本篇以官方购物车项目为例,说明Bloc在Flutter的应用。该项目很简单,就两个模块,一个是商品列表页面模块catalog,一个是购物…

使用gradio库的File模块实现文件上传和展示

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

MATLAB迭代

目录 黄金分割比 习题 符号运算 固定点 WHY hello world Goldrect 黄金分割比 format for循环 %% For loopx 42for k 1:12x sqrt(1x);disp(x)end while循环 %% While loopx 42;k 1;while abs(x-sqrt(1x)) > 5e-5x sqrt(1x);k k1;endk 绘图语句 %% Plotx -pi:…

现在的前端,到底是技术深度重要,还是技术广度重要?

前言 大家好,,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心。 前几天跟朋友讨论“技术广度和技术深度哪个重要”,再想想自己像过山车一般的前端历程,有感而发,想给小兄弟们一…

简单的学习下 JavaScript 录屏API

学习如何使用这个简单易用的API进行屏幕共享、屏幕录制等操作。尽管需要对JavaScript有一定的了解&#xff0c;但我相信你已经具备了这方面的知识。 1、开始录制 让我们创建一个按钮&#xff1a; <button id"recording-toggle">Start recording</button>…

BUUCTF变异凯撒

根据题目可以得知&#xff0c;这道题使用的是凯撒密码 凯撒密码&#xff0c;是一种位移加密方式&#xff0c;只对26个字母进行位移替换加密&#xff0c;规则简单&#xff0c;容易破解。 但是根据题目下发的文件看来&#xff0c;出现了关于除字母以外的字符&#xff0c;结合题目…

综合评价算法 | Matlab实现基于变异系数法的综合评价算法

文章目录 效果一览文章概述研究内容源码设计参考资料效果一览 文章概述 综合评价算法 | Matlab实现基于变异系数法的综合评价算法 研究内容 变异系数法是根据统计学方法计算得出系统各指标变化程度的方法,是一种客观赋权法。根据该方法变化差异较大的指标权重较大,变化差异较…

【C++ 实现】图论概念,最小生成树,单/多源最短路径实现

文章目录 数据结构表示图最小生成树KruskalPrim 最短路径DijkstraBellman-Ford算法多源最短路径&#xff1a;FloydWarshall 总结 数据结构表示图 首先节点的存取&#xff0c;V是节点key&#xff0c;vector<pair<V,V>> map;其实已经能表达一个图了&#xff0c;但是…

MWCS 2023,到底有些啥?(上篇)

大家好&#xff0c;MWCS 2023&#xff08;世界移动通信大会上海展&#xff09;已经结束了。按照老规矩&#xff0c;我来给大家汇报一下现场情况。 █ 展会总结 今年是MWC在中国的第十届&#xff0c;也是疫情管控解除后的第一届。从总体情况来看&#xff0c;人气非常火爆。展区人…

ElasticSearch - 根据经纬度,简单搜索指定距离范围内的数据

ES的地图检索方式 ES支持的地图检索方式有以下几种&#xff1b; geo_distance geo_bounding_box geo_polygon 1、geo_distance&#xff1a;直线距离检索&#xff0c;如给定点A&#xff0c;要求返回地图上距离点A三千米的商家&#xff08;点外卖场景&#xff09; 2、查找索引…

下半年就该这么干!

阅读本文大概需要 0.99 分钟。 周末一般不更新&#xff0c;不过今天有点特殊。 是这样的&#xff0c;前几天不是通知说我们 7 月 8 日会在杭州举办线下大会么&#xff1f;完了之后发现后台很多私信问怎么参加的&#xff0c;这才想起我这个公众号还没发让大家进预约群的入口。。…

前端使用mysql记录。以本机作为服务器,安装mySql。Dbeaver的基本使用

安装 Mac 上如何安装Mysql&#xff1f; Mac 上如何安装Mysql&#xff1f; Mysql 配置 在mac终端打开文件&#xff1a;vi ~/.bash_profile 加入语句&#xff1a;PATH$PATH:/usr/local/mysql/bin 使配置的语句生效&#xff1a;source ~/.bash_profile 使用命令行 sudo vi /et…

【读书笔记】《月亮与六便士》- [英] 威廉·萨默塞特·毛姆 - 1919年出版

不停的阅读&#xff0c;然后形成自己的知识体系。 2023.07.03 读 一直听说毛姆的大名&#xff0c;却一直没有拜读。记得《小王子》中有读者提到这本书&#xff0c;看了眼作者竟然发现是毛姆。那么毫不犹豫的&#xff0c;赶紧拜读一番。 文章目录 作家榜推荐词第一章第二章第三…

Spring核心原理解析

1.Bean的生命周期底层原理 AppConfig package com.zhouyu;import com.zhouyu.service.OrderService; import org.springframework.context.annotation.*;ComponentScan("com.zhouyu") public class AppConfig {Beanpublic OrderService orderService1(){return new…

微机实验一:认识实验系统和联机通讯实验

实验目的 讲清楚进行本实验后要学到的知识、掌握的数据结构及共定义和农示方法&#xff0c;讲清楚所采用的算法 wrTPL-486微机原理及接口技术数学实验手统的操u)孰秀TPC-480联机集闯开发调试故件的操作环境3)3俩文丝计体机的基阻成和4、存储器并有接新i的置(了解岗单汇海语谢设…

Nginx【location指令、虚拟主机的分类、Nginx支持三种类型的虚拟主机配置 】(三)-全面详解(学习总结---从入门到深化)

目录 Nginx配置指令详解_location指令 虚拟主机的分类 Nginx支持三种类型的虚拟主机配置 Nginx配置指令详解_location指令 配置location块 语法&#xff1a; URL // http://ip:port/ location [ | ~ | ~* | ^~] uri {... } 示例1 没有修饰符 表示&#xff1a;必须以指…

UE5 MetaHuman SDK插件的使用【二、聊天机器人】

目录 制作&#xff1a; 流程制作【相对复杂但逻辑清楚】&#xff1a; 快速制作【有个函数把上面的流程全部合在了一起&#xff0c;只需要用一个函数即可】 3个结构体的参数 combo后面的逻辑&#xff1a; 效果&#xff1a; ​编辑 代码 在前面的文章中&#xff0c;我们创…

geoserver发布arcgis server离线瓦片

1.使用tif文件也可以发布服务&#xff0c;但是我下载的tif文件发布的服务总数模糊不清&#xff0c;原因可能是地图比例尺问题。 2.仔细研究&#xff0c;发现下载的arcgis server瓦片都是高清的&#xff0c;于是想到直接加载arcgis瓦片&#xff0c;这样图片/坐标系之间问题都完…