论文综述——UNIRE: A Unified Label Space for Entity Relation Extraction

news2024/11/17 21:21:05

UNIRE: A Unified Label Space for Entity Relation Extraction

  • 1 任务介绍
  • 2 UniRE模型
  • 3 实验
  • 4 总结

1 任务介绍

过构建标签空间来对实体和关系进行联合抽取的方法。

实体关系抽取旨在提取文本中的实体并检测它们的实体类型,以及对每个实体对检测它们的关系。作者提出了一种统一标签空间的联合抽取方法——填表法,主要是将实体检测和关系抽取两个子任务放在同一个标签空间中进行处理。针对该方法,提出了一种对应的联合解码算法(Joint Decoding Algorithm),解码出表中的实体和关系。

在这里插入图片描述

图中词对关系表。将文本表示为二维表结构,它具有更强的表示能力,能将所有的实体和关系都在这张表中完整得表示出来。其中,实体类型:(PER, 人名实体),(GPE, 地理位置实体);关系类型:(PER-SOC, 社会关系),(ORG-AFF, 机构附属关系),(PHYS, 位置临近关系)

在这个表中每个单元格对应于一个单词对,使用不同颜色表示不同的实体或关系类型。对角线上的正方形表示实体类型,而关系是对角线外的矩形。

表可以识别对称性和重叠关系:

  • 对称性:对称的关系类型在表中关于对角线对称的,表中紫色单元格表示了两对儿对称的关系类型PER-SOC,而绿色单元格表示的PHYS和蓝色单元格表示的ORG-AFF则分别表示了两种不同的不对称关系类型。
  • 重叠关系:表前两行中,黄色单元格表示了David Perkins(大卫·帕金斯)属于PERson类别的实体,而紫色和绿色单元格分别表示David Perkins(大卫·帕金斯)关于wife和California(加利福尼亚)的关系,其中紫色单元格表示的是一种对称关系,另一种绿色单元格表示的是不对称的关系。

2 UniRE模型

UniRE模型采用了一个基于预训练模型的双仿射模型来建模单词对之间关系。

在这里插入图片描述

输入序列通过预训练语言模型(PLM) 学习上下文表示

在这里插入图片描述

为了更好地编码表中的单词的方向信息,使用两个多层感知器(MLP) 分别学习每个单词的头部和尾部投影表示,使得模型能够识别每一个单词的头部或尾部角色信息

在这里插入图片描述

使用双仿射注意力机制得到每一个单元格对应的打分向量(scoring vector)

在这里插入图片描述
在获得打分向量后,将其送入softmax中计算每一个单元标签的概率分布

在这里插入图片描述

填表的目标函数(交叉熵损失):

在这里插入图片描述
为了更好地填表,提出了对称性和蕴含性两方面的约束限制

  • 对称性:对于实体和对称关系,其对应的正方形和矩形必然关于对角线对称。因此,这些标签对应的概率分数应该关于对角线对称。

在这里插入图片描述

  • 蕴含性:给定一个关系,参与这个关系必然是两个实体;相反给定两个实体,它们之间不一定存在关系。因此,一个关系的概率分数应该不高于其两个实体的概率分数。

在这里插入图片描述

联合解码算法(joint decoding algorithm)

  • 首先是解码跨度span,就是划分实体边界,(图①,最右侧)x1和x2这两个单词表示一个实体,所以将此处两行、两列划分到一处。(图①,从左到右)这个模型是先将模型预测的三维概率张量按行列展成二维矩阵,然后计算相邻行列之间的欧式距离,将行列距离的平均值作为最终距离,来判断此处是否为切分点。
  • (图②)在划分完实体边界后进行实体解码,计算对角线上的每个正方形分数,来确定最终实体类型。
  • (图③)关系解码与实体解码类似,是通过计算非对角线上的矩形的分数确定关系类型的。

在这里插入图片描述

3 实验

在这里插入图片描述
三个常用的实体关系抽取数据集(ACE04,ACE05,SciERC)上和SOTA方法做对比。结果表明,并没有太大的提升,但是它的优势主要体现在推理速度层面,与SOTA相比参数量仅为其的一半,而且推理速度加快了十几倍。

在这里插入图片描述

4 总结

作者提出了一种填表法的联合学习方法,在少量参数和快速推理的情况下结果有相应的提升。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/133724.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MAX78000FTHR简单介绍与初次上手

特点 MAX78000FTHR是基于MAX78000的小型板微控制器单元(MCU)。 该 MCU 面向在边缘运行的人工智能 (AI) 应用程序。在这种情况下,“边缘”并不意味着技术的前沿(尽管这就是芯片);这意味着靠近需要它的地方…

vector对于自定义类型的操作(memcpy浅拷贝问题)

目录 如果对于不涉及资源管理的自定义类型的操作(Date): 对涉及资源管理类操作(String): 一、插入四个元素(代码正常编译没有任何资源泄露问题) 二、当插入第五个元素时&#xf…

【C++进阶】Map 和 Set(详解)

🌈欢迎来到C专栏~~Map 和Set (꒪ꇴ꒪(꒪ꇴ꒪ )🐣,我是Scort目前状态:大三非科班啃C中🌍博客主页:张小姐的猫~江湖背景快上车🚘,握好方向盘跟我有一起打天下嘞!送给自己的一句鸡汤&am…

【JavaScript】DOM 的概念、获取DOM元素和操作元素属性

文章目录【JavaScript】DOM 的概念、获取DOM元素和操作元素属性一. 概念二. DOM 操作(1) 获取DOM元素的方式1. document 获取元素方法2. 通过 HTML5 新增的方法获取案例:登录界面密码显示与隐藏(2) 读写元素内部的结构内容1. 改变元素节点里的内容2. 改变元素节点的…

操作系统的基本概念、功能、目标

文章目录🎀前言:本篇博客知识总览🪂操作系统所处位置📖操作系统的概念🎯操作系统的功能和目标🪅1.操作系统作为系统资源的管理者🪅2.操作系统作为用户与计算机硬件之间的接口🪅3.操作…

连接数据库和简单操作数据库

连接数据库和简单操作数据库JDBC程序编写步骤创建一个演员表数据库表的连接前置工作五种连接方式方式五的配置文件配置文件里面的内容通过JDBC进行对actor表操作。ideal执行后的结果数据库actor表结果JDBC程序编写步骤 1.注册驱动-加载Driver类 2.获取连接-得到Connection 3.执…

【阶段一】Python快速入门04篇:运算符、循环语句、条件语句与函数

本篇的思维导图: 运算符 算术运算符 算术运算就是常规的加、减、乘、除类运算。下表为基本的算术运算符及其示例。 描述 代码

【C++常用容器】STL基础语法学习map容器

目录 ●map基本概念 ●map构造和赋值 ●map大小和交换 ●map插入和删除 ●map查找和统计 ●map排序(map初始排序顺序为从小到大,用仿函数将其改为从大到小) ●map基本概念 map中的所有元素都是pair,pair中第一个元素为key&a…

【WeThinkIn出品】2022年度总结

Rocky Ding公众号:WeThinkIn写在前面 【WeThinkIn出品】栏目专注于分享Rocky的最新思考与经验总结,包含但不限于技术领域。欢迎大家一起交流学习💪 这篇文章发布的时候,应该已经是2023年了。在这里Rocky祝大家元旦快乐&#xff01…

前端最常用的几个线上设计网站

文章目录前言CoDesign 腾讯自研设计平台【墙裂推荐】蓝湖- 高效的产品设计协作平台【墙裂推荐】zeplin Deliver on the promise of design 【国外,不推荐】总结前言 随着IT技术的不断进步,很多团队都将很对线下工作转移到了线上,不仅便捷&a…

Ae 效果详解:毛边

Ae菜单:效果/风格化/毛边Effects/Stylize/Roughen Edges毛边 Roughen Edges效果可使得 Alpha 通道的边缘变粗糙,可以为图像添加各种边缘效果。通过分形影响改变边缘样式,并可增加颜色以模拟铁锈和其他类型的腐蚀。此效果可为文本或图形提供自…

算法之数组常见题目

数组是存储在连续内存空间上的相同类型数据的集合。在数组中可以方便地通过下标索引的方式获取对应的数据。 需要注意的是: 数组的下标都是从0开始的。数组在内存空间是连续的,所以删除或者增添元素时难免要移动其他元素的地址,只能覆盖。 …

【Kubernetes | Pod/容器】如何修改 Pod 中容器的守护进程

目录题1. 环境设定1.1 创建名为 vmware-nginx 的 Pod2. 查看容器默认守护进程2.1 查看容器所在节点2.2 查看容器ID2.3 查看容器中运行的进程信息3. 修改容器默认守护进程3.1 类比 Docker3.2 修改 YAML 文件改变默认守护进程参数说明4. 验证4.1 删除旧的 vmware-nginx.yaml 容器…

质性分析软件nvivo的学习(一)

1、软件安装: 科研也是需要投资的,建议淘宝购买软件,价格60米。 2、软件基础使用说明: 说明:以下笔记来源都是通过B站视频自学总结的,您可以选择通过下面的B站视频学习,也可以选择通过我总结的内容速学。…

(Week 9)图论(C++,Dijkstra,Floyd)

文章目录【深基18.例3】查找文献(C,图的遍历)题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1解题思路:【模板】floyd(C)题目背景题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1样例 #2样…

内核内存管理

1.内核内存管理框架 内核将物理内存等分成N块4KB,称之为一页,每页都用一个struct page来表示,采用伙伴关系算法维护 内核地址空间划分图: 3G~3G896M:低端内存,直接映射 虚拟地址 3G 物理地址 细分为&a…

我国软件供应链安全现状学习分析整理分享 附完整下载地址

声明 本文是学习2021年中国软件供应链安全分析报告. 下载地址而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 一、前言 数字化时代,软件无处不在。软件如同社会中的“虚拟人”,已经成为支撑社会正常运转的最基本元素之一&#…

MATLAB | 绘图复刻(五) | 带树状图的环形热图

本期教大家如何绘制带树状图的环状热图,要复刻的图片长这样: 复刻效果: 需要安装Statistics and Machine Learning Toolbox即统计与机器学习工具箱!!! 需要安装Statistics and Machine Learning Toolbox即…

对DataFrame的数据进行指定运算的DataFrame.transform()方法

【小白从小学Python、C、Java】 【计算机等级考试500强双证书】 【Python-数据分析】 对DataFrame中所有数据实施指定运算 例如:df1.transform(np.abs) 选择题 关于以下python代码说法错误的一项是? import pandas as pd import numpy as np df pd.DataFrame({&…

上班摸鱼软件

上班摸鱼软件前言思路采集组合自动下单发QQ报告结语前言 疫情几年,在家时间多,上班时间少。没事多在网上闲逛,偶然在知乎上看到一篇文章,说是买球也能稳赚不赔。我研究了一下,还真是这么回事。 简单来说,就…