论文浅尝 | 通过依赖掩码语法引导预训练提升关系抽取

news2024/11/16 11:55:31

691c7de150ccb3527083e9fbe83fbf47.png

笔记整理:王大壮

链接: https://aclanthology.org/2022.findings-acl.147v1.pdf

动机

关系抽取是一项重要的自然语言处理任务,旨在预测给定文本中两个给定实体之间的关系。其中,对文本上下文信息的良好理解对于实现出色的模型性能至关重要。在不同的上下文信息里,句法信息已被证明对任务有帮助。然而,现有研究大多数需要对现有基线架构进行修改以利用句发信息,而本文受预训练任务启发,设计了相应的句法依赖预测预训练任务来增强编码器,避免对基线架构的改动。

论文方法

本文方法主要可以分为3步,模型整体框架如下:

6b188dcd0ae52d47c2c510526177b050.png

1.句法依赖提取

•首先需要使用一个已有的依赖分析工具来对获得输入的句法依赖树。•接着构建一阶依赖关系:句法依赖树中直接具有依赖关系的词与词及其依赖关系类型构成一个元组:(  ,  ,type)(二阶及三阶依赖关系形式化同此)。•然后是构建二阶依赖关系:能通过一个中间词进行连接的两词,其关系类型根据两词与中间词之间连接方向性决定,见下图:

a0eebe30ea6ced90c6cd1036f248e38f.png

•最后是构建三阶依赖关系:能通过两个中间词进行连接的两词,其关系类型见下图:

fb0cdc481b53f1dd31009fa14c167b47.png

2.句法依赖掩码及预测

以往的利用依赖信息进行预训练的方法主要关注于预测有依赖连接的上下文词,而本文主要关注于预测依赖信息及依赖关系,提出一种弱监督学习任务:掩码依赖预测来增强文本编码能力。依赖掩码掩码两种类型:

•掩码词连接(  ,[MASK]),对应任务就是预测与该词有依赖关系的词;•掩码依赖关系(  ,  ,[MASK]),对应任务就是预测两词之间的依赖关系。

接着需要恢复掩码依赖连接喝类型:

•首先应用基本编码器对输入进行编码,然后获得每个词的隐藏状态。•接着使用三个有相同结构的模块来恢复掩码依赖连接和类型(分别对应一阶、二阶和三阶依赖)•以一阶依赖为例进行说明(同理可以得到二阶情况和三阶情况):

1) 对依赖连接的预测得分(二分类):

2) 对依赖关系类型的预测得分(⨁代表拼接操作)(多分类):

3.利用句法引导编码器进行关系抽取

对上述预训练任务得到的句法引导编码器在关系抽取任务上进行微调,其预测得分如下:

  计算方式如下:

3f4ec95619663f2ac5f639349cd8f68a.png

实验

1.在BERT和XLNet的base和large版本上做了加上图卷积网络、图注意力网络以及三种依赖预测的对比实验:

e5cb9b45fcd39d622a855b124dbbf945.png

可以发现本文利用依赖信息的方法优于基线及加上GCN和GAT来利用依赖信息的方法,同时,加入了二阶掩码预训练任务的模型在多数情况下表现出了更好的性能。

2.和以往工作的对比实验:

70e52713784ba830b5fef2c90d180214.png

可以看到,本文所提出的方法在两个数据集上都达到了最优的性能,且由于本文方法不需要在关系抽取任务上额外输入句法依赖信息,将拥有更快地运行速度。

3.本文还做了在未经预训练任务的transformer上的实验,结果如下:

5dc6783eda65ffbd6a01562405d6103b.png

总结

该论文提出了一种使用句法依赖掩码和恢复的预训练任务来提升文本编码器对上下文的编码能力和需要深度理解文本的关系抽取任务。通过设计三种阶级的依赖掩码预测任务,最终的句法引导编码器被融合入了句法信息,同时,该编码器可以用于不同的需要句法信息的下游任务。在两个关系抽取英语基准数据集上的实验结果体现了所提出方法的有效性。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

d904dfea1ab3f8514308998865332330.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/126035.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CMMI之项目规划

项目规划(Project Planning)的目的是为项目的研发和管理工作制定合理的行动纲领(即《项目计划》),以便所有相关人员按照该计划有条不紊地开展工作。 为了避免词义混淆,这里把动词Planning译为规划&#xf…

用 Python 写一个经典飞机大战

当年微信 5.0 发布时,首页被设置成了一款新推出的小游戏,它就是微信版飞机大战,游戏一经推出便是火爆异常,铅笔画风格的游戏界面也受到了很多人的喜欢。 最近重温了一下这款小游戏,尽管时隔多年,但无论是游…

双向循环神经网络(隐马尔可夫模型)

在双向循环神经网络中,每个时间步的隐状态由当前时间步的前后数据同时决定。 双向循环神经网络与概率图模型中的“前向-后向”算法具有相似性。 双向循环神经网络主要用于序列编码和给定双向上下文的观测估计。 由于梯度链更长,因此双向循环神经网络的…

网站Nginx服务安装https免费证书配置一条龙流程

搜索小程序 成语典故查询 Let’s Encrypt 安装https免费证书配置 1.http 是一个传输网页内容的协议,比如你看到的 http 开头的网站 www.163.com,其网页上的文字、图片、 CSS 、 JS 等文件都是通过 http 协议传输到我们的浏览器,然后被我们看到。 而 …

生物药、创新药、仿制药新项目立项调研、评估的重要手段

当前,随着我国制药行业与国际的高速接轨,研发和产业环境也迎来了崭新的局面。制药企业的核心竞争力是研发,而研发中的立项是直接影响新药开发成功与否的关键因素,那么如何有效的规避开发的风险,立项论证显得极其重要,也是每个医药…

车道线标注案例分析

车道线标注属性细分规则确认点 常见车道线的标注分类属性包括5个维度:颜色、线型、线数、车道、职能 颜色标签:如白色、黄色、蓝色、橙色、黄白色等 线型标签:如实线、虚线、锯齿线等 线数标签:单线、双线,特殊情况…

【高阶数据结构】二叉树的非递归遍历

🌈欢迎来到数据结构专栏~~二叉树的非递归遍历 (꒪ꇴ꒪(꒪ꇴ꒪ )🐣,我是Scort目前状态:大三非科班啃C中🌍博客主页:张小姐的猫~江湖背景快上车🚘,握好方向盘跟我有一起打天下嘞!送给自…

大型家政服务平台带小程序端源码 家政服务小程序源码

1. 开发语言:PHP 2. 数据库:MySQL 3.小程序端:Uniapp 4. 带调试视频 5. 可付费调试运行服务 后台功能: 首页、服务管理、商品管理、订单管理、社区管理、城市代理/运营、 营销活动、会员管理、师傅管理、商家/门店、财务管理、合…

警惕!不要让自己的基本功丢失

写这篇文章的缘由是来自己最近我作为面试官的一场面试,我司是。Net stack,这场面试的岗位是后端高级开发。候选人是一个 12 年工作经验的候选人,简历看起来很 nice,国内某 TOP 高校 cs 专业本科毕业,有在大厂甲方外企的…

浙大MBA的录取由初试和复试两面组成

今年7月收到了来自浙大的录取通知书,在拿到录取通知书的那一刻,觉得这一年多备考的艰辛都是值得的。 关于本人情况:2021年备考,刚到而立之年,2012年毕业于一所普通的本科院校,在校期间成绩倒是还好&am…

Vue3 中选项式下的侦听器

目录前言:watch 侦听的分类:函数式的侦听器对象式侦听器创建侦听器停止侦听器总结:前言: 今天小编给大家讲解一下,Vue3 中选项式下的侦听器。 我正在参加 2022年「博客之星」年度总评选,请大家帮我支持一下…

【服务器数据恢复】XFS文件系统分区丢失怎么恢复数据?

服务器数据恢复环境: 磁盘柜RAID卡搭建riad5磁盘阵列; Linux操作系统; 总共一个LUN,划分两个分区;:sdc1分区通过LVM扩容的方式加入到了root_lv中,sdc2分区格式化为XFS文件系统。 服务器故障: 用户为服务器…

本科生学深度学习一轻松搭建强化学习环境,gym的安装

OpenAI Gym 是一个工具包,提供了广泛的模拟环境,也是强化学习的环境,因为想学强化学习,所以需要搭建一个环境,之前一直在代码层面,还是得能看到,比较直观 今天看下怎么安装这个环境 1、官方网站…

【mybatis-plus】Springboot+AOP+自定义注解实现多数据源操作(数据源信息存在数据库)

背景 本文主要讲述的是如何实现动态切换数据源,数据源信息是存储在数据库表里,与在配置文件中写好数据库信息然后用DS("XX")注解不同。 目录 前言 一、准备工作 1.依赖 2.数据库表(脚本) 3.配置文件 4.自定义注解C…

【MySQL基础教程】约束的介绍与使用

前言 本文为 【MySQL基础教程】约束 相关知识,下边将对约束概述,约束演示,外键约束(包括:外键约束介绍、外键约束语法)等内容进行详尽介绍~ 📌博主主页:小新要变强 的主页 &#x1…

只懂黑盒测试也能学会的代码覆盖率及精准化测试

测试覆盖率是对测试完成程度的度量。它通常依据某种覆盖准则来对测试用例执行情况进行衡量,以判断测试执行得是否充分 。 ——出自《 计算机科学技术名词 》第三版 今天文章中我们给大家介绍覆盖率统计及覆盖率分析。在10月13日20:00,资深测…

Vue_cli中config文件配置详细注解

我在scr同级目录下创建了config文件夹,里边包含三个文件 它们3个有引用关系 dev引用prod prod.env.js文件 /* * process.argv.splice(2)[0]返回的是node.js的绝对路径 * /usr/local/bin/node */ let HOST process.argv.splice(2)[0] || prod module.exports {NO…

项目实战之旅游网(十)前台用户注册

目录 一.网站首页 二.编写注册界面 三.生成验证码 四.注册流程 五.编写注册方法 六.发送邮件配置 一.网站首页 static/frontdesk下存放前台静态资源,而templates/frontdesk是前台页面 二.编写注册界面 在上个界面点击注册就可以跳转到注册界面 在这里遇到一…

2022 年上海市大学生程序设计竞赛 M. My University Is Better Than Yours

大家总喜欢搞些什么排行榜。有一说一,排行榜通常不重要,除非——比如你老板要你做一下年终总 结。 为了实现建设世界一流大学和建设世界一流学科的目标,不少大学都用各种方式提升排名:发表论文、 申请基金、提升多样性. . . 不过…

Linux操作系统实验4——内存映射

实验要求: 1.在源码中查看file_operations和vm_operations_struct结构定义及其操作对象的方法,重点查看mmap方法fault方法的参选类型。 2.设备模块代码的编写和调试,重新编写file_operations结构中的mmap方法,和vm_operations_str…