增强领域的知识图谱

news2024/11/20 16:24:50

以下是一些近两年基于知识图谱做知识增强的顶会论文:

  1. "knowledge-enhanced hierarchical graph convolutional networks for intent detection" (acl 2021)

  2. "kg-bert: bert for knowledge graph completion" (emnlp 2019)

  3. "k-adapter: infusing knowledge into pre-trained models with adapters" (acl 2020)

  4. "coke: contextualized knowledge graph embedding" (emnlp 2020)

  5. "knowledge-aware language model pretraining" (acl 2020)

知识图谱推理

是通过将不同的实体和关系建立成一个网络结构,然后利用这个网络结构中的已知信息推导得到未知信息的过程。在知识图谱中,每个实体都以节点的形式存在,而实体之间的关系则以边的形式表示。

知识图谱推理包括三种类型:基于实例的推理、基于分类的推理和基于相似度的推理。其中,基于实例的推理是指根据已知的实例进行推理,比如从一组具有相似特征的实例中推断出新的实例;基于分类的推理是指根据知识图谱中实体所属的分类进行推理,比如根据物种分类推断出某个物种的特征;基于相似度的推理是指根据实体之间的相似性进行推理,比如根据两个实体的相似特征预测它们之间的关系。

知识图谱推理的具体过程是利用已知的实体和关系,通过逻辑推理、机器学习等方法,找到其中的规律和潜在的隐藏信息。在推理过程中,还可以使用一些领域专业知识、语义分析技术等手段对推理结果进行优化和调整。

信息抽取

信息抽取(information extraction)是自然语言处理(nlp)领域的一个重要任务,指从自然语言文本中自动地抽取出具有特定意义的结构化信息,并将其转化为计算机可处理的形式。信息抽取可以帮助人们自动化地处理海量的非结构化数据,从中挖掘出有价值的信息,以支持决策和分析等任务。信息抽取的主要任务包括实体识别(entity recognition)、关系抽取(relation extraction)和事件提取(event extraction)等。实体识别指识别文本中所涉及的具体对象,如人、地点、组织机构等;关系抽取则指识别实体间的语义关系,比如某个人是某个公司的雇员;事件提取则指从文本中抽取出特定类型的事件,比如**会议或自然灾害等。

基于数据增强的领域知识图谱构建方法研究

将对已标注的训练数据进行数据增强来提升信息抽取的效果,传统的数据增强方法包括同义词替换、随机插入、随机交换和随机删除,但领域知识往往包含大量专业词汇,结构固定,传统数据增强方法并不适用,因此,本文引入迁移学习思想进行数据增强的研究。迁移学习是指将从之前训练任务中学到的知识应用到新的训练任务中,主要分为样本迁移、特征迁移、模型迁移和关系迁移。其中,特征迁移可以在文本特征分布相似的情况下,借助历史标记数据以解决目标项目训练实例过少的问题。本文选取的数据为新能源汽车电池技术领域的专利文本,具有领域分支少、文法结构相似等特点,通过特征迁移的方法对人工标注的少量样本数据进行数据增强,提升信息抽取模型訓练效果。

信息抽取模型主要分为文本的多维向量映射和语义特征提取两个方面。文本的多维向量映射即文本的语义表示,传统的语义表示方法,例如Onehot、Word2vec、Glove等,使用一个词向量对应一个词语,包含的语义信息有限;现阶段使用较多的是预训练模型,例如EMLo预训练模型和BERT预训练模型,能够表达出词语在不同语境下的语义信息。预训练模型通过对大量语料进行无监督学习来获取丰富的语义特征,相比于EMLo模型,BERT将模型结构由LSTM更改为Transformer,解决了长依赖的问题,并通过遮蔽语言模型(MaskedLan⁃guageModel,MLM)和下一句预测(NextSentencePrediction,NSP)两种预训练任务,分别从预测遮盖词和预测下一句两个方面学习文本的语法、语义及句间关系。

信息抽取模型抽取出信息主要分为主体词集合、关系词集合以及客体词集合3类,分别映射到知识图谱(S,P,O)三元组的表示形式中,候选三元组由主体词、关系词及客体词的随机组合形成,三元组数据是图谱构建的基础。因此,图谱构建模型的关键在于去除候选三元组的噪声数据,识别语义正确的三元组,也可以看作对三元组和专利文本的语义匹配。本文将候选三元组和对应的专利文本语句组合成一个长句子,利用预训练模型和双向长短记忆神经网络模型进行语义解析,为减少长序列文本在解码过程中上下文信息、位置信息丢失问题的影响,本文加入注意力机制来增强重要字词的权重,优化模型,提升模型的准确率。

K-ADAPTER: Infusing Knowledge into Pre-Trained Models with Adapters

现有方法通常在注入知识时更新预训练模型的原始参数。然而,当多种知识被注入时,历史上注入的知识就会被冲掉。为了解决这个问题,我们提出了KADAPTER,这是一个框架,它保留了预训练模型的原始参数,并支持开发通用的知识注入模型。K-ADAPTER以RoBERTa为骨干模型,每种注入的知识都有一个神经适配器,就像一个连接RoBERTa的插件。不同适配器之间没有信息流,因此可以以分布式的方式有效地训练多个适配器。在这项工作中注入了两种知识,包括(1)从Wikipedia和Wikidata上自动对齐的文本三元组获得的事实知识,以及(2)通过依赖句法分析获得的语言知识。

无监督的方式学习的模型很难捕获丰富的知识。例如,Poerner等人(2019)认为,尽管语言模型在推理实体名称的表面形式方面表现良好,但它们无法捕捉丰富的事实知识。Kassner和Schutze¨(2019)观察到BERT大多没有学习否定的含义(例如“not”)。这些观察激励我们研究将知识注入预先训练的模型,如BERT和RoBERTa。以前的大多数工作(如表1所示)都用知识驱动的目标扩充了标准语言建模目标,并更新了整个模型参数。尽管这些方法在下游任务中获得了更好的性能,但它们在支持注入多种知识的通用模型的开发方面存在困难(Kirkpatrick et al, 2017)。当新类型的知识被注入时,模型参数需要重新训练,以便以前注入的知识会逐渐消失。同时,所得到的模型产生了纠缠的表示,因此很难研究每种知识的效果。

(a)预训练语言模型通过多任务学习注入多种知识。(2)我们的K-ADAPTER通过在不同的预训练任务上独立训练适配器来注入多种知识,支持持续的知识注入。当我们注入新的知识种类时,现有的特定于知识的适配器将不会受到影响。KIA表示适配器层,TRM表示变压器层,两者如图2所示。

第一,我们考虑了事实相关的目标(即谓词/关系预测)和语言相关的目标(即依赖关系预测)。其次,在知识灌输过程中钳制BERT的原有参数。第三,我们的方法支持持续学习,这意味着不同适配器的学习不会纠缠在一起。这种灵活性使我们能够有效地独立注入不同类型的知识,并且在不损失之前注入的知识的情况下注入更多类型的知识 。

如图1 (a)所示,之前的大部分工作都是通过多任务学习,通过注入知识和更新模型参数来增强预训练的语言模型。不管这些不同版本的多任务学习知识注入方法,没有充分研究的常见问题是对先前知识的灾难性遗忘。为了解决这个问题,我们提出了如图1(b)所示的KADAPTER,其中将多种知识分别注入到不同的紧凑神经模型(即本文中的适配器)中,而不是直接将知识注入到预训练的模型中。它保持预训练模型的原始表示固定,并支持持续的知识注入,即将每种知识注入到相应的知识特定适配器中,并产生解纠缠的表示。具体来说,适配器是插入预训练模型之外的特定于知识的模型(具有很少的参数)。适配器的输入是预训练模型中间层的输出隐藏状态。每个适配器被独立地预训练,用于注入不同的鉴别知识,而预训练模型的原始参数被冻结。在本文中,我们利用RoBERTa (Liu et al, 2019)作为预训练模型,主要将事实知识和语言知识注入两种适配器,即事实适配器和语言适配器,分别在关系分类任务和依赖关系预测任务上进行预训练。在本节中,我们首先描述适配器的结构,然后介绍预训练特定于知识的适配器的过程。

特定于知识的适配器 

适配器作为外部插件工作。每个适配器模型由K个适配器层组成,其中包含N个变压器(Vaswani等,2017)层和两个投影层。跳过连接应用于两个投影层。

预训练模型的不同变压器层之间的适配器层。我们将预训练模型中变压器层的输出隐藏特征和前适配器层的输出特征连接起来,作为当前适配器层的输入特征。对于每个特定于知识的适配器,我们将预训练模型和适配器的最后一个隐藏特征连接起来,作为该适配器模型的最终输出特征。

在预训练过程中,我们对每个特定于知识的适配器分别进行不同的预训练任务的训练。对于各种下游任务,K-ADAPTER可以采用类似RoBERTa和BERT的微调过程。当只采用一个特定于知识的适配器时,我们可以将该适配器模型的最终输出特征作为下游任务特定于任务的层的输入。当采用多个特定于知识的适配器时,我们将不同适配器模型的输出特征连接起来,作为下游任务特定于任务的层的输入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/428301.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言刷题--内存存储、操作符

魔王的介绍:😶‍🌫️一名双非本科大一小白。魔王的目标:🤯努力赶上周围卷王的脚步。魔王的主页:🔥🔥🔥大魔王.🔥🔥🔥 ❤️‍&#x1…

04-Mysql常用操作

1. DDL 常见数据库操作 # 查询所有数据库 show databases; # 查询当前数据库 select databases();# 使用数据库 use 数据库名;# 创建数据库 create database [if not exits] 数据库名; # []代表可选可不选# 删除数据库 drop database [if exits] 数据库名; 常见表操作 创建…

Nestjs实战干货-概况-中间件-Middleware

中间件 中间件是一个在路由处理程序之前被调用的函数。中间件函数可以访问请求和响应对象,以及应用程序的请求-响应周期中的next()中间件函数。下一个中间件函数通常由一个名为next的变量来表示。 Nest 中间件在默认情况下等同于Express中间件。下面是来自官方 exp…

MBD—模型的回调函数

目录 前面 如何设置? 应用 简单的提示 数据的初始化 前面 常用的回调函数有三类:模型的回调函数、模块的回调函数、信号的回调函数。这里分享一下模型的回调函数。 回调函数就是CallBack. 如何设置? 打开一个模型,在空白…

【计算机网络】TCP拥塞控制、丢包重传机制与滑动窗口机制

文章目录TCP 拥塞控制原理为什么拥塞期间,发送方会收到接收方的重复确认?TCP 滑动窗口机制原理TCP 丢包重传机制TCP 拥塞控制原理 TCP拥塞控制是指在网络拥塞的情况下,TCP协议通过调整发送数据的速率来避免网络拥塞的一种机制。TCP拥塞控制的…

物料分类视图:200 和 300 分类测试记录

一、概述 测试目的:将销售订单中成品对原材料的需求,通过MRP运行,传递到生产订单中 系统版本:S4 工厂代码:1001(计划工厂) 、1008(执行工厂) 成品: CP0000535 原材料: 编码 描述 板材特性 123…

国内 中 大 型 IT 软件 外包公司 名单 汇总(2023 最新版!)

文章目录***\*1、软件外包公司名单\*******\*2、如何区分是否是外包公司\*******\*3、外包公司真是无一是处吗?\*******\*4、软件外包的几种形式\*******\*5、哪些情况可选择外包\****结语1、软件外包公司名单2、如何区分是否是外包公司3、外包公司真是无一是处吗&a…

【Transformer系列(1)】encoder(编码器)和decoder(解码器)

前言 这个专栏我们开始学习transformer,自推出以来transformer在深度学习中占有重要地位,不仅在NLP领域,在CV领域中也被广泛应用,尤其是2021年,transformer在CV领域可谓大杀四方。 在论文的学习之前,我们…

【C++】类和对象—日期类的实现

目录一、日期类的功能二、获取月的天数三、Date类中的默认成员函数构造函数析构函数拷贝构造赋值运算符重载取地址操作符重载和const取地址操作符重载四、运算符重载&#x1f312;、、-、-日期天数日期天数日期-天数日期-天数&#x1f312;、!、>、>、<、<日期-日期…

C++ :websocket 通讯下的五种 I/O 模型

目录 I/O 多路复用&#xff08;一种同步 I/O 模型&#xff09; 非阻塞与阻塞 select、poll、epoll 起因 改善 select 与 poll 的差别 I/O 模型 阻塞 I/O 模型 非阻塞 I/O 模型 I/O 多路复用模型 信号驱动 I/O 模型&#xff08;SIGIO&#xff09; 异步 I/O 模型&…

VirtualBox下Ubuntu系统磁盘扩容

1. 正确扩容虚拟硬盘&#xff1a;修改虚拟硬盘和快照的虚拟硬盘大小 打开VirtualBox所在目录&#xff0c;打开cmd&#xff0c;输入命令VBoxManage list hdds&#xff0c;这样能够列出所有的虚拟磁盘。找到你需要扩容的磁盘输入命令VBoxManage" modifyhd "D:\Pat\to\…

米尔STM32MP135核心板 又一款入门级嵌入式开发平台

自2007年意法半导体&#xff08;ST&#xff09;推出STM32首款Cortex-M内核 MCU,十几年来&#xff0c;ST在MCU领域的发展是飞速向前的。而2019年ST发布了全新的STM32MPU系列产品线&#xff0c;STM32MP1作为新一代 MPU 的典范&#xff0c;有着极富开创意义的异构系统架构兼容并蓄…

WMS智能仓储

子产品介绍篇--智能仓储 智能仓储 我们通常也称 WMS 系统。是一个实时的计算机软件系统&#xff0c;它能够按照运作的业务规则和运算法则&#xff0c;对信息、资源、行为、存货和分销运作进行更完美地管理&#xff0c;提高效率。 一. 仓储管理系统&#xff08;wms&#xff09;…

javaweb过滤器与监听器

一、过滤器程序的基本结构、web.xml文件的配置过程和过滤器的执行过程 <?xml version"1.0" encoding"UTF-8"?> <web-app xmlns"https://jakarta.ee/xml/ns/jakartaee"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance&quo…

MobPush创建推送

功能说明 MobPush提供遵循REST规范的HTTP接口&#xff0c;适用各开发语言环境调用。 IP绑定 工作台可以绑定服务器IP地址&#xff0c;未绑定之前所有IP均可进行REST API的调用&#xff0c;绑定后进仅绑定的IP才有调用权限。 调用地址 POSThttp://api.push.mob.com/v3/push/c…

03.vue3的计算属性

文章目录1.计算属性1.get()和set()2.computed的简写3.computed和methods对比2.相关demo1.全选和反选2.todos列表1.计算属性 模板内的表达式非常便利&#xff0c;但是设计它们的初衷是用于简单运算的。在模板中放入太多的逻辑会让模板过重且难以维护。所以&#xff0c;对于任何…

CRM系统是什么?它有什么作用?

CRM系统是什么&#xff1f; CRM是Customer Relationship Management&#xff08;客户关系管理&#xff09;的缩写&#xff0c;是一种通过对客户进行跟踪、分析和管理的方法&#xff0c;以增加企业与客户之间的互动和联系&#xff0c;提高企业与客户之间的互信&#xff0c;从而…

GoNote第一章 环境搭建

GoNote第一章 环境搭建 golang介绍 1. 语言介绍 Go 是一个开源的编程语言&#xff0c;它能让构造简单、可靠且高效的软件变得容易。 Go是从2007年末由Robert Griesemer, Rob Pike, Ken Thompson主持开发&#xff0c;后来还加入了Ian Lance Taylor, Russ Cox等人&#xff0c…

oracle远程克隆pdb

使用远程克隆的先决条件是: oracle版本是12.2以上,开启归档模式以及本地undo. 这里是想从172.16.12.250将PRODPDB1克隆到172.16.12.251下&#xff0c;命名为PRODPDB1COPY。 1 确保源端数据库开启归档模式 备注&#xff1a;进cdb里开启归档。 2 在源数据库中&#xff0c;确保…

2023年环境工程与生物技术国际会议(CoEEB 2023)

会议简介 Brief Introduction 2023年环境工程与生物技术国际会议(CoEEB 2023) 会议时间&#xff1a;2023年5月19日-21日 召开地点&#xff1a;瑞典马尔默 大会官网&#xff1a;www.coeeb.org 2023年环境工程与生物技术国际会议(CoEEB 2023)将围绕“环境工程与生物技术”的最新研…