【论文精读】基于知识图谱关系路径的多跳智能问答模型研究

news2024/11/25 14:27:55

💗💗💗欢迎来到我的博客,你将找到有关如何使用技术解决问题的文章,也会找到某个技术的学习路线。无论你是何种职业,我都希望我的博客对你有所帮助。最后不要忘记订阅我的博客以获取最新文章,也欢迎在文章下方留下你的评论和反馈。我期待着与你分享知识、互相学习和建立一个积极的社区。谢谢你的光临,让我们一起踏上这个知识之旅!
请添加图片描述

文章目录

  • 🍋论文介绍
  • 🍋摘要
  • 🍋1 引言
  • 🍋2 问题描述
  • 🍋3 多跳智能问答网络模型
    • 🍋3.1 统一学习表示层
      • 🍋3.1.1 知识图谱表示学习
      • 🍋3.1.2 问题表示学习
    • 🍋3.2 候选答案筛选层
    • 🍋3.3 关系路径表示学习层
    • 🍋3.4 模型训练
  • 🍋4 实验评价
    • 🍋4.1 实验环境
    • 🍋4.2 实验结果
    • 🍋4.3 消融实验
  • 🍋 结论

🍋论文介绍

论文题目:基于知识图谱关系路径的多跳智能问答模型研究

作者信息:张元鸣,姬琦,徐雪松,程振波,肖刚
(浙江工业大学计算机科学与技术学院,浙江杭州 310023)

原文地址

🍋摘要

多跳问题是一类通过知识推理才能给出答案的复杂问题,往往需要相关的多项关联知识融合生成最终答案.现有基于知识图谱的多跳智能问答方法推理过程比较复杂,没有考虑关系路径蕴含的结构信息语义信息.为此,本文提出了基于知识图谱关系路径的多跳智能问答模型,*将多跳智能问答问题转换为在低维向量空间中查找知识图谱中最优关系路径的问题.*该模型利用表示学习将知识图谱和用户问题同时嵌入到低维的向量空间,实现知识空间和问题空间的统一表示;然后结合主题实体向量表示和问题向量表示对候选实体进行语义评分,产生候选答案集 合;以问题实体为起始节点,以候选答案实体为结束节点,从知识图谱中抽取与问题相关的关系路径集合;将关系路径 进一步嵌入到低维的向量空间,生成关系路径的向量表示,在向量空间中查找与问题语义匹配度最高的关系路径,最终根据关系路径生成多跳问题的答案.在公开的数据集上对所提出的模型进行了实验,结果表明该方法与现有方法 相比不仅具有良好的性能,而且具有良好的稳定性,不会随着问题跳数的增加而降低性能.

关键词:智能问答;知识图谱;复杂多跳问题;关系路径;表示学习

🍋1 引言

随着近年来信息技术的飞速发展,人类知识总量趋 于指数级增长,智能问答综合运用信息检索、深度学习和 自然语言处理等技术,充分理解用户语义,快速获得用户 问题的精确答案,在搜索引擎、教育、金融、电商等领域具 有广泛应用,成为当前自然语言处理领域的研究热点

主要分为基于模板的方法、基于语义匹配的方法和基于表示学习的方法.

  • 基于模板匹配的方法针对特定知识领域和用户问题设计严密的问题模板,再利用模板匹配生成答 案,但性能依赖于模板数量,难以全面覆盖用户问题和知识库.

  • 基于语义解析的方法通过分析用户问题的语 义组成,将用户问题转换为逻辑形式或结构化查询,但 语义分析的级联误差将降低答案的准确性

  • 基于表示学习的方法则将知识库和用户问题特征嵌 入到低维向量空间,通过向量计算进行知识推理,是目前 智能问答研究的主流技术

接下来作者引入了Sun等人对于知识问答或其相关步骤所做的一些贡献

现有基于表示学习的方法往往从问题的主题实体 出发在知识图谱上通过逐步推理寻求问题答案,没有 考虑多跳问题中关系路径蕴含的结构信息和语义信
息,难以充分捕捉实体之间的复杂关系.针对该问题

接下来作者简单介绍了一下解决方案~

本文提出新的基于知识图谱关系路径的多跳智能问答 模型,建立主题实体到答案实体之间的关系路径,并将 关系路径嵌入到低维向量表示,在向量空间中查找与 问题语义匹配度最高的关联路径,再根据最优关系路 径生成最终答案,简化了多次检索知识图谱子图多步 推理过程,具有良好的性能和适用性

🍋2 问题描述

知识图谱本质上是一种结构化语义网络,通常用==< 实体-属性-属性值><头实体-关系-尾实体>==三元组方 式表达,为知识推理提供了结构化知识库.
在这里插入图片描述

多跳智能问答可以形式化描述为:在知识图谱G 上,根据主题实体h、关系路径l给出问题q的答案集合 Aq⊆E,∀a∈A q是问题q正确的答案实体.本文假定问题的所有答案都是知识图谱中的实体,且每个问题只 包含一个主题实体

🍋3 多跳智能问答网络模型

为了提高多跳智能问答的性能,本节给出了一个知识图谱关系路径网络模型(Knowledge Graph Relation⁃ ship Path Network,KGRPN),将问题与答案涉及的关联知识映射到知识图谱的关联路径,将智能问答问题转换 为知识图谱以主题实体为开始节点的最优关联路径查找问题.图1给出了模型的整体框架,该模型主要包括
统一表示学习层、候选答案筛选层和关系路径表示学习层.统一表示学习层分为知识图谱表示学习模块和用户问题表示学习模块,其中知识图谱表示学习模块将实体 和关系进行向量表示,

  • 统一表示学习层(知识图谱表示学习模块、用户问题表示学习模块)
  • 候选答案筛选层
  • 关系路径表示学习层
  1. 知识图谱表示学习模块将实体 和关系进行向量表示
  2. 用户问题表示学习模块是对用户提出的问题进行向量表示
  3. 候选答案筛选层从知识图谱中提取主题 实体的所有可达实体,筛选与问题语义相关的实体作为 候选答案
  4. 关系路径表示学习层从知识图谱中抽取与主题实体相关的关系路径,并将关系路径嵌入到低维的向 量空间
  5. 根据问题语义相似度查找最优关系路径,生成问题最终答案

在这里插入图片描述

🍋3.1 统一学习表示层

🍋3.1.1 知识图谱表示学习

知识图谱表示学习旨在将知识图谱中实体和关系 的语义信息嵌入到低维向量空间,增强智能问答的准确性.本框架采用ComplEx表示学习模型[22],该模型能够将知识图谱中的实体和关系嵌入为包含实部和虚部 的复向量,在保留点积运算计算效率优势的基础上,使 实体的非对称关系能够得到不同的表征

在这里插入图片描述
在这里插入图片描述

🍋3.1.2 问题表示学习

问题表示学习旨在==将用户提出的问题也嵌入到低维 向量空间,并将该向量映射到与知识图谱相同的向量空间.==本模型采用RoBERTa预训练语言模型捕捉多跳问题隐含的丰富语义信息,该模型根据输入的自然语言问句能够生成融合文本上下文信息的深层双向语言表征[23]
在这里插入图片描述
在这里插入图片描述

🍋3.2 候选答案筛选层

候选答案筛选是从知识图谱中选择候选答案实体,提高下游关系路径推理的准确性.在向量空间中,根据问题向量表示的语义信息和主题实体向量表示的 特征信息评价答案实体的可信度,从而快速筛选出语义相关的实体作为候选答案.将问题视为主题实体和答案实体之间的语义联系,根据已经得到的向量表示计算语义评分,计算公式为:

在这里插入图片描述

🍋3.3 关系路径表示学习层

关系路径是指在知识图谱中主题实体到候选答案 实体依次经过的关系的序列,而跳数则表示关系路径的长度.如果关系路径长度为1,则是简单问题如果关 系路径长度大于1,则是多跳问题.对于多跳问题,需要 通过融合关系路径的关联知识生成最终答案.
从知识图谱中抽取以主题实体为起点、候选答案 实体为终点的所有关系路径,其中关系路径的长度需 小于设定的最大跳数,并剔除重复的关系路径,关系路
径示意图如图2所示.
在这里插入图片描述
将每个关系的向量表示进一步融合生成关系路径的向量表示.本文采用Transformer网络[24]和全局注意力机制生成关系路径的向量表示,关系路径的表示学习网络模型如图3所示.Transformer是一种基于自注意 力机制的序列编码模型,该模型包括Encoder和De⁃ coder两个部分,Encoder包含6层叠加的Transformer block,每个Transformer-block包含多头注意力机制、残差连接、层归一化、全连接网络四个部分,输入为句子 词汇的词向量编码和位置编码之和,其中位置编码层 的目的是区分句子中词的位置关系能学习到输入序列与输出序列之间的对应关系.

关系路径中所有关系的向量表示构成了一个向量表示序列.模型利用多头注意力机制提取向量表示序列的特征信息,不同注意力头得到的结果拼接并点乘权重矩阵得到多头注意力的输出,再通过残差连接与 前馈神经网络进行处理,得到融合序列特征的新向量 表示,然后将问题的表示向量和关系路径中每个关系 的向量表示进行点积运算,生成全局注意力矩阵,聚合不同关系的语义特征,生成整个关系路径的向量表示.
通过Transformer网络提取关系路径特征,计算不同注意力头下的注意力概率分布,计算公式为
在这里插入图片描述
.
根据关系路径的向量表示序列生成整个关系路径的向量表示.先计算问题的向量表示与每个关系的权重系数,计算公式为
在这里插入图片描述

🍋3.4 模型训练

为了从候选关系路径中查找最优关系路径,本模型使用三元组损失函数[25],该函数使用锚点、正样本和负样本组成三元组,其中锚点和正样本类别相同锚点
与负样本类别不同
.通过训练使正样本与锚点在向量空间中的位置接近,使负样本与锚点的位置远离,最小化同类别样本之间的距离,并最大化不同类别样本之间的距离,其训练原理如图4所示.
在这里插入图片描述
在这里插入图片描述

🍋4 实验评价

🍋4.1 实验环境

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

🍋4.2 实验结果

本文在Pytorch深度学习框架实现了KGRPN模型, 并采用Adam算法进行参数更新,操作系统为

表2给出了本模型与对比模型在两个数据集上的 实验结果.根据该结果,可以看出本文提出的KGRPN模型在这些数据集上尽管性能不是最好,但表现最为稳健.在多跳情况下,EmbedKGQA模型通过分析问题和知识图谱每类关系的相关性计算关系路径的可信度,而KGRPN模型考虑了关系路径的顺序语义和复合 语义.在MetaQA的2-hop和3-hop数据集上,Trans⁃ ferNet模型的性能最好但该模型每一跳都需要维护一个代表实体间转移概率的矩阵,通过大量矩阵运算模拟每跳的关系选择,以实现复杂的推理过程.与该模型 相比,KGPRN模型则通过特征向量匹配最符合问题语 义的关系路径,不需要复杂的矩阵运算.WebQues⁃ tionsSP数据集具有百万级的知识图谱实体,但包含非常少的问答记录,因此这些智能问答模型在该数据集
上的性能较低.在MetaQA的1-hop和WebQuestionsSP 数据集上,SSKGQA模型的性能最好但该模型需要预先定义问题的语义结构,根据预测的问题语义结构在知识图谱中检索符合问题语义结构的查询图.与该模 型相比,KGPRN模型**不需要预先定义问题的语义结构,**而是以知识图谱中包含的关系和关系间的顺序语义信 息为基础,识别最符合问题语义的关系路径来生成问
题答案,具有更好的适用性.

在这里插入图片描述

🍋4.3 消融实验

先单独考察候选答案筛选模块性能,实验结果如表3所示,可以看出候选答案筛选模块能够生成高质量 的候选答案集合,在MetaQA数据集中几乎所有问题的 答案均被正确提取到候选答案集合中,在WebQues⁃ tionsSP数据集的实验中Hit@10值仍然能够达到78.8%.然而,如果简单地选择候选答案筛选模块生成的语义评分最高的实体作为答案,在MetaQA 2-hop数据集上 的Hit@1值只能达到86.0%,在WebQuestionsSP数据集 上的Hit@1值只能达到48.1%,与表2中完整模型的性能相比具有较大的差距.因此,如果不考虑关系路径包含的关系语义和关系间的顺序信息,模型的性能将显
著下降,证明了关系路径推理模块的重要性.
在这里插入图片描述

再考察关系路径表示学习模块中注意力机制对性能的影响,本文在Web QuestionsSP数据集上分析了不同向 量表示生成方法对性能的影响,实验结果如表4所示.根 据该实验结果,可知注意力机制的性能最好.相较于平均池化方法,注意力机制能够更好地捕捉向量表示序列的 全局语义,使问题和关系序列更关注彼此相关的部分,而采用最大池化策略会导致序列的语义不完整.
在这里插入图片描述

使用热力图对问题和关系路径之间的注意力分布进 行了可视化,每个热力图的单元格对应一个关系的注意力系数.图5给出了两个问题的注意力可视化示例,图5(a) 是Meta QA 3-hop数据集中的问题“who acted in the movies directed by the director of Zouzou”,该问题答案的关系路径 包括“directed_by”“directed_by_reverse”和“starred_actors” 三个关系,它们的注意力系数分别为0.38、0.28、0.34; 图5(a)是MetaQA 3-hop数据集中的问题“in which years were movies released which starred actors who appeared in the movie Thunderbolt”,该问题答案的关系路径包括 “starred_actors_reverse”“starred_actors”“release year”三个 关系,它们的注意力系数分别为0.37、0.26、0.37.在生成关系路径的特征向量时,每个关系对路径的整体语义贡献不同.最后考察关系路径的长度对性能的影响.最大关系路径长度L是影响关系路径检索范围的主要参数,本 文通过设置该参数来控制关系路径的抽取策略,以观
察抽取策略对性能的影响,实验结果如表5所示.根据 该实验结果,对于只包含三跳问题的MetaQA 3-hop数据集,当L=3时本模型的性能最高;对于只包含两跳问
题和单跳问题的
WebQuestionsSP数据集,当L=2时模 型性能最高.因此,当最大关系路径长度等于数据集的最大问题跳数时,可以抽取完整的关系路径语义信息,问答性能最好;当最大关系路径长度小于数据集的最大问题跳数时,问答性能将会下降.

在这里插入图片描述

🍋 结论

针对复杂多跳问题在知识推理中难以提取关系路 径蕴含的结构信息和语义信息的问题,本文提出了基于知识图谱关系路径的多跳智能问答模型,通过表示 学习实现了知识图谱和自然语言问题的统一表示,将知识图谱和问题映射到同一向量空间中.从知识图谱 中抽取与问题相关的关系路径集合并利用Trans⁃ former网络学习关系路径的语义和结构信息,在向量空间推理候选关系路径集合中最符合问题语义的关系路
径,生成候选答案
.本方法可以应用于智能搜索、电子 商务和金融等领域,有效提高智能问答的精准度.

挑战与创造都是很痛苦的,但是很充实。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1493334.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Axure 入门文档 文件格式 全局样式 元件居中

文件格式 .rp 原型文件.rplib:元件库文件.rpteam 团队项目文件.html 项目网页文件 批量设置居中 选中多个&#xff0c;然后上方任务栏即可设置 设置自定义页面视图尺寸 项目-自适应视图设置 点击页面空白处就可以使用 添加元件说明 当一个元件创建好&#xff0c;可以设…

电脑怎么设置静态ip地址和动态

在数字时代&#xff0c;电脑与网络的关系日益紧密。对于大多数用户来说&#xff0c;电脑的网络设置可能是个相对陌生的领域&#xff0c;尤其是关于IP地址的选择与配置。IP地址&#xff0c;即“互联网协议地址”&#xff0c;是电脑在网络中的唯一标识。了解如何设置静态IP地址和…

JavaScript 原型链继承:掌握面向对象的基础

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

华为HQoS配置案例

HQoS基于层次化调度&#xff0c;cpe上支持三级队列&#xff1a; level3流队列&#xff1a;每个用户的同类业务是一个业务流&#xff0c;针对每个用户不同的业务流进行队列调度&#xff0c;流队列一般与业务类型对应&#xff08;EF、AF、BE等&#xff09;。 level2用户队列&…

Golang搭建grpc环境

简介 OS : Windows 11 Golang 版本: go1.22.0 grpc : 1.2 protobuffer: 1.28代理 没有代理国内环境下载不了库七牛CDN &#xff08;试过可用&#xff09; go env -w GOPROXYhttps://goproxy.cn,direct阿里云代理(运行grpc时下载包出现报错 ): go env -w GOPROXYhttps://mirr…

漫步者、南卡、Cleer开放式耳机怎么样?硬核对比测评性能强者!

​在当今市场上&#xff0c;开放式耳机的型号层出不穷&#xff0c;作为一名专业的测评博主&#xff0c;我对这类产品有着深入的了解和丰富的经验。最近&#xff0c;我的粉丝们通过私信向我咨询如何选择适合自己的开放式耳机&#xff0c;面对众多品牌的选择&#xff0c;他们感到…

基于springboot的场地预约小程序的设计与实现(程序+数据库+文档)

** &#x1f345;点赞收藏关注 → 私信领取本源代码、数据库&#x1f345; 本人在Java毕业设计领域有多年的经验&#xff0c;陆续会更新更多优质的Java实战项目&#xff0c;希望你能有所收获&#xff0c;少走一些弯路。&#x1f345;关注我不迷路&#x1f345;** 目录 一、研…

OPC UA协议转换网关

在物联网和工业自动化的世界里&#xff0c;OPC UA&#xff08;OLE for Process Control Unified Architecture&#xff09;协议凭借其开放性和互操作性&#xff0c;正在逐渐成为不同设备和系统间通信的桥梁。然而&#xff0c;在实际应用中&#xff0c;由于各种历史和技术原因&a…

【MySQL】视图、索引

目录 视图视图的用途优点视图的缺点创建视图查看视图修改视图删除视图注意事项 索引索引的原理索引的数据结构二分查找法Hash结构Hash冲突&#xff01;&#xff01;&#xff01; B树二叉查找树 存在问题改造二叉树——B树降低树的高度 B树特点案例继续优化的方向 改造B树——B树…

基于Java的快递管理系统(Vue.js+SpringBoot)

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、研究内容2.1 数据中心模块2.2 快递类型模块2.3 快递区域模块2.4 快递货架模块2.5 快递档案模块 三、界面展示3.1 登录注册3.2 快递类型3.3 快递区域3.4 快递货架3.5 快递档案3.6 系统基础模块 四、免责说明 一、摘要 1.1 项目介绍 …

万物皆可Find My,伦茨科技ST17H6x芯片赋能产品苹果Find My功能

苹果的Find My功能使得用户可以轻松查找iPhone、Mac、AirPods以及Apple Watch等设备。如今Find My还进入了耳机、充电宝、箱包、电动车、保温杯等多个行业。苹果发布AirTag发布以来&#xff0c;大家都更加注重物品的防丢&#xff0c;苹果的 Find My 就可以查找 iPhone、Mac、Ai…

【RK3568+RV1126】NPU算力集成

通过瑞芯微RK3568使用USB RNDIS网络与多个RV1126算力棒进行网络通信&#xff0c;打造多算力集群&#xff0c;同时进行AI运算处理&#xff0c;NPU算力集成不仅能增加算力&#xff0c;更能灵活的控制成本&#xff0c;具有更高的性价比&#xff0c;更低的功耗。 Mini-PCIe接口的RV…

华为交换机vlan实验

一、目标 实现不同vlan之间的终端通信 二、命令学习 1.创建2个vlan # 进入系统视图 sy# 创建vlan vlan 10 vlan 202.查看vlan # 2.查看vlan display vlanThe total number of vlans is : 3 ---------------------------------------------------------------------------…

Flink JobGraph构建过程

文章目录 前言JobGraph创建的过程总结 前言 在StreamGraph构建过程中分析了StreamGraph的构建过程&#xff0c;在StreamGraph构建完毕之后会对StreamGraph进行优化构建JobGraph&#xff0c;然后再提交JobGraph。优化过程中&#xff0c;Flink会尝试将尽可能多的StreamNode聚合在…

【Redis】redis的基本使用

&#x1f4dd;个人主页&#xff1a;五敷有你 &#x1f525;系列专栏&#xff1a;Redis ⛺️稳中求进&#xff0c;晒太阳 Redis的概述 为什么要有redis? redis是数据库&#xff0c;mysql也是数据库&#xff0c;redis做缓存的意义就是为了减轻数据库压力 数据库为什么…

【归并排序】AcWing. 505 / NOIP2013提高组《火柴排队》(c++)

【题目描述】 涵涵有两盒火柴&#xff0c;每盒装有 n 根火柴&#xff0c;每根火柴都有一个高度。 现在将每盒中的火柴各自排成一列&#xff0c;同一列火柴的高度互不相同&#xff0c;两列火柴之间的距离定义为&#xff1a; 其中 ai 表示第一列火柴中第 i 个火柴的高度&a…

OWASP Top 10 网络安全10大漏洞——A02:A02:2021-加密机制失效

10大Web应用程序安全风险 2021年top10中有三个新类别、四个类别的命名和范围变化&#xff0c;以及一些合并。 A02&#xff1a;A02:2021-加密机制失效 上升一个位置&#xff0c;当前top2&#xff0c;以前称为敏感数据泄露&#xff0c;是一种状况而不是根本原因。更新后的类别…

c#简易学生管理系统

https://pan.baidu.com/s/1kCPvWg8P5hvlf26nGf2vxg?pwdya45 ya45

15.Django总结

文章目录 1.Django创建项目的命令2.MVC,MVT的理解3.Django中间件的使用4.WSGI,uWSGI服务器 和 uwsgi协议5.nginx和uWISG 服务器之间如何配合工作的6.django开发中数据库做过什么优化7.Python中三大框架各自的应用场景8.django如何提升性能(高并发)9. 什么是restful api谈谈你的…

day11_SpringCloud(Nacos注册中心,LoadBalancer,OpenFeign)

文章目录 Spring Cloud Alibaba1 系统架构演进1.1 单体架构1.2 微服务架构1.3 分布式和集群 2 Spring Cloud Alibaba概述2.1 Spring Cloud简介2.2 Spring Cloud Alibaba简介 3 微服务环境准备3.1 工程结构说明3.2 父工程搭建3.3 用户微服务搭建3.3.1 基础环境搭建3.3.2 基础代码…