论文浅尝 | QA-GNN:结合语言模型与知识图谱进行问答推理

news2025/1/18 4:51:48

461a663da308a6e87814becb170735fb.png

笔记整理:项卓怡,浙江大学硕士,研究方向为生化大模型。

链接:https://arxiv.org/abs/2104.06378

Code:https://github.com/michiyasunaga/qagnn

Citation: Yasunaga M, Ren H, Bosselut A, et al. QA-GNN: Reasoning with language models and knowledge graphs for question answering[J]. arXiv preprint arXiv:2104.06378, 2021.

1. 动机

预训练语言模型在自然语言处理领域取得了巨大成功,例如BERTGPT等模型在各种文本理解任务上取得了令人瞩目的性能。然而,这些模型虽然在一般文本处理中表现出色,但在特定领域的应用仍存在一些挑战。特别是在生物医学领域,由于其专业性和复杂性,传统的通用语言模型在处理生物医学文本时可能遇到一些困难。这些困难包括生物医学术语的复杂性、上下文的特殊性以及领域内的专业知识需求等。因此,为了更好地应用自然语言处理技术于生物医学领域,本文开发了一种专门针对生物医学领域的生成预训练转换器(QA-GNN),以解决生物医学文本处理中的挑战和问题。通过深入理解生物医学文本的语义、结构和特点,可以更好地设计和优化语言模型,使其能够在生物医学领域中发挥更大的作用。因此,本文旨在探索并实现一种结合了自然语言处理和生物医学知识的先进模型,为生物医学研究和应用提供更加精确和高效的文本处理工具。

2. 贡献

本文的主要贡献有:

1)将语言模型(LMs)与知识图谱(KGs)整合,以实现QA任务中的全面推理。

2)提出了一种图神经网络(GNN)架构,有效融合了LMsKGs的信息,提高了问答准确性。

3)通过对基准数据集的广泛实验,展示了QA-GNN相对于基线模型的卓越性能。

3. 方法

QA-GNN主要包括以下几部分:

1. 编码QA上下文和检索KG子图:QA-GNN框架的第一步是使用语言模型(LM)组件对QA上下文进行编码。这个编码过程捕捉了输入问题和上下文的语义和句法信息。同时,根据QA上下文中提及的主题实体,检索KG子图。这个子图检索遵循了先前工作中提出的方法,如Feng等人(2020年),确保包含相关知识。

2.QA-GNN两个重要部分:第一个是引入了KG节点关联性评分。这个评分机制旨在衡量KG子图中不同实体在给定QA上下文中的重要性。为了实现这一目标,使用一个预训练的LMKG子图中的每个实体进行评分。评分过程包括将实体与QA上下文连接起来,并使用LM计算其可能性。这种方法提供了一个灵活的框架,可以根据其与QA任务的相关性来为KG信息分配权重。

第二个是联合推理方法。设计了一个联合图表示,将QA上下文和KG信息无缝集成在一起。这个表示包括一个额外的节点,称为QA上下文节点,它连接到KG子图中相关的主题实体。生成的联合图称为工作图,有效地将QA上下文和KG融合为一个统一的结构进行推理。为了促进联合推理,工作图中每个节点的特征都会与之前获得的关联性评分相结合。随后,采用基于注意力的图神经网络(GNN)模块对这个联合表示进行推理。联合推理算法迭代地更新KG实体和QA上下文节点的表示,促进信息交换并填补文本和结构化知识来源之间的差距。

3. 训练和推理:QA-GNN模型采用监督学习方法进行训练,目标是最小化一个预定义的损失函数,该损失函数捕捉了预测答案与真实答案之间的对齐关系。在推理阶段,训练好的模型接受QA上下文作为输入,使用LM组件对其进行编码,检索相关的KG子图,在工作图上进行联合推理,并基于学习到的表示和推理过程生成最终的答案。

总而言之,QA-GNN通过引入关联性评分和联合推理机制,使得可以通过有效利用文本上下文和结构化知识来提高问答性能。

c4f925cdcbe53259208d09df9628048d.png1 QA-GNN

4. 实验

实验在三个QA数据集下评估:CommonsenseQA (Talmor et al., 2019), OpenBookQA (Mihaylov et al., 2018), and MedQA-USMLE (Jin et al.,2021

首先是QA任务实验:针对问题回答(QA)任务进行了实验,通过使用QA-GNN模型对一系列问题进行回答,评估其准确性和回答质量。与RoBERTa-largeFine-tuned LM以及目前存在的LM+KG models比如Relation Network (RN) (Santoro et al., 2017), RGCN (Schlichtkrull et al., 2018), GconAttn (Wang et al., 2019a)等等,以下是在commonsense QA数据集下的表现,此外还有OpenBook QA的实验对比,除了T5unifiedQA使用了更多训练数据和参数,QA-GNN的表现都优于其他模型。

8ce25c503ee4d7c2789dfed7e9a08f00.png

2Commonsense QA上的表现

接下来是消融试验,分别做了(1)、知识图谱关联性评分实验:对KG中的实体进行关联性评分实验,探究在给定QA上下文的情况下,不同实体对问题的相关性程度,以此为基础来调整模型对知识的利用。(2)、联合推理实验:进行了联合推理实验,验证了在联合表示下,模型在结合QA上下文和KG信息时的性能和表现。(3)、对抗性测试实验:针对模型的鲁棒性进行了对抗性测试实验,探究模型在面对干扰性输入或误导性问题时的表现。结果如图3所示。

94d2a74a776ce451732179c12462e56c.png

3Commonsense QA IHdev上进行的消融试验

5. 总结

QA-GNN通过整合语言模型和知识图谱的优势,提供了一种新颖的问答方法。通过利用文本信息和结构化知识,QA-GNN在复杂QA任务中取得了卓越表现,展示了整合推理模型在自然语言理解中的潜力。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

247adf4de784cbdf729844e590e5ffa7.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1603176.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pytest学习-pytorch单元测试

pytorch单元测试 一.公共模块[common.py]二.普通算子测试[test_clone.py]三.集合通信测试[test_ccl.py]四.测试命令五.测试报告 希望测试pytorch各种算子、block、网络等在不同硬件平台,不同软件版本下的计算误差、耗时、内存占用等指标. 本文基于torch.testing._internal 一…

Python基于Django搜索的目标站点内容监测系统设计,附源码

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

Android Studio XML 预览View 底部移动到右边

以前 XML 的预览都是在右边的,最近不知道为什么突然到下面去了,很不习惯 找半天想把 预览view 移动到右边,一直没找到按钮。 误打误撞移回来了,原来只要再点击一次 split,就可以变动位置了,记录一下。

ChatGPT及GIS、生物、地球、农业、气象、生态、环境科学领域案例

以ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮,可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算法学习、论文检索、写作、翻译、润色、文献辅助…

C++教你如何模拟实现string,如何实现string写时拷贝

文章目录 前言成员变量默认成员函数默认构造函数拷贝构造函数析构函数赋值运算符重载 容量相关函数(Capacity)reserve函数resize函数size函数capacity 函数clear函数 修改函数(Modifiers)swap函数insert函数字符插入字符串插入 ap…

未来城市可视化,A3D引擎支持,免费搭建全新一代数字孪生!

AMRT3D数字孪生引擎https://www.amrt3d.com/#/ 什么是未来城市?它是新型数字化理念的载体,以数字孪生与物理世界城市的融合为核心,通过数字孪生技术在数字空间实时构建城市,采用数据整合和分析预测来实时模拟、预测、控制整体城市…

uniapp之消除图片的空白占用空间

我们在使用uniapp开发的过程中一定会遇到一个情况就是我们加载的图片总有一点空白出现在不该出现的地方代码如下 <view style"background:#ff0000;"><image style"width:100%;"src"https://t7.baidu.com/it/u1819248061,230866778&fm19…

[论文笔记]Root Mean Square Layer Normalization

引言 今天带来论文Root Mean Square Layer Normalization的笔记&#xff0c;论文题目是均方根层归一化。 本篇工作提出了RMSNorm&#xff0c;认为可以省略重新居中步骤。 简介 层归一化对Transformer等模型非常重要&#xff0c;它可以帮助稳定训练并提升模型收敛性&#xf…

uniapp-小程序保存图片到相册

小程序保存图片到相册 一. 将图片保存到手机相册涉及的api 有以下几个 1. uni.getSetting (获取用户的当前设置) 2. uni.authorize&#xff08;提前向用户发起授权请求。调用后会立刻弹窗询问用户是否同意授权小程序使用某项功能或获取用户的某些数据&#xff0c;但不会实际调…

GPT国内能用吗

2022年11月&#xff0c;Open AI发布ChatGPT&#xff0c;ChatGPT展现了大型语模型在自然语言处理方面的惊人进步&#xff0c;其生成文本的流畅度和连贯性令人印象深刻&#xff0c;为AI应用打开了新的可能性。 ChatGPT的出现推动了AI技术在各个领域的应用&#xff0c;例如&#x…

『Django』创建app(应用程序)

theme: smartblue 本文简介 点赞 关注 收藏 学会了 在《『Django』环境搭建》中介绍了如何搭建 Django 环境&#xff0c;并且创建了一个 Django 项目。 在刚接触 Django 时有2个非常基础的功能是需要了解的&#xff0c;一个是“app”(应用程序)&#xff0c;另一个是 url(路由…

kafka---topic详解

一、分区与高可用 在Kafka中,事件(events 事件即消息)是以topic的形式进行组织的;同时topic是分区(partitioned)的,这意味着一个topic分布在Kafka broker上的多个“存储桶”(buckets)上。这种数据的分布式放置对于可伸缩性非常重要,因为它允许客户端应用程序同时从多个…

「 网络安全常用术语解读 」漏洞利用交换VEX详解

漏洞利用交换&#xff08;Vulnerability Exploitability eXchange&#xff0c;简称VEX&#xff09;是一个信息安全领域的标准&#xff0c;旨在提供关于软件漏洞及其潜在利用的实时信息。根据美国政府发布的用例(PDF)&#xff0c;由美国政府开发的漏洞利用交换(VEX)使供应商和用…

postman 调试 传base64字符串 原来选xml

上个图 工具类 package org.springblade.common.utils;import com.alibaba.fastjson.JSONObject; import org.springblade.modules.tc.mas.Submit;import java.io.BufferedReader; import java.io.InputStream; import java.io.InputStreamReader; import java.io.OutputStrea…

tcp三次握手和四次断开以及tcpdump的基本使用

前言 最近工作中会发现有超时的问题&#xff0c;还有就是在面试的时候很多都要求深入理解TCP/IP协议。突然感觉TCP/IP协议是一个既熟悉&#xff0c;又陌生的技术。又想到上大学的时候&#xff0c;老师说过 网络的圣经&#xff1a;“TCP/IP详解” 卷一 卷二 卷三&#xff0c;三…

Spring之CGLIB和JDK动态代理底层实现

目录 CGLIB 使用示例-支持创建代理对象&#xff0c;执行代理逻辑 使用示例-多个方法&#xff0c;走不同的代理逻辑 JDK动态代理 使用示例-支持创建代理对象&#xff0c;执行代理逻辑 Spring会自动在JDK动态代理和CGLIB之间转换: 1、如果目标对象实现了接口&#xff0c;默…

基于51单片机智能鱼缸仿真LCD1602显示( proteus仿真+程序+设计报告+讲解视频)

基于51单片机智能鱼缸仿真LCD显示 1. 主要功能&#xff1a;2. 讲解视频&#xff1a;3. 仿真4. 程序代码5. 设计报告6. 设计资料内容清单&&下载链接资料下载链接&#xff1a; 基于51单片机智能鱼缸仿真LCD显示( proteus仿真程序设计报告讲解视频&#xff09; 仿真图prot…

【Web】NewStarCTF 2022 题解(全)

目录 Week1 HTTP Head?Header! 我真的会谢 NotPHP Word-For-You Week2 Word-For-You(2 Gen) IncludeOne UnserializeOne ezAPI Week3 BabySSTI_One multiSQL IncludeTwo Maybe You Have To think More Week4 So Baby RCE BabySSTI_Two UnserializeT…

IDEA 安装、基本使用、创建项目

文章目录 下载基本使用修改颜色主题Keymap插件 创建项目创建模块新建 Java 类运行新建 Package打包 Jar运行 jar 包 查看文档 下载 官方下载地址&#xff1a;https://www.jetbrains.com/zh-cn/idea/download/?sectionmac 这里我下载 macOS 社区版&#xff0c;IDEA 2024.1 (C…

mPEG-Glutaramide Acid结合了聚乙二醇(PEG)和戊二酸(GAA)的性质

【试剂详情】 英文名称 mPEG-GAA&#xff0c;Methoxy PEG GAA&#xff0c; mPEG-Glutaramide Acid 中文名称 聚乙二醇单甲醚酰胺戊二酸&#xff0c; 甲氧基-聚乙二醇-戊二酰胺酸 外观性状 由分子量决定 分子量 400,600&#xff0c;2k&#xff0c;3.4k&#xff0c;5k&…