论文浅尝 | 常识问答中的忠诚知识图解释

news2024/12/26 7:11:47

94f48bb9c857d9da19bb2ad3f0542981.png

笔记整理:邹铭辉,天津大学硕士,研究方向为知识图谱

链接:https://aclanthology.org/2022.emnlp-main.743

动机

知识图谱通常被用作常识问答的信息来源,同时也可以用来解释模型对答案的选择。纳入图谱中事实信息的一个常见方式是:将图谱信息与问题分别编码,然后将两种表示结合起来用于答案选择。在本文中,作者认为不能从此类模型中提取基于图的、高度忠诚的解释。因为这样的解释将不包括编码器在编码问题时所做的推理,是不完整的。本文用一种新的忠诚度代理测量方法证实了这一理论,并提出了两个架构变化来解决这一问题。本文的发现为开发基于图的忠诚的解释架构指出了一条前进的道路。

亮点

本文的亮点主要包括:

(1) 从理论和实验上分析验证了现有的基于图的解释在忠诚度上存在缺陷,其主要原因在于现有模型在推理过程中主要依赖于文本编码器而非图编码器。

(2) 提出了两个架构变化尝试验证并解决基于图的解释不完整的问题,实验结果表明了这种架构变化的有效性。

模型结构

1b55708ac281d841d064c910cc550279.png

本文关注于一类结合了文本编码器和图编码器的模型(如图1所示)。在这类模型中,解释可以自然的表示成输入图中一些边的集合(如图2所示),并且可以用来理解模型在选择答案时使用了哪些事实。具体来说,本文选择了两个模型进行测试:MHGRN和QA-GNN。这两个模型的高层操作是可比较的,并且能够代表其他具有相同结构的模型。

7932106fbf8d664336c17185ffa61548.png

在上述两个模型中,文本编码器基于RoBERTa-Large进行构建,它以问题和候选答案作为问题上下文进行语义编码,此外问题上下文还会被用于从大规模知识图中抽取出一个至多包含200个节点的子图(有时称为模式图)。图编码器基于GNN进行构建,它针对抽取出的子图进行语义编码。这两个模型的一个关键区别是GNN的结构。在MHGRN的每一层,通过子图找到以每个节点为终点的多条路径,对其进行编码,然后汇集起来形成新的节点嵌入。QA-GNN则通过聚合直接邻居的信息来更新每一层的节点。此外,这两个模型还以不同的方式使用每层的文本嵌入,在MHGRN中,当为每个节点创建新的嵌入时,它被用来计算每条路径的相关性;在QA-GNN中,一个用这个文本嵌入初始化的伪节点会被添加到图中,从而允许文本嵌入参与与其他节点的信息传递。

最后,为了给每个候选答案打分,问题上下文表示和子图表示首先被拼接到一起,然后利用MLP网络进行打分。

解释的忠诚度问题

本文认为此类模型生成的解释的忠实度低是因为模型使用文本和图嵌入来选择候选答案,但解释仅从图编码器中提取。因此,这些解释无法完全描述用于回答问题的事实,因为文本编码器可能也提供了相关信息,而图结构的解释必然是不完整的。

为了增强解释的忠诚度,本文从以下三个方面进行改变:

(1)使用文本嵌入

在模型最后的MLP网络中,文本嵌入直接用于预测候选答案的得分(即图1中橙色虚线)。这是绕过图编码器最明显的方式,本文认为如果要用基于图的解释来理解模型,就必须去除文本嵌入。

(2)冻结文本编码器

另一种最小化文本编码器影响的方法是在训练期间将其冻结。在这种情况下,模型仍然可以生成问题上下文的有意义的表示,同时只需要最少的任务特定信息。使用这些表示而不经过微调必然会增加忠实性,因为此时图编码器在推理过程中占据了更高的地位。

(3)可解释性技术

尽管不是本文的研究重点,评估解释抽取技术的忠诚度同样是十分重要的。MHGRN和QA-GNN模型都是利用注意力值来选择子图中的一些边作为解释,但是目前尚不清楚这种注意力是否能够忠诚的反应模型推理的过程。因此,可以考虑使用一些专门为忠诚度设计的方法进行替代,例如GraphMask。

除了理论上的分析,本文还提出了一种代理测量方法用于评价本文提出改进方法的影响。首先,本文提出了一个假设:如果能够从图编码器中抽取出忠诚的解释,那么在输入上的巨大修改将会对模型行为产生巨大影响。如果这一假设不成立,则表明推理过程是在模型不同的部分上进行的,此时,基于图的解释将不忠诚于整个模型的工作过程。具体来说,本文中对图编码器输入所作的修改是在问题之间对模式图进行打乱,使得模式图变得无关紧要。如果推理过程主要是在图编码器上进行的话,经过上述打乱操作,模型的性能将会急剧下降。

实验结果

本文将常规图数据和打乱图数据与三种不同的模型进行结合:(1)原始MHGRN和QA-GAN;(2)去除最后MLP网络中的文本嵌入(-Embed);(3)去除文本嵌入的同时冻结文本编码器的参数(-Train TE)。实验结果如表1所示。

1377039835c706fc57f60d10313b672e.png

(1)原始模型

在所有四种情况下,模型在打乱图数据上准确率都很高,且与常规图数据情况没有显著差异。这与上文中的假设相矛盾,因此这个结果表明此类模型架构几乎在文本编码器上进行了所有的推理。即使在常规场景中,很大一部分推理也可能是在图编码器之外完成。可以得出结论:从图编码器中提取的解释不能反映整个模型的工作原理。

(2)去除文本嵌入

可以看到,除了MHGRN在OBQA数据集上的结果外,其余三组实验设置都在常规与打乱场景下表现出了显著差异,即将图编码器的输入替换成无意义的输入时,模型性能会显著下降。这一实验结果表明,在去除文本嵌入之后,模型在推理过程中更加依赖于图编码器,从而基于图的解释能够增加忠诚于模型的整体行为。

(3)冻结文本编码器

当在去除文本嵌入的同时冻结文本编码器时,可以看到所有四种情况下,模型在常规与打乱场景下都表现出了显著差异。这些结果表明了此时图编码器是对性能影响最大的模型组件,这是检索忠诚解释的理想情况。

总结

本文试验证明了,在MHGRN和QAGNN中,限制预训练文本编码器学习任务的能力会导致模型准确性显著降低。这一结果表明,在此类模型中对性能贡献最大的是文本编码器。此外,本文的发现还有另外一个事实支持:在问题之间重排子图对性能没有显著影响。因此,从图编码器中提取的解释将不忠于模型的整体操作,因为它们不会捕获在文本编码器中完成的实质性推理。更进一步的,本文通过两个变种实验验证了“去除文本嵌入”和“冻结文本编码器”在增强解释忠诚度上的有效性。未来关于忠实解释模型的工作可能会以类似于MHGRN的方式构建他们对文本编码器的使用,因为这种方式更容易生成忠实的解释。此类工作可能会研究如何更好地训练文本编码器来权衡事实的关联性。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

3a021f2f7db68a441996b82ead3936c8.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/539304.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

诺贝尔奖得主Warshel:用计算化学揭开生命底层分子运行机制|智源大会嘉宾风采...

导读 复杂化学系统的多尺度建模可以用于计算机辅助药物设计、疾病致病机制、早期诊断生物标记、创新药物开发,这些具有划时代意义的研究成果,都凝结着计算化学研究先驱Arieh Warshel夜以继日的努力。 Warshel的传奇人生始于以色列一家公社的鱼塘&#xf…

【强烈推荐】3dMax自动展UV神器UV-Packer插件

UV-Packer是一款快速、精确的UV自动展开工具。这是一个一键式的解决方安,可以解决将展开的多边形排序和压缩成UV片的艰巨工作。 【适用版本】 3dMax2015-2024 【主要特性】 最小的UV区域浪费 确定良好 UV 包装的第一条规则是未覆盖的 UV 区域有多少。 浪费的空间…

操作系统的发展史(DOS/Windows篇)

操作系统的最强入门科普(Unix/Linux篇) 上一篇文章,小枣君介绍了Unix和Linux操作系统的诞生和发展。今天这篇,我再来说说微软的DOS和Windows系列。 █ DOS操作系统 上期提到,20世纪70年代,伴随着计算机技术…

360QPaaS参编信通院《组装式应用开发平台研究报告》| 应用前沿

在数字化转型的大背景下,“组装式应用” 成为行业重要战略趋势之一。数字化相较于信息化,强调基于信息数据反哺业务,业务进一步促进系统的迭代优化。组装式应用平台就是一种以业务为中心的模块化组件构成。组装式应用协力提供更灵活的组装式部…

Apache Iceberg 中引入索引提升查询性能

动手点关注 干货不迷路 ‍ ‍Apache Iceberg 是一种开源数据 Lakehouse 表格式,提供强大的功能和开放的生态系统,如:Time travel,ACID 事务,partition evolution,schema evolution 等功能。 本文将讨论火山…

治病如救火,怎样让新药研发更快、更省、更准?

说起医疗与生命科学行业,许多人可能都会想到一句俗语——“治病如救火”,可见其分秒必争的时效性。 然而,如果与日新月异的科技行业相比,医疗与生命科学行业在研发上的速度则慢得惊人。来自《自然》杂志的数据显示,一款…

搭建企业级ESB:让接口管理高效

目 录 01 接口管理现状分析‍‍‍‍‍ 02 ESB对接口的管理‍‍‍‍‍‍ 03 ESB接口管理的发展‍‍‍‍ 04 总结 01 接口管理现状分析‍ 随着社会的发展企业中建立了许多系统,系统中提供了许多接口作为业务解耦的重要手段。随着业务关系越来越复杂、依赖越来越多&…

Krpano之一全景图中嵌入可闪烁的热点图片

效果 步骤 1、打开ptgui软件加载全景图 2、镜头参数设置 3、编辑全景图 4、设置编辑模式 5、拖动鼠标和划动两个方向来调整全景图范围 调整后大概是这样的,我只要在这个区域画一个面即可,尽量让调整后是俯视图,这样在这基础上画的面会比较正一些

拼多多买家如何导出“个人中心”订单信息

经常在拼多多买东西,有时候需要把订单的物流信息导出来,方便记录和统计。现介绍如何使用dumuz工具来实现批量下载拼多多订单。 应用功能描述 模拟人工操作拼多多"个人中心-我的订单”订单网页,批量查询获取拼多多自己买的商品的订单数…

Istio 微服务架构的演变

微服务架构的演变 单体模式下面一个应用通常会有一个app server,这个app server里面会有不同的子模块,每一个模块都写在同一个应用包里面,模块和模块之间的边界有些时候设计的不是特别清晰,特别早期代码混合在一起那么意味着互相的…

PCL学习之滤波算法

前言 点云滤波作为常见的点云处理算法,一般是点云处理的第一步,对后续处理有很重要作用。滤波 有很多方面也有很多种功能,比如去除噪声点、离群点、点云平滑以及空洞、数据压缩等 原始点云数据往往包含大量散列点、孤立点,在获取…

CS 224N总结

CS 224N网址:Stanford CS 224N | Natural Language Processing with Deep Learning Lecture1 PPT网址:PowerPoint Presentation (stanford.edu) 这一讲主要讲了NLP研究的对象,我们如何表示单词的含义,以及Word2Vec方法的基本原…

Ubuntu22 k8s 1.27.1 安装及集群搭建教学(2023.5.16 k8s 最新版本教学,只看这一篇就够了哦!保姆级教程!不行你来找我!)

Ubuntu22 k8s 1.27.1 安装及集群搭建教学(2023.5.16 k8s 最新版,只看这一篇就够了哦!保姆级教程!!不行你来找我!) 温馨提示请仔细阅读:❤️❤️❤️❤️❤️❤️❤️❤️ 1. 由于新版…

Linux系统学习须牢记这几点

工欲善其事须先利其器,想了解Linux技术,先要有一套教学平台,请教同行或者老师来为我们解答,当然也可以下载Cygwin进行学习。但是自主学习的这一过程很困难,因为没有别人的帮助,我们或许会感到迷茫,也会出现…

Spring整合Mybatis、Junit

文章目录 1 Spring整合Mybatis思路分析1.1 环境准备步骤1:准备数据库表步骤2:创建项目导入jar包步骤3:根据表创建模型类步骤4:创建Dao接口步骤5:创建Service接口和实现类步骤6:添加jdbc.properties文件步骤7:添加Mybatis核心配置文件步骤8:编写应用程序步骤9:运行程序 1.2 整合…

STM32F1定时器(TIM1~TIM8)

一、stm32f1定时器简介 1.1、定时器分类 STM32共11个定时器,2个高级控制定时器TIM1和TIM8,4个通用定时器TIM2~TIM5,两个基本定时器TIM6和TIM7,两个看门狗定时器和一个系统滴答定时器Systick. 高级定时器TIM1和TIM8的时钟由APB1产…

想改进婴儿fNIRS数据分析?基于这些先进方法的评估值得一看!

导读 在过去的十年中,fNIRS提供了一种非侵入性的方法来研究发展人群的神经激活。尽管fNIRS在发展认知神经科学中的应用越来越多,但在如何预处理和分析婴儿fNIRS数据方面却缺乏一致性或共识。本研究考察了对婴儿fNIRS数据应用更高级统计分析的可行性&…

智聚北京!相约全球人力资源数智化峰会

人力资源是推动经济社会发展的第一资源。作为我国经济压舱石的中央企业在对标世界一流企业和管理提升方面的持续创新,各行业领军企业围绕组织变革、管理升级、全球化发展走深走实。人力资源管理正从传统职能管理与管控,向紧贴业务战略实现、组织边界和人…

阿里巴巴-1688-退款退货明细下载(导出)

DUMUZ是什么? Dumuz是一款软件产品,可模拟人在电脑上的不同系统之间操作行为, 替代人在电脑前执行具有规律与重复性高的办公流程。 目前基于实际业务场景在软件搭建了模拟实现天猫/淘宝批量订单发货、备注插旗、页面商品数据采集、已买宝贝订…

小米AI实验室多模态图片翻译论文入选自然语言处理领域顶级会议ACL 2023

近日,ACL 2023的论文录用结果公布,小米AI实验室机器翻译团队联合厦门大学苏劲松教授团队在多模态图片翻译方向的最新研究成果已被ACL 2023主会录用,标志着小米在多模态机器翻译方向取得了重要进展。 ACL(Annual Meeting of the As…