摘要
最近关于知识图(KGs)的研究表明,通过预先训练的语言模型授权的基于路径的方法在提供归纳和可解释的关系预测方面表现良好。本文引入关系路径覆盖率和关系路径置信度的概念,在模型训练前过滤掉不可靠的路径,以提高模型的性能。此外,我们提出了知识推理句子转换器(Knowledge Reasoning Sentence Transformer, KRST)来预测KGs中的归纳关系,KRST将提取的可靠路径编码在KGs中,使我们能够适当地聚类路径并提供多方面的解释。我们在三个真实世界的数据集上进行了广泛的实验。实验结果表明,与SOTA模型相比,KRST在大多数传导和感应测试用例(6个中的4个)和12个少射测试用例中的11个中都达到了最佳性能。
1.介绍
知识图(knowledge graph, KG)作为问答和推荐系统提供侧信息的重要工具(Ji et al 2021)得到了广泛的研究。KG通常用三元组G = {(hi, ri, ti)|i = 1,2,3,…, m},其中包含实体hi, ti∈EG和关系ri∈RG。由于知识图谱在实际应用中的不完全性,需要利用知识图谱补全技术来提高知识图谱的质量,其中关系预测是知识图谱补全的重要任务之一。给定目标三元组(h, r, t),通常通过屏蔽给定三元组中的实体h或t,并让模型基于另一个实体和关系类型预测被屏蔽的实体来设置关系预测查询。
基于嵌入的方法可能是最常用的SOTA模型。使用一组固定的实体和关系,基于嵌入的方法在KGC任务中表现相当好。然而,大多数现有的基于嵌入的方法是不可解释的,不能处理归纳情况,使得它们不适合建模现实世界的动态KGs,其中可能会