LESS IS MORE: ONE-SHOT-SUBGRAPH LINK PREDICTION ON LARGE-SCALE KNOWLEDGE GRAPHS

news2025/1/15 16:35:16

LESS IS MORE: ONE-SHOT-SUBGRAPH LINK PREDICTION ON LARGE-SCALE KNOWLEDGE GRAPHS(ICLR2024)

在这里插入图片描述

论文地址:https://arxiv.org/html/2403.10231v1
源码地址:https://github.com/tmlr-group/one-shot-subgraph

ABSTRACT

为了推断知识图 (KG) 上的新事实,链接预测器从图结构中学习并收集本地证据以找到给定查询的答案。 然而,由于利用整个知识图谱进行预测,现有方法面临严重的可扩展性问题,这阻碍了它们在大规模知识图谱上的应用,并且无法通过普通采样方法直接解决。
在这项工作中,我们提出了一次性子图链接预测来实现高效和自适应的预测。 设计原则是,预测过程不是直接作用于整个知识图谱,而是解耦为两个步骤,即(i)根据查询仅提取一个子图,以及(ii)对这个单一的、依赖于查询的子图进行预测。 我们发现,非参数和计算高效的启发式个性化 PageRank (PPR) 可以有效地识别潜在的答案和支持证据。

预测系统从知识图谱的局部结构中学习,现有的方法通常可以概括为两类:(1)语义模型,通过学习实体和关系的低维嵌入来隐式捕获局部证据(Bordes等,2017)。 ,2013;Dettmers 等,2017;Zhang 等,2017; (2) 基于关系路径或图的循环神经网络 (RNN) 或图神经网络 (GNN) 显式探索 KG 结构的结构模型(Das 等人,2017 年;Schlichtkrull 等人,2018 年;Sadeghian 等人) ., 2019;Teru 等人, 2021; Zhu 等人, 2022)。 尽管实现了领先的性能,但这些结构模型面临着严重的可扩展性问题,因为整个 KG 已被潜在或逐步用于预测。 这种低效的方式阻碍了它们在大规模知识图谱(例如 OGB)上的应用和优化(Hu et al., 2020)。 因此,它提出了一个悬而未决的问题:知识图谱预测所需的所有信息都是必要的吗? 直观上,人脑中存储的知识只有部分与给定问题相关,这些知识是通过回忆提取出来的,然后在仔细的思考过程中使用。 同样,生成候选者然后对有前途的候选者进行排名是拥有数百万甚至数十亿用户的大规模推荐系统的常见做法(Cheng et al., 2016;Covington et al., 2016)。 这些事实激励我们通过有效的知识图谱采样机制来进行有效的链接预测。

在这项工作中,我们提出了一种新颖的知识图上的一次性子图链接预测。 这个想法为从以数据为中心的角度缓解现有知识图谱方法的可扩展性问题提供了一种新方法:将预测过程解耦为具有相应采样器预测器的两个步骤。 因此,特定查询的预测是通过(i)使用采样器对一个依赖于查询的子图进行快速采样和(ii)使用预测器对子图进行慢速预测来进行的。 然而,由于两大挑战,在大规模 KG 上实现高效且有效的链接预测并非易事。 (1) 采样速度和质量:一次性采样器的快速采样应能够覆盖支持查询的必要证据和潜在答案。 (2)联合优化:采样器和预测器应该联合优化,以避免琐碎的解决方案,并保证整个模型对特定KG的表达能力和适应性。

为了从技术上解决这些挑战,我们首先通过非参数和计算高效的个性化PageRank(PPR)实现一次性子图链接预测,它能够有效地识别潜在的答案,而无需学习。 通过有效的基于子图的预测,我们进一步建议在数据和模型空间中搜索数据自适应配置。 我们证明没有必要在推理中使用整个 KG; 同时,只需相对较小比例的信息(例如 10% 的实体)就足够了。

贡献:
• 我们在概念上形式化了 KG 上一次性子图链接预测的新方式(第 3 节),并在技术上用高效的启发式采样器和强大的 KG 预测器将其实例化(第 4.1 节)。
• 我们解决了一个重要的双层优化问题,即在数据和模型空间中搜索最优配置(第 4.2 节),并从理论上分析了外推能力(第 4.3 节)。

2 PRELIMINARIES

在这里插入图片描述在这里插入图片描述

3 One-shot-subgraph LINK PREDICTION ON KNOWLEDGE GRAPHS

框架目的
在这里插入图片描述
大致思路:先根据带查询的三元组(h,r,?)生成一个子图, 将子图表示输入全连接层得到尾实体的概率分布

Comparison with existing manners of prediction

在这里插入图片描述

该论文模型相比于其他模型的优势:
在这里插入图片描述

Comparison with existing sampling methods

在这里插入图片描述

在这里插入图片描述

4 INSTANTIATING THE ONE-SHOT-SUBGRAPH LINK PREDICTION

在这里插入图片描述

4.1 REALIZATION: THREE-STEP PREDICTION WITH PERSONALIZED PAGERANK(实现:个性化 PAGERANK 的三步预测)

在这里插入图片描述
(1)根据采样器生成采样概率分布
(2)根据概率分布采样k个节点和边
(3通过预测器,预测根据采样生成的子图。

例子:连接预测任务(u,q,?) ,?是v。
Step-1. Generate sampling distribution

先前的研究表明,v通常接近u,并且支持查询的连接u和v的关系路径也接近u。 为了有效地捕获u的本地证据,我们选择启发式个性化PageRank(PPR)(Page et al., 1999; Jeh &Widom, 2003)作为抽样指标。 请注意,PPR 不仅因其非参数性质而高效,而且因其从 u 开始的单源评分而具有查询相关性和局部结构保留性。

具体来说,PPR 从 u 开始传播,以评估 u 的每个邻居的重要性,并生成 PageRank 分数作为对查询实体 u 的局部邻居进行编码的采样概率。 此外,它还可以通过利用来自大邻域的信息来保留子图的局部性和连通性。
在这里插入图片描述

Step-2. Extract a subgraph

在这里插入图片描述

有效消息从 u 传播到采样实体 o ∈ Vs。
表示的逐层更新被表述为
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

代码讲解

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

这个算法通过在知识图谱上生成与查询相关的子图,并在子图上进行多层次的图神经网络传播,最终计算每个节点与查询节点的关联性分数。整个过程包括生成采样分布、提取子图、节点表示传播和最终预测输出,每一步都紧密结合,以提高链路预测的准确性和效率。

注意:在子图上进行推理(该过程会推理L步,其推理过程不会添加新的节点和边)

传播过程指的是在已采样好的子图上进行多层次的图神经网络(GNN)传播操作。这包括节点表示的更新和消息传递。

在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

损失函数:在预测输出的过程中,损失函数用于衡量模型预测结果与真实标签之间的差异,从而指导模型的优化。本文中采用的损失函数是二元交叉熵损失函数(Binary Cross-Entropy Loss),具体公式和解释如下:在这里插入图片描述在这里插入图片描述

汇总:

传播过程中是在预先采样好的子图上进行的。整个过程中,不会引入新的节点和边。所有的传播和消息传递操作都仅在这个固定的子图内进行。这种方法确保了计算的可控性和效率,同时保留了子图中有用的信息用于链路预测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1691187.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024最新 Jenkins + Docker 实战教程(六)- Jenkins配置邮箱接收构建通知

😄 19年之后由于某些原因断更了三年,23年重新扬帆起航,推出更多优质博文,希望大家多多支持~ 🌷 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志 🎐 个人CSND主页——Mi…

软件设计:基于 python 代码快速生成 UML 图

1. 官方文档 PlantUML Language Reference Guide Comate | 百度研发编码助手 百度 Comate (Coding Mate Powered by AI) 是基于文心大模型的智能代码助手,结合百度积累多年的编程现场大数据和外部优秀开源数据,可以生成更符合实际研发场景的优质代码。…

element-plus表格的表单校验如何实现,重点在model和prop

文章目录 vue&#xff1a;3.x element-plus&#xff1a;2.7.3 重点&#xff1a; 1) tableData放到form对象里 2) form-item的prop要写成tableData.序号.属性 <!--table-表单校验--> <template><el-form ref"forms" :model"form"><e…

【Linux系列】软链接使用

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

基于自抗扰控制器和线性误差反馈控制律(ADRC-LSEF)的控制系统simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1 ADRC原理 4.2 线性误差反馈控制律(LSEF) 4.3 ADRC-LSEF融合系统 5.完整工程文件 1.课题概述 基于自抗扰控制器和线性误差反馈控制律(ADRC-LSEF)的控制系统simulink建模与仿真。 2.系统仿真结果 …

基于Java的地震震中附近城市分析实战

目录 前言 一、空间数据说明 1、空间查询 二、Java后台开发 1、模型层设计与实现 2、控制层设计与实现 三、Leaflet地图开发 1、地震震中位置展示 2、附近城市展示 3、成果展示 总结 前言 随着全球气候变化和地壳活动的不断演变&#xff0c;地震作为一种自然灾害&…

“AIGC行业投资时机分析:评估当前市场发展阶段与未来需求趋势“

文章目录 每日一句正能量前言行业前景当前发展前景相关领域的发展趋势行业潜力竞争情况结论 市场需求人才需求情况机会挑战结论 选择与规划自我评估行业调研职业规划风险管理个人陈述示例 后记 每日一句正能量 胖了就减&#xff0c;没钱就赚&#xff0c;不会就学&#xff0c;不…

rtk技术的使用, test ok

1. 什么是gnss 2 rtk定位

记录使用 Vue3 过程中的一些技术点

1、自定义组件&#xff0c;并使用 v-model 进行数据双向绑定。 简述&#xff1a; 自定义组件使用 v-model 进行传参时&#xff0c;遵循 Vue 3 的 v-model 机制。在 Vue 3 中&#xff0c;v-model 默认使用了 modelValue 作为 prop 名称&#xff0c;以及 update:modelValue 作为…

Linux-笔记 应用编程函数总结

之前一直没做总结&#xff0c;这里总结一下。 一、文件I/O open #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> int open(const char *pathname, int flags); 例子&#xff1a; int fd; fd open("./test_kondon", O_WRONLY …

10.2.k8s的附加组件-Metrics-server组件与hpa资源pod水平伸缩

目录 一、概述 二、安装部署Metrics-Server组件 1.下载Metrics-Server资源清单 2.编辑Metrics-Server的资源清单 3.验证Metrics-Server是否成功安装 4.使用top命令测试是否管用 三、hpa资源实现pod水平伸缩&#xff08;自动扩缩容&#xff09; 1.编写deploy资源清单 2.…

java实现List对象转geojson文本返回前端

1.业务需求 查询带有经纬度数据的list列表&#xff0c;将其转为geojson格式给前端。 2.GeoJson格式说明 GeoJSON是一种对各种地理数据结构进行编码的格式&#xff0c;基于Javascript对象表示法(JavaScript Object Notation, 简称JSON)的地理空间信息数据交换格式。GeoJSON对…

每日练习之深度优先搜索——最大的湖

最大的湖 题目描述 运行代码 #include<iostream> using namespace std; bool mp[102][102]; int sum,num; int N,M,K; int dfs(int x,int y ) {if( mp[x][y] ){mp[x][y]0;sum;dfs(x1,y);dfs(x-1,y);dfs(x,y1);dfs(x,y-1);}return 0; } int main() {cin>>N>>…

ubuntu 源码安装 cloudcompare

1.系统环境&#xff1a; ubuntu18 cmake&#xff1a;3.10.2 官方安装指导&#xff1a;https://github.com/CloudCompare/CloudCompare/blob/master/BUILD.md (注&#xff1a;查看cmake版本&#xff1a; cmake --version) 2.安装依赖 sudo apt-get update sudo apt-get insta…

Android 屏保开关

设置-显示-屏保&#xff0c; 打开关闭 设置代码在 ./packages/apps/Settings/src/com/android/settings/dream/DreamMainSwitchPreferenceController.java &#xff0c; Overridepublic boolean isChecked() {return mBackend.isEnabled();}Overridepublic boolean setChecke…

【云原生】Kubernetes----POD基本管理

目录 引言 一、Pod基础概念 &#xff08;一&#xff09;Pod简介 &#xff08;二&#xff09;Pod的分类 1.自主式Pod 2.控制器管理的Pod &#xff08;三&#xff09;Pod使用方式 1.单容器pod 2.多容器Pod 3. 注意事项 二、Pod容器的分类 &#xff08;一&#xff09;…

FL Studio2025新功能大揭秘,你准备好了吗?

FL Studio&#xff0c;常被音乐制作者亲切地称为“水果”编曲软件&#xff0c;是比利时的Image-Line公司研发的一款完整的软件音乐生产环境或数字音频工作站&#xff08;DAW&#xff09;。自从1997年推出以来&#xff0c;它已经成为全世界众多电子音乐制作者和DJ的首选工具&…

【中霖教育口碑】什么情况下不允许参加注册会计师考试?

对于某些特殊情况&#xff0c;存在明确的禁止性规定&#xff0c;是不能参加注册会计师考试的&#xff0c;中霖为大家分享一下!关于注册会计师全国统一考试的资格条件&#xff0c;需明确以下要点&#xff1a; 1. 针对在前期注册会计师统一考试中因违反规定而受到禁止参加考试的…

抽象工厂模式(AbstractFactoryPattern)

文章目录 1.抽象工厂模式定义2.UML类图3.抽象工厂模式具体实现工厂模式实现单一产品族抽象工厂实现多产品族产品类工厂类使用 4.抽象工厂模式优缺点 1.抽象工厂模式定义 提供一个创建一系列相关或相互依赖对象的接口&#xff0c;而无需指定它们具体的类。 工厂方法模式是单一产…