GDC 笔记

news2024/11/18 5:40:47

1 Title

        Diffusion Improves Graph Learning(Johannes Gasteiger, Stefan Weißenberger, Stephan Günnemann)【NeurIPS 2019】

2 Conclusion

        This study removes the restriction of using only the direct neighbors by introducing a
powerful, yet spatially localized graph convolution: Graph diffusion convolution(GDC). GDC leverages generalized graph diffusion, examples of which are the heat kernel and personalized PageRank. It alleviates the problem of noisy and often arbitrarily defined edges in real graphs.  GDC is also closely related to spectral-based models and thus combines the strengths of both spatial (message passing) and spectral methods. 

3 Good Sentences

        1、Message Passing Neural Networks (MPNNs) are the prevalent approach in this field but they only pass messages between neighboring nodes in each layer. These messages are then aggregated at each node to form the embedding for the next layer. While MPNNs do leverage higher-order neighborhoods in deeper layers, limiting each layer’s messages to one-hop neighbors seems arbitrary.(The shortcomings of previous GNNs method)
        2、To reconcile these two separate approaches and combine their strengths we propose
a novel technique of performing message passing inspired by spectral methods: Graph diffusion
convolution (GDC). Instead of aggregating information only from the first-hop neighbors, GDC
aggregates information from a larger neighborhood. This neighborhood is constructed via a new
graph generated by sparsifying a generalized form of graph diffusion.since GDC generates a new
sparse graph it is not limited to MPNNs and can trivially be combined with any existing graph-based model or algorithm in a plug-and-play manner(The motivation and advantages of GDC)
        3、While there are tight connections between GDC and spectralbased models, GDC is actually spatial-based and therefore does not share their limitations. Similar to polynomial filters, GDC does not compute an expensive eigenvalue decomposition, preserves locality on the graph and is not limited to a single graph after training(The improvement of GDC when compared with spatial-based works)


GDC说白了就是个预处理步骤,通过扩散步骤,把原图生成出一个稠密图,然后用PPR或者热核等方法中的某一个把图在稀疏化,最后把稀疏图投入一种图算法。但是GDC利用了图的节点同质性,所以适用度有限。

通过引入一个强大的、空间局部化的图形卷积:图形扩散卷积(GDC ),消除了只使用直接邻居的限制。用图扩散卷积代替消息传递,在监督和非监督任务以及各种数据集上,在广泛的模型中有显著的性能改进。此外,GDC不限于GNNs,而是可以与任何基于图的模型或算法(例如谱聚类)相结合,而不需要对后者进行任何改变或也不影响其计算复杂度。

GDC利用了广义图扩散。

广义图扩散:

        假设有无向图G =(V,E),其节点集为V,边集为E .用 N = |V|表示节点数,A∈R^{N \times N}表示邻接矩阵,那么这个图的图扩散就定义为:,其中\theta _k是加权系数,T是广义转移矩阵,T^k\theta ^k的选择必须保证上面的公式收敛,在本文中,其限制为:,T的特征值\lambda _i被限制在区间 [0, 1],这样就能保证矩阵收敛,常规图扩散通常要求T是列随机或行随机的。

转移矩阵(Transition matrix)

转移矩阵包括随机行走转移矩阵和对称转移矩阵,其中度矩阵D是节点度的对角矩阵,在本文的定义中,T_{rw}是列随机的,并且还通过向原始邻接矩阵添加(加权)自循环来调整随机游走,在这个公式中,w_{loop}是用来调整的自循环参数。这相当于以概率P执行一种称为“懒惰随机游走”的操作,其中P是指在节点i处保持不动的概率。

图扩散的两个流行的例子是个性化页面排名(PPR)和热度核,

PPR对应于,传送概率为\alpha \in(0,1)

热度核对应于,t为扩散diffusion time

Graph diffusion convolution:

        GDC的图示。通过图扩散和稀疏化将图A转换成新的图S,并在该图上运行给定的模型。本质上,图扩散卷积(GDC)就是用广义图扩散矩阵S的稀疏版本\tilde{S}替换了正常的邻接矩阵A。该矩阵定义了一个加权有向图,本文旨在增强模型应用于该图,加权边有助于GDC的应用,但GDC也可以用于仅支持未加权边的模型,如度校正随机块模型(DCSBM),也可以通过把图变成无向图(当想用谱聚类的时候),这样GDC基本可以适用于任何基于图的模型或算法

Intuition:

GDC背后的一般直觉是,图形扩散平滑了图形上的邻域,充当了一种类似于图像上的高斯滤波器的去噪滤波器。真实图像的特征和边往往都带有噪声,基于图扩散的平滑确实从噪声图中恢复了有意义的领域。

稀疏化(Sparsification):

        大多数图形扩散会产生一个密集矩阵S,即使在这个公式,不把k相加,也会发生这种情况,这是因为现实生活中的“four/six degrees of separation”,即大部分节点之间存在着较短的路径,这通常导致S中的值的影响高度局部化。

而空间局部性允许我们截断S中的小值,从而恢复稀疏性,最终得到一个稀疏矩阵\tilde{S}

        本文考虑两种稀疏化方案:1、top-k:使用每列质量最大的k个元素    2、阈值\epsilon:设T^k置低于\epsilon的项为零。

        虽然稀疏化需要计算密集矩阵S,但许多图扩散方法都有高效准确的近似算法,使得整个处理过程具有较低的时间和空间复杂度(通常是O(N))。此外,稀疏化还可以通过生成正则图来适用于批处理方法(甚至有助于提高预测准确度)

限制:GDC基于同质性假设,节点之间的扩散过程更多地考虑了节点之间的相似性,从而更准确地捕捉了网络中的局部结构和特征。如果想扩展到异质性,可以考虑给边负权重

GDC:

        GDC总共包括四个步骤:1、计算转移矩阵T ;2、通过这个公式得到S;3、通过截断S的小值来稀疏化矩阵;4、最终得到计算转移矩阵T_{\tilde{S}}。 

第一步:过渡矩阵 T 的计算影响了使用哪种拉普拉斯矩阵来分析图的谱结构。具体来说,可以使用对称归一化拉普拉斯矩阵 L_{sym}​ 或随机游走归一化拉普拉斯矩阵 L_{rw}​,而不是未归一化的拉普拉斯矩阵L_{un}。(添加自循环会缩小图的特征值)

第二步:对T^k求和,求和不影响原始矩阵的特征向量

对于特征向量v_i以及对应的特征值\lambda _i,特征值被公式改变。
对于PPR,
对于热核,

PPR和热核都作为低通滤波器,低特征值会被放大,更好地突出和捕捉图中的大规模结构,高特征值会被抑制,从而减少对图中细节或噪声的影响。

第三步:稀疏化改变了特征值和特征向量,这意味着S\tilde{S}的特征值之间没有直接对应关系,但是可以使用特征值扰动理论(eigenvalue perturbation theory)来得到一个上界。

,其中E=\tilde{S}-S是扰动矩阵,\epsilon是阈值。使用扰动矩阵E和阈值ϵ推导出的上界明显高估了扰动的大小。这是因为在实际情况中,基于PPR和热核的方法在真实世界的图上都表现出很强的局部化特性,因此特征值的变化经验上不会随着节点数N而扩大。典型的稀疏化阈值几乎不会对特征值产生影响。

如图所示,基本没有影响,引起的微小变化也主要影响最高和最低的特征值。最高的特征值对应于非常大的集群和长距离的相互作用,这些对于局部图平滑来说不理想。最低的特征值则对应于虚假的振荡,这些对于图学习也没有帮助,可能是由于在阈值ϵ 处的突然截断而受到影响。

第四步\tilde{S}的转移矩阵:最后计算结果图\tilde{S}上的转移矩阵。此步骤不仅仅改变我们考虑的拉普拉斯算子,因为我们已经在步骤 1 中切换到使用转移矩阵。此外,它不保留特征向量,因此最好通过对特征值进行排序来进行实证研究

使用转移矩阵的主要目的是确保稀疏化不会因丢失不同数量的相邻边而导致节点被区别对待。滤波只是side-effect

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1614892.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【软件测试】Selenium实战技巧-多页面和Windows控件处理

01 多页面处理 做UI自动化的时候常常会遇到浏览器弹出新的Tab页,或者需要在多个网页服务之间来回取数据的情况。 比如在首页点击文章“Jmeter使用?”的链接,浏览器会弹出一个新的页面显示“Jmeter使用?”这篇文章的详情。此时如…

PySide6应用实践 | 在PyCharm配置和使用PySide6 QtDesinger

PySide6应用实践 | 在PyCharm配置和使用PySide6 QtDesinger 一、前言二、在PyCharm External Tools中配置PySide61.PyCharm External Tools的用途2.在Pycharm External Tools中配置PySide6 QtDesinger3.在Pycharm中使用PySide6 QtDesinger 一、前言 程序员缓解工作压力的小窍门…

JS -关于对象相关介绍

在JS中,除去基本的数据类型,还有包含对象这种复合数据类型,他可以储存多个键值对,并且每个键都是唯一的,并且在对象中可以包含各种数据类型的值,包括其他对象,数组,函数等。对象是Ja…

Android studio添加aidl文件时,添加按钮为黑色不可点击添加解决办法

在android studio添加aidl文件时出现下面这个情况只需要在模块的build.gradle.kts文件中的android中添加以下代码即可添加aidl android {// 设置 AIDL 支持buildFeatures {aidl true} }

pyenv-win管理windows上多个版本python

pyenv是一款管理多个python版本的工具,可以便捷的切换使用的python版本,但是不支持windows环境,在windows环境需要使用pyenv-win pyenv-win安装 官方介绍的安装方式比较多,在此主要记录一下我习惯的安装方式 下载pyenv-win,可以…

虚良SEO怎么有效的对百度蜘蛛权重优化?

人们交换链接通常首先要问的是你BR值是多少?国内搜索引擎来说以百度马首是瞻,无论seo还是竞价都看重的是百度,那么针对百度权重的优化就特别重要了。其实,百度权重是民间的一种说法,百度官方并没有认同这个数值&#x…

DenseDiffusion:Dense Text-to-Image Generation with Attention Modulation

1 研究目的 该文献的研究目的主要是: 探讨一种更为广泛的调制方法,通过设计多个正则化项来优化图像合成过程中的空间控制。论文的大致思想是,在现有的基于数据驱动的图像合成系统基础上,通过引入更复杂的调制策略,实现…

操作系统——进程

进程定义 是计算机中已经运行的程序是系统进行资源分配和调度的一个独立单位。 进程的特性 独立性:进程在内存中可以独立寻址,每个进程都有一个独立的堆栈空间。动态性:进程在执行过程中可以申请资源、使用资源、释放资源。并发性&#xf…

埃夫特机器人更换编码器电池

一、编码器电池位置 埃夫特机器人编码器电池位置,在机器人基座底部位置,将编码器电池包拆卸下来,并按线标将新的编码器电池连接上去。 二、消除各轴编码器报警 点开监控选项中的驱动器页面,输入密码1975,开打权限管理…

将CSV转换为LDIF以便导入到ldap中?

将CSV转换为LDIF以便导入到ldap中? 目标格式: dn: uidzhangsan,ouusers,dcbaimeidashu,dccom objectClass: posixAccount objectClass: top objectClass: inetOrgPerson gidNumber: 0 givenName: zhangsan sn: 1 displayName:张三 uid: zhangsan homeDi…

node.js-包

包的概念 包:将模块,代码,其他资料聚合成的一个文件夹 包分类: 1.项目包:主要用于编写项目和业务逻辑的文件夹 2.软件包:封装工具和方法供开发者使用(一般使用npm管理) 1&#…

迅雷下载不了的资源怎么下载?

我想下载Boost库,但是下载不下来 用迅雷下载是一直卡在0k 后来尝试在centos上用wget进行下载,竟然可以 wget https://boostorg.jfrog.io/artifactory/main/release/1.85.0/source/boost_1_85_0.tar.gz

HCIP(路由过滤)--7

实验要求: 实现过程: (一)配置IP地址与环回地址: AR1: [AR1]int g0/0/0 [AR1-GigabitEthernet0/0/0]ip add 100.1.1.1 24 Apr 22 2024 19:24:50-08:00 AR1 %%01IFNET/4/LINK_STATE(l)[0]:The line protocol IP on …

C++核心编程——4.3 C++对象模型和this指针

4.3.1 成员变量和成员函数分开存储 在C中,类内的成员变量和成员函数分开存储(虽然封装在一起,但是分开存储) 只有非静态成员变量才属于类的对象上,静态成员(包括静态成员变量和静态成员函数)和非…

绿联 安装qbittorrent及一些常见错误的解决办法

绿联 安装qbittorrent及一些常见错误的解决办法 1、镜像 linuxserver/qbittorrent:latest 2、安装 2.1、创建容器 按需决定是否进行资源限制。 2.2、基础设置 2.3、网络 桥接即可。 注:如果使用IPV6,请选择"host"模式。 注:如…

C# 使用 ThoughtWorks.QRCode 生成二维码

目录 关于 ThoughtWorks.QRCode 开发运行环境 方法设计 代码实现 调用示例 Logo图标透明化 小结 关于 ThoughtWorks.QRCode 二维码是用某种特定的几何图形按一定规律在平面分布的、黑白相间的、记录数据符号信息的图形,在应用程序开发中也被广泛使用&#x…

虚拟局域网PPTP配置与验证

虚拟局域网PPTP配置与验证 前言PPTP服务侧安装配置REF 前言 虚拟专用网(Virtual Private Network,VPN)是一种通过公共网络建立安全的连接的技术。它能够在不同的地理位置之间建立私密的通信通道,实现远程访问网络资源的安全性和隐…

c语言不难说C语言难的,已经说明你根本不适合计算机编程工作

对普通人来说C语言是学习编程的最佳入门语言,有效培养你的编程思维,你有了这个基础后去学其它语言,你会惊讶地发现原来其它语言原来这么好学,现在出现一个Python说小白最适合,在开始前我有一些资料,是我根据…

真实世界的密码学(一)

原文:annas-archive.org/md5/655c944001312f47533514408a1a919a 译者:飞龙 协议:CC BY-NC-SA 4.0 前言 序言 当你拿起这本书时,你可能会想,为什么又一本关于密码学的书?甚至,为什么我要读这本…

STM32G030F6P6TR ST意法

STM32G030F6P6TR是ST(意法半导体)一款基于高性能ArmCortex-M032位RISC内核,工作频率高达64MHz的32位MCU微控制器。代理销售ST(意法半导体)全系列IC电子元器件-中芯巨能为您提供STM32G030F6P6TR(ST 32位MCU)引脚图及中文参数介绍等内容。 STM32G030F6P6TR的中文参数 …