【图卷积神经网络】02-谱域图卷积介绍

news2025/1/13 5:55:49

注:本文为第2章谱域图卷积介绍视频笔记,仅供个人学习使用


目录

  • 1、图卷积简介
    • 1.1 图卷积网络的迅猛发展
    • 1.2 回顾,经典卷积神经网络已在多个领域取得成功
    • 1.3 两大类数据
    • 1.4 经典卷积神经网络的局限:无法处理图数据结构
    • 1.5 将卷积扩展到图结构数据中
  • 2、图谱卷积背景知识
    • 2.1 谱域图卷积实现思路
    • 2.2 拉普拉斯矩阵
      • 2.2.1 拉普拉斯算子
      • 2.2.2 拉普拉斯矩阵
    • 2.3 图傅里叶变换
    • 2.4 图卷积定理
  • 3、三个经典图谱卷积模型
    • 3.1 SCNN
    • 3.2 ChebNet
    • 3.3 GCN


1、图卷积简介

1.1 图卷积网络的迅猛发展

  • 16年以前,每年只有1-2篇相关文献

  • 18年,有些会议上大概有了7-8篇

  • 19年,文章数量爆炸性增长,仅仅NIPS一个会议就有49篇文章

1.2 回顾,经典卷积神经网络已在多个领域取得成功

请添加图片描述

1.3 两大类数据

规则数据(欧氏空间)不规则数据(非欧氏空间)
语音:一维向量;图像:二维矩阵;视频:三维矩阵社交数据 、分子结构 、人体骨架

1.4 经典卷积神经网络的局限:无法处理图数据结构

经典卷积处理图结构数据的局限:

  • 只能处理固定输入维度的数据
  • 局部输入必须有序

1.5 将卷积扩展到图结构数据中

  1. 频域:指将信号转换为频率的域,通过对频率的分析来研究信号的频率特性。常用的转换方法是使用傅里叶变换。在频域中,信号可以表示为各个频率分量的相对强度。
  2. 谱域:指将信号转换为能量或功率的域,通过对能量或功率的分析来研究信号的能量或功率分布。常用的转换方法是使用功率谱密度函数。在谱域中,信号可以表示为各个频率分量的能量或功率。
  3. 空域:指将信号转换为空间坐标的域,通过对空间坐标的分析来研究信号的空间特性。在空域中,信号可以表示为在不同空间位置上的强度。
  4. 时域:指将信号转换为时间坐标的域,通过对时间坐标的分析来研究信号的时间特性。在时域中,信号可以表示为在不同时间上的变化。

在这里插入图片描述


谱域图卷积

  • 根据图谱理论和卷积定理,将数据由空域转到谱域做处理

  • 有较为坚实的理论基础

空域图卷积

  • 不依靠图谱卷积理论,直接在空间上定义卷积操作
  • 定义直观,灵活性强

部分经典模型

在这里插入图片描述

2、图谱卷积背景知识

2.1 谱域图卷积实现思路

根据卷积定理,两信号在空域(或时域)卷积的傅里叶变换等于这俩个信号在频域中的傅里叶变换的乘积:


也可以通过反变换的形式来表达:

请添加图片描述
f1(t) 定义为空域输入信号,f2(t)定义为空域卷积核,卷积操作即为:先将空域上的信号f1(t)转换到频域信号F1(w),f2(t)转换到频域F2(w),然后将频域信号相乘,再将相乘后的结果通过傅里叶反变换转回空域,这个就是谱域图卷积的实现思路(将空域转换到频域上处理,处理完再返回)。

经典的卷积操作具有序列有序性和维数不变性的限制,使得经典卷积难以处理图数据,对于一个3x3的卷积核,它的形状是固定的,它的感受野的中心节点必须要有固定的邻域大小才能使用卷积核,但是图上的节点的领域节点是不确定的,此外图上节点的领域节点也是没有顺序的,这就不能直接在空域使用经典的卷积。但是当把数据从空域转换到频域,在频域处理数据时,只需要将每个频域的分量放大或者缩小就可以了,不需要考虑信号在空域上存在的问题,这个就是谱域图卷积的核心。

经典傅里叶变换:
在这里插入图片描述
基于图谱理论,可以使用图傅里叶变换。

在这里插入图片描述

2.2 拉普拉斯矩阵

2.2.1 拉普拉斯算子

拉普拉斯算子 的定义为梯度gradient的散度divergence▽·。即Δf=▽·(▽f) = div(grad(f))

对于n维欧式空间,可普遍认为拉普拉斯算子是一个二阶微分算子,即在各个维度求二阶导数后求和。

请添加图片描述

在3维欧氏空间,对于一个三元函数f(x,y,z),可以得到

离散情况下欧氏空间的拉普拉斯算子 ,对于两个变量的函数f(x,y)

在这里插入图片描述

那么两个变量的离散拉普拉斯算子可以写成:

在这里插入图片描述

二维的拉普拉斯算子可以理解为中心节点与周围节点的差值,然后求和。如下图,对于某个中心像素(红色)的算子为周围四个像素之和减去4倍的自己。
在这里插入图片描述

类似,在图上的拉普拉斯算子定义:
在这里插入图片描述
其中,f = (f1, f2, ···, fn),代表n个结点上每个结点的信号。

当有权重时:

在这里插入图片描述

可以理解为中心节点依次减去周围节点,乘以权重后,然后求和。

在这里插入图片描述
对于n个节点有:

在这里插入图片描述

2.2.2 拉普拉斯矩阵

拉普拉斯矩阵是图上的一种拉普拉斯算子。

D为度矩阵,它对角线上的值是从 i 节点出发的所有边的权重之和(nxn的方阵,是对角矩阵)。

拉普拉斯矩阵(L)是度矩阵(D)减去邻接矩阵(W),即L = D - W。

在这里插入图片描述

  • 性质:拉普拉斯矩阵是对称半正定矩阵,因此该矩阵的特征值一定非负,一定有n个线性无关的特征向量,它们是n维空间中的一组标准正交基,组成正交矩阵。

特征分解(Eigen decomposition),又称谱分解(Spectral decomposition),是将矩阵分解为由其特征值和特征向量表示的矩阵之积的方法。

Alt

L是拉普拉斯矩阵,U是拉普拉斯矩阵特征向量组成的矩阵,λ是特征向量,组成对角阵∧。

拉普拉斯矩阵有n个线性无关的特征向量,可以组成n维线性空间中的一组基。

在这里插入图片描述

又因为对称矩阵的不同特征值对应的特征向量相互正交,这些正交的特征向量构成的矩阵为正交矩阵。所以拉普拉斯矩阵的n个特征向量是n维空间中的一组标准正交基。

​

2.3 图傅里叶变换

图上信号的定义:一般表达为一个向量。假设有n个节点,将图上的信号记为:在这里插入图片描述
每一个节点上有一个信号值,节点i上的值为x(i) = xi

下图中蓝色线段代表信号的大小,类似于图像上灰度图像像素,像素越高,画的这个线段越长。
在这里插入图片描述
经典傅里叶变换如下

  • 傅里叶正变换F:求线性组合的系数。具体做法是由原函数和基函数的共轭的内积求得。
  • 傅里叶反变换f:一个信号由不同频率的基函数信号叠加而成,即把任意一个函数表示成了若干个正交基函数的线性组合。

在这里插入图片描述
左边为连续空间中的傅里叶变换,右边为离散傅里叶变换。

傅里叶变换的本质是内积,三角函数是完备的正交函数集,不同频率的三角函数的之间的内积为0,只有频率相等的三角函数做内积时,才不为0。
在这里插入图片描述
参考自 一文道破傅里叶变换的本质,优缺点一目了然

经典傅里叶变换:一个信号由不同频率的基函数信号叠加而成。左图中红色信号是原信号,蓝色信号是不同频率上的基函数信号(余弦或者正弦函数)。则红色原信号可以由不同频率的基函数线性组合而成,右图蓝色的高度表示基前面的系数,也就是所谓的傅里叶系数,也就是原函数在这个基上的坐标分量。

在这里插入图片描述
相位在图中被忽略了,实际上的傅里叶系数包含振幅和相位。
在这里插入图片描述

对应经典傅里叶变换的思想,对于图上信号x的傅里叶变换,希望找到一组正交基,通过这组正交基的线性组合来表达x。而拉普拉斯矩阵的特征向量正好是正交的,可以作为图傅里叶变换的基函数。

在这里插入图片描述
则傅里叶逆变换可以将图上的信号可以表示为:
在这里插入图片描述

小结:依靠图傅里叶变换可以将定义在图上结点上的信号x从空间域与转到谱域。

在这里插入图片描述

经典傅里叶变换图傅里叶变换
在这里插入图片描述在这里插入图片描述
基:在这里插入图片描述基:
在这里插入图片描述
频率:
在这里插入图片描述
频率”:
在这里插入图片描述
分量的振幅(和相位):
在这里插入图片描述
分量的振幅:
在这里插入图片描述

2.4 图卷积定理

图上的卷积定义:先对输入信号 x 和卷积核 g 做傅里叶正变换,然后在谱域上做 harmand 乘积,也就是 F ( x ) ⊙ F ( g ) 。最后通过傅里叶反变换 F-1 将结果返回到空域。

如果用矩阵乘法的形式来表达这个公式,去掉harmand乘积。同时,通常并不关心空间域上的滤波器信号g是什么样子的,只关心其在频域的情况。令
在这里插入图片描述
则公式等价的转换成下式:
在这里插入图片描述
所有的谱图卷积都遵循这些定义,唯一的不同就是 滤波器 filter 的选取

3、三个经典图谱卷积模型

简介

  • 三个图谱卷积模型(SCNN、ChebNet、GCN)均立足于谱图理论且一脉相承。
  • ChebNet可看做SCNN的改进,GCN可看做ChebNet的改进。
  • 三个模型均可认为是下式的一个特例。在这里插入图片描述

在卷积前后:在这里插入图片描述
其中,某一层的特征图可以表示为一个 nxc 的矩阵。n代表图中有n个结点,C是通道个数。图中的信号可以分解为各个结点上的信号。X代表整个图上的信号,是nxc 的矩阵,Xi代表某个结点的信号,是一个 1xc 的向量。

在不同层中,特征图结构是不发生变化的,只有图上的信号会发生变化。


3.1 SCNN

论文:Spectral networks and locally connected networks on graphs

第一代GCN,文中给出了两个模型,分别是基于空间域的和基于谱域的。基于谱域的模型的核心是用对角矩阵来代替谱域的卷积核

核心思想:用可学习的对角矩阵来代替谱域的卷积核,从而实现图卷积操作。即:
在这里插入图片描述

公式定义如下:
在这里插入图片描述

  • 其中, Ck表示第k层的channel(通道)个数, xk,i ∈ Rn表示第k层的第i个channel的 feature map(特征图)
  • Fk,i,j 属于 Rnxn 代表参数化的谱域的卷积核矩阵。 它是一个对角矩阵,包含了n个可学习的参数。h(·) 是激活函数。

SCNN的缺点

  • 计算拉普拉斯矩阵的特征值分解非常耗时。计算复杂度为O(n3) ,n为节点个数。当处理大规模图数据时(比如社交网络数据,通常有上百万个节点)会面临很大的挑战。
  • 模型的参数复杂度较大。计算复杂度为 ,当节点数较多时容易过拟合。
  • 无法保证局部链接,因为将频域转为空域后是全局连接。

3.2 ChebNet

论文:Convolutional neural networks on graphs with fast localized spectral filtering

切比雪夫多项式:
在这里插入图片描述

在矩阵状态下, 切比雪夫多项式可以表示为:

在这里插入图片描述
核心思想:采用切比雪夫多项式近似谱域的filter。

因为切比雪夫多项式在逼近理论中,可以用于多项式插值,也就是说可以利用切比雪夫多项式来逼近函数。

在拟合时,将x的k次方换成了切比雪夫多项式的k阶项,用切比雪夫多项式来进行逼近。如下图:
在这里插入图片描述
为什么要替换?当替换后,SCNN中可以省略对于拉普拉斯矩阵的特征值分解这一最耗时的操作,直接使用拉普拉斯矩阵即可
在这里插入图片描述
ChebNet特点:在这里插入图片描述

  • 卷积核只有K+1个可学习的参数,一般 K远小于n,参数的复杂度被大大降低
  • 采用Chebyshev多项式代替谱域的卷积核后,经过推导,ChebNet不需要对拉普拉斯矩阵做特征分解了。省略了最耗时的步骤。
  • 卷积核具有严格的空间局部性。同时,K就是卷积核的“感受野半径”。即将中心顶点K阶近邻节点作为邻域节点。

3.3 GCN

论文:Semi-supervised classification with graph convolutional networks

GCN可视为对ChebNet的进一步简化:仅考虑1阶切比雪夫多项式,且每个卷积核仅只有一个参数,所以只有两个参数。

在这里插入图片描述
理解:
在这里插入图片描述
进一步简化,使得每个卷积核只有一个可学习的参数。
在这里插入图片描述
因为 在这里插入图片描述有范围[0,2]的特征值,如果在深度神经网络模型中使用该算子,则反复应用该算子会导致数值不稳定(发散)和梯度爆炸/消失,为了解决该问题, 引入了一个 renormalization trick.
在这里插入图片描述
从而得到GCN的最终公式
在这里插入图片描述
GCN的特点:
在这里插入图片描述

  • 在忽略input channel 和 output channel的情况下,卷积核只有1个可学习的参数,极大的减少了参数量。( 按照作者的说法: “We intuitively expect that such a model can alleviate the problem of overfitting on local neighborhood structures for graphs with very wide node degree distributions, such as socialnetworks, citation networks, knowledge graphs and many other real-world graph datasets.”)
  • 虽然卷积核大小减少了(GCN仅仅关注于一阶邻域,类似于3X3的经典卷积),但是作者认为通过多层堆叠GCN,仍然可以起到扩大感受野的作用。
  • 与此同时,这样极端的参数削减也受到一些人的质疑。他们认为每个卷积核如果只设置一个可学习参数,会降低模型的能力。(可以参考博文How powerful are Graph Convolutions? )
    • 如果将传统图像的每一个像素视为graph的一个节点,节点之间为八邻域链接,图像也可以看做一张特殊的图。那么在每个3*3的卷积核里,仅仅存在1个可学习的参数。
    • 从目前应用在image的深度学习经验看来,这样的卷积模型复杂度虽然低,但是模型的能力也遭到了削弱,可能难以处理复杂的任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/179013.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python学习基础之快速入门

目录 首先我们下载最新的python版本:3.0 编写一个hello world 什么是python里面的IPO python运行有几种模式 编写一个温度转换器 在windows上执行python程序 官网:Welcome to Python.org Python 是一门易于学习、功能强大的编程语言。它提供了高效的…

保护视力台灯是白光还是暖光?盘点专业护眼的暖光护眼台灯

保护视力的灯光颜色是最接近太阳光最好,而白光与暖光主要是色温来控制的,低色温(3000K以下),中性色温(4000K左右),高色温(5000K以上),低色温的光源…

在不受支持的 Mac 上安装 macOS Ventura、Monterey、Big Sur (OpenCore Legacy Patcher)

在不受支持的 Mac 上安装 macOS Ventura、Monterey、Big Sur (OpenCore Legacy Patcher) 请访问原文链接:https://sysin.org/blog/install-macos-13-on-unsupported-mac/,查看最新版。原创作品,转载请保留出处。 作者主页:www.s…

RabbitMQ入门与应用

RabbitMQ入门与应用1.初识MQ1.1.同步和异步通讯1.1.1.同步通讯1.1.2.异步通讯1.2.技术对比:2.快速入门2.1.安装RabbitMQ2.2.RabbitMQ消息模型2.3.导入Demo工程2.4.入门案例2.4.1.publisher实现2.4.2.consumer实现2.5.总结3.SpringAMQP3.1.Basic Queue 简单队列模型3…

python机器学习数据建模与分析——pandas中常用函数总结

本文主要对数据建模与分析中常使用到的pandas内置函数进行总结分析,以此来熟悉数据建模与分析的流程。 文章目录一、Pandas数据结构1.1 数据结构—Series1.1.1 Series的创建方式1.1.2 使用索引和获取数据1.2 数据结构—DataFrame1.2.1 DataFrame的创建方式1.2.2 使用…

变速积分PID算法及仿真

在普通的PID 控制算法中,由于积分系数k是常数,所以在整个控制过程中,积分增量不变。而系统对积分项的要求是,系统偏差大时积分作用应减弱甚至全无,而在偏差小时则应加强。积分系数取大了会产生超调,甚至积分…

强化学习笔记:基于价值的学习之价值迭代(python实现)

目录 1. 前言 2. 数学原理 3. 实现 3.1 Planner类 3.2 ValueIterationPlanner类 4. 运行结果及分析 1. 前言 在强化学习中,根据是否依赖于(环境的)模型,可以分为有模型(model-based)…

通信原理简明教程 | 模拟调制传输

文章目录1 模拟幅度调制1.1 模拟幅度调制的基本原理1.2 DSB-SC调制和AM调制1.3 SSB调制和VSB调制2 模拟角度调制2.1 角度调制的基本概念2.2 窄带调频和宽带调频2.3 调频信号的产生方法3 模拟调制系统的解调3.1 相干解调3.2 非相干解调4 模拟调制系统的抗噪声性能4.1 抗噪声性能…

Service Mesh

Service Mesh 参考如下文章:可以将此文章看作为下面文章的结合: https://zhuanlan.zhihu.com/p/61901608 https://philcalcado.com/2017/08/03/pattern_service_mesh.html https://zhuanlan.zhihu.com/p/153105848?from_voters_pagetrue 微服务演化进…

浅谈 开源许可证

目录浅谈 开源许可证一、什么是开源许可证1.1 什么是开源1.2 什么是开源许可证Copyleft 许可证(Copyleft 许可证)宽松许可证(permissive 许可证)二、为什么要有开源许可证2.1、No License:没有开源许可证意味着什么2.2…

38.Isaac教程--AprilTags

AprilTags ISAAC教程合集地址文章目录AprilTags源码Isaac Codelet运行示例应用程序在主机系统上运行示例应用程序在 Jetson 上运行应用程序在 Websight 中查看应用程序的输出AprilTags 是一种流行的基准标记形式。 它在机器人技术中有广泛的应用,包括对象跟踪、视觉…

数据挖掘领域十大经典算法

一、什么是数据挖掘?数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、…

蓝桥杯STM32G431RBT6学习——USART

蓝桥杯STM32G431RBT6学习——USART 前言 串口在蓝桥杯近几届中考频也相对较高(十三、十二届均考),因此必然也要学习一下。 作为后来之秀的开源项目DAP Link不仅支持SWD调试下载,同时还支持串口调试功能,国信长天开…

软件课设(Ⅲ)——padavan-ng编译以及内核模块修改

我记得今年的很多笔试面试都遇到了linux相关的操作,答题状况都挺……昂。算是补课吧,正好大四的毕业实习、软3还有研0的项目都需要linux的环境进行推进,记录一下,聊作纪念。 实验要求 编译系统,下载并提交,…

大数据技术之Hadoop(Yarn)

第1章 Yarn资源调度器 我们先来思考下面几个问题: 1)如何管理集群资源? 2)如何给任务合理分配资源? Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平…

图形编辑器:修改图形 x、y、width、height、rotation

大家好,我是前端西瓜哥。图形编辑器的一个需求,就是可以通过属性面板的输入框设置选中元素的属性值。 项目地址,欢迎 star: https://github.com/F-star/suika 线上体验: https://blog.fstars.wang/app/suika/ 最终效果…

Express框架连接MongoDB数据库操作

在上一篇中已经在Node.js中引入使用了mongoose进行MongoDB数据库的基本操作,在本篇当中在Express框架中来连接数据库以及操作数据库; Express 项目环境 这里是通过全局安装Express框架生产的项目环境,也可以通过局部安装的方式,安…

【MySQL】第十一部分 SELECT的执行过程

【MySQL】第十一部分 SELECT的执行过程 文章目录【MySQL】第十一部分 SELECT的执行过程11. SELECT的执行过程11.1 SQL92语法的结构11.2 SQL92语法的结构11.3 语句执行顺序11.4 解释之前遗留问题总结11. SELECT的执行过程 11.1 SQL92语法的结构 SELECT ... FROM TABLE WHERE 多…

STM32G431—ADC+E2PROM读写实验

目录 1.ADC介绍 配置cubemx 代码 2.IIC 通信 原理图 AT24C02 代码 i2C.c 主函数 1.ADC介绍 ADC 有多达 18 个转换通道,其中通道 0~通道 15 是外部通道,使用的 GPIO 引脚如表 所示。 ADC引脚GPIO引脚GPIO配置ADC引脚GPIO引脚GPIO配置IN0PA0模拟输…

Aspose.PDF for .NET提取矢量图像的支持

Aspose.PDF for .NET提取矢量图像的支持 增加了对提取矢量图像的支持。 改进了PDF到Microsoft Excel的转换。 添加了对创建“PrinterMark”批注的支持。 增加了检测PDF文件是否包含矢量图形的功能。 Aspose.PDF for.NET是一个高级PDF处理和解析API,用于在跨平台应用…