注：本文为第2章谱域图卷积介绍视频笔记，仅供个人学习使用

1、图卷积简介
- 1.1 图卷积网络的迅猛发展
- 1.2 回顾，经典卷积神经网络已在多个领域取得成功
- 1.3 两大类数据
- 1.4 经典卷积神经网络的局限：无法处理图数据结构
- 1.5 将卷积扩展到图结构数据中
2、图谱卷积背景知识
- 2.1 谱域图卷积实现思路
- 2.2 拉普拉斯矩阵
- - 2.2.1 拉普拉斯算子
  - 2.2.2 拉普拉斯矩阵
- 2.3 图傅里叶变换
- 2.4 图卷积定理
3、三个经典图谱卷积模型
- 3.1 SCNN
- 3.2 ChebNet
- 3.3 GCN

1、图卷积简介

1.1 图卷积网络的迅猛发展

16年以前，每年只有1-2篇相关文献
18年，有些会议上大概有了7-8篇
19年，文章数量爆炸性增长，仅仅NIPS一个会议就有49篇文章

1.2 回顾，经典卷积神经网络已在多个领域取得成功

请添加图片描述

1.3 两大类数据

规则数据（欧氏空间）	不规则数据（非欧氏空间）

语音：一维向量；图像：二维矩阵；视频：三维矩阵	社交数据、分子结构、人体骨架

1.4 经典卷积神经网络的局限：无法处理图数据结构

经典卷积处理图结构数据的局限：

只能处理固定输入维度的数据
局部输入必须有序

1.5 将卷积扩展到图结构数据中

频域：指将信号转换为频率的域，通过对频率的分析来研究信号的频率特性。常用的转换方法是使用傅里叶变换。在频域中，信号可以表示为各个频率分量的相对强度。
谱域：指将信号转换为能量或功率的域，通过对能量或功率的分析来研究信号的能量或功率分布。常用的转换方法是使用功率谱密度函数。在谱域中，信号可以表示为各个频率分量的能量或功率。
空域：指将信号转换为空间坐标的域，通过对空间坐标的分析来研究信号的空间特性。在空域中，信号可以表示为在不同空间位置上的强度。
时域：指将信号转换为时间坐标的域，通过对时间坐标的分析来研究信号的时间特性。在时域中，信号可以表示为在不同时间上的变化。

在这里插入图片描述

谱域图卷积

根据图谱理论和卷积定理，将数据由空域转到谱域做处理
有较为坚实的理论基础

空域图卷积

不依靠图谱卷积理论，直接在空间上定义卷积操作
定义直观，灵活性强

部分经典模型

在这里插入图片描述

2、图谱卷积背景知识

2.1 谱域图卷积实现思路

根据卷积定理，两信号在空域（或时域）卷积的傅里叶变换等于这俩个信号在频域中的傅里叶变换的乘积：

也可以通过反变换的形式来表达：

请添加图片描述
f1(t) 定义为空域输入信号，f2(t)定义为空域卷积核，卷积操作即为：先将空域上的信号f1(t)转换到频域信号F1(w)，f2(t)转换到频域F2(w)，然后将频域信号相乘，再将相乘后的结果通过傅里叶反变换转回空域，这个就是谱域图卷积的实现思路（将空域转换到频域上处理，处理完再返回)。

经典的卷积操作具有序列有序性和维数不变性的限制，使得经典卷积难以处理图数据，对于一个3x3的卷积核，它的形状是固定的，它的感受野的中心节点必须要有固定的邻域大小才能使用卷积核，但是图上的节点的领域节点是不确定的，此外图上节点的领域节点也是没有顺序的，这就不能直接在空域使用经典的卷积。但是当把数据从空域转换到频域，在频域处理数据时，只需要将每个频域的分量放大或者缩小就可以了，不需要考虑信号在空域上存在的问题，这个就是谱域图卷积的核心。

经典傅里叶变换：
在这里插入图片描述
基于图谱理论，可以使用图傅里叶变换。

在这里插入图片描述

2.2 拉普拉斯矩阵

2.2.1 拉普拉斯算子

拉普拉斯算子△ 的定义为梯度gradient▽的散度divergence▽·。即Δf=▽·(▽f) = div(grad(f))。

对于n维欧式空间，可普遍认为拉普拉斯算子是一个二阶微分算子，即在各个维度求二阶导数后求和。

请添加图片描述

在3维欧氏空间，对于一个三元函数f(x,y,z)，可以得到

离散情况下欧氏空间的拉普拉斯算子，对于两个变量的函数f(x,y)

那么两个变量的离散拉普拉斯算子可以写成：

在这里插入图片描述

二维的拉普拉斯算子可以理解为中心节点与周围节点的差值，然后求和。如下图，对于某个中心像素（红色）的算子为周围四个像素之和减去4倍的自己。
在这里插入图片描述

类似，在图上的拉普拉斯算子定义：
在这里插入图片描述
其中，f = (f1, f2, ···, fn)，代表n个结点上每个结点的信号。

当有权重时：

在这里插入图片描述

可以理解为中心节点依次减去周围节点，乘以权重后，然后求和。

在这里插入图片描述
对于n个节点有：

在这里插入图片描述

2.2.2 拉普拉斯矩阵

拉普拉斯矩阵是图上的一种拉普拉斯算子。

D为度矩阵，它对角线上的值是从 i 节点出发的所有边的权重之和（nxn的方阵，是对角矩阵）。

拉普拉斯矩阵（L）是度矩阵（D）减去邻接矩阵（W），即L = D - W。

在这里插入图片描述

性质：拉普拉斯矩阵是对称半正定矩阵，因此该矩阵的特征值一定非负，一定有n个线性无关的特征向量，它们是n维空间中的一组标准正交基，组成正交矩阵。

特征分解（Eigen decomposition），又称谱分解（Spectral decomposition），是将矩阵分解为由其特征值和特征向量表示的矩阵之积的方法。

Alt

L是拉普拉斯矩阵，U是拉普拉斯矩阵特征向量组成的矩阵，λ是特征向量，组成对角阵∧。

拉普拉斯矩阵有n个线性无关的特征向量，可以组成n维线性空间中的一组基。

在这里插入图片描述

又因为对称矩阵的不同特征值对应的特征向量相互正交，这些正交的特征向量构成的矩阵为正交矩阵。所以拉普拉斯矩阵的n个特征向量是n维空间中的一组标准正交基。

2.3 图傅里叶变换

图上信号的定义：一般表达为一个向量。假设有n个节点，将图上的信号记为：在这里插入图片描述
每一个节点上有一个信号值，节点i上的值为x(i) = xi

下图中蓝色线段代表信号的大小，类似于图像上灰度图像像素，像素越高，画的这个线段越长。
在这里插入图片描述
经典傅里叶变换如下

傅里叶正变换F：求线性组合的系数。具体做法是由原函数和基函数的共轭的内积求得。
傅里叶反变换f：一个信号由不同频率的基函数信号叠加而成，即把任意一个函数表示成了若干个正交基函数的线性组合。

在这里插入图片描述
左边为连续空间中的傅里叶变换，右边为离散傅里叶变换。

傅里叶变换的本质是内积，三角函数是完备的正交函数集，不同频率的三角函数的之间的内积为0，只有频率相等的三角函数做内积时，才不为0。

参考自一文道破傅里叶变换的本质，优缺点一目了然

经典傅里叶变换：一个信号由不同频率的基函数信号叠加而成。左图中红色信号是原信号，蓝色信号是不同频率上的基函数信号（余弦或者正弦函数）。则红色原信号可以由不同频率的基函数线性组合而成，右图蓝色的高度表示基前面的系数，也就是所谓的傅里叶系数，也就是原函数在这个基上的坐标分量。

在这里插入图片描述
相位在图中被忽略了，实际上的傅里叶系数包含振幅和相位。

对应经典傅里叶变换的思想，对于图上信号x的傅里叶变换，希望找到一组正交基，通过这组正交基的线性组合来表达x。而拉普拉斯矩阵的特征向量正好是正交的，可以作为图傅里叶变换的基函数。

在这里插入图片描述
则傅里叶逆变换可以将图上的信号可以表示为：

小结：依靠图傅里叶变换可以将定义在图上结点上的信号x从空间域与转到谱域。

在这里插入图片描述

经典傅里叶变换	图傅里叶变换

基：	基：
频率：	频率”：
分量的振幅(和相位）:	分量的振幅:

2.4 图卷积定理

图上的卷积定义：先对输入信号 x 和卷积核 g 做傅里叶正变换，然后在谱域上做 harmand 乘积，也就是 F ( x ) ⊙ F ( g ) 。最后通过傅里叶反变换 F^-1 将结果返回到空域。

如果用矩阵乘法的形式来表达这个公式，去掉harmand乘积。同时，通常并不关心空间域上的滤波器信号g是什么样子的，只关心其在频域的情况。令
在这里插入图片描述
则公式等价的转换成下式：

所有的谱图卷积都遵循这些定义，唯一的不同就是滤波器 filter 的选取

3、三个经典图谱卷积模型

简介

三个图谱卷积模型（SCNN、ChebNet、GCN）均立足于谱图理论且一脉相承。
ChebNet可看做SCNN的改进，GCN可看做ChebNet的改进。
三个模型均可认为是下式的一个特例。

在卷积前后： 在这里插入图片描述
其中，某一层的特征图可以表示为一个 nxc 的矩阵。n代表图中有n个结点，C是通道个数。图中的信号可以分解为各个结点上的信号。X代表整个图上的信号，是nxc 的矩阵，X_i代表某个结点的信号，是一个 1xc 的向量。

在不同层中，特征图结构是不发生变化的，只有图上的信号会发生变化。

3.1 SCNN

论文：Spectral networks and locally connected networks on graphs

第一代GCN，文中给出了两个模型，分别是基于空间域的和基于谱域的。基于谱域的模型的核心是用对角矩阵来代替谱域的卷积核

核心思想：用可学习的对角矩阵来代替谱域的卷积核，从而实现图卷积操作。即：
在这里插入图片描述

公式定义如下：
在这里插入图片描述

其中， C_k表示第k层的channel（通道）个数， x_k,i ∈ Rⁿ表示第k层的第i个channel的 feature map（特征图）
F_k,i,j 属于 R^nxn 代表参数化的谱域的卷积核矩阵。它是一个对角矩阵，包含了n个可学习的参数。h(·) 是激活函数。

SCNN的缺点

计算拉普拉斯矩阵的特征值分解非常耗时。计算复杂度为O(n³) ，n为节点个数。当处理大规模图数据时（比如社交网络数据，通常有上百万个节点）会面临很大的挑战。
模型的参数复杂度较大。计算复杂度为，当节点数较多时容易过拟合。
无法保证局部链接，因为将频域转为空域后是全局连接。

3.2 ChebNet

论文：Convolutional neural networks on graphs with fast localized spectral filtering

切比雪夫多项式：
在这里插入图片描述

在矩阵状态下，切比雪夫多项式可以表示为：

在这里插入图片描述
核心思想：采用切比雪夫多项式近似谱域的filter。

因为切比雪夫多项式在逼近理论中，可以用于多项式插值，也就是说可以利用切比雪夫多项式来逼近函数。

在拟合时，将x的k次方换成了切比雪夫多项式的k阶项，用切比雪夫多项式来进行逼近。如下图：
在这里插入图片描述
为什么要替换？当替换后，SCNN中可以省略对于拉普拉斯矩阵的特征值分解这一最耗时的操作，直接使用拉普拉斯矩阵即可

ChebNet特点：

卷积核只有K+1个可学习的参数，一般 K远小于n，参数的复杂度被大大降低
采用Chebyshev多项式代替谱域的卷积核后，经过推导，ChebNet不需要对拉普拉斯矩阵做特征分解了。省略了最耗时的步骤。
卷积核具有严格的空间局部性。同时，K就是卷积核的“感受野半径”。即将中心顶点K阶近邻节点作为邻域节点。

3.3 GCN

论文：Semi-supervised classification with graph convolutional networks

GCN可视为对ChebNet的进一步简化：仅考虑1阶切比雪夫多项式，且每个卷积核仅只有一个参数，所以只有两个参数。

在这里插入图片描述
理解：

进一步简化，使得每个卷积核只有一个可学习的参数。

因为有范围[0,2]的特征值，如果在深度神经网络模型中使用该算子，则反复应用该算子会导致数值不稳定（发散）和梯度爆炸/消失，为了解决该问题, 引入了一个 renormalization trick.
在这里插入图片描述
从而得到GCN的最终公式

GCN的特点：

在忽略input channel 和 output channel的情况下，卷积核只有1个可学习的参数，极大的减少了参数量。（按照作者的说法: “We intuitively expect that such a model can alleviate the problem of overfitting on local neighborhood structures for graphs with very wide node degree distributions, such as socialnetworks, citation networks, knowledge graphs and many other real-world graph datasets.”）
虽然卷积核大小减少了（GCN仅仅关注于一阶邻域，类似于3X3的经典卷积），但是作者认为通过多层堆叠GCN，仍然可以起到扩大感受野的作用。
与此同时，这样极端的参数削减也受到一些人的质疑。他们认为每个卷积核如果只设置一个可学习参数，会降低模型的能力。（可以参考博文How powerful are Graph Convolutions? ）
- 如果将传统图像的每一个像素视为graph的一个节点，节点之间为八邻域链接，图像也可以看做一张特殊的图。那么在每个3*3的卷积核里，仅仅存在1个可学习的参数。
- 从目前应用在image的深度学习经验看来，这样的卷积模型复杂度虽然低，但是模型的能力也遭到了削弱，可能难以处理复杂的任务。