初探图神经网络——GNN

news2024/11/18 15:48:22

title: 图神经网络(GNN)
date:
tags:

  • 随笔
  • 知识点
    categories:
  • [学习笔记]

初探图神经网络(GNN)

文章来源:https://distill.pub/2021/gnn-intro/

前言:说一下为什么要写这篇文章,因为自己最近一直听说“图神经网络”,但是一直不了解这是什么,因此这次有机会对图神经网络有一个简单的认识了解好了,开始步入正题。

整片文章并没有对内容进行章节部分的划分,只是从头到尾进行了讲解,因此这里就根据原文的顺序依次做笔记的填写了。

文章首先说了这样的一句话We are starting to see.....。这句话的提出就说明了现在的图神经网络还是正在兴起的阶段,因此还是有一定的发展前景的——既是挑战也是机遇。

作者从以下四个方面来说明和解释什么是图神经网络(也是本文的主要讲述的点):

  1. 什么样子的数据可以表示成为图;
  2. 图跟其他的数据有什么不一样的地方;
  3. 构建一个GNN;
  4. 提供一个GNN playground

什么是图

图表示实体节点之间的关系,如下图所示:

image-20211129201442254

其中U表示的是整张图。

为了进一步说明什么是节点、关系和整张图,我们可以用下面的方式来表示出什么是图(用向量的方式来表示出):

image-20211129201925513

另外,图可以表示为无向图和有向图两种图:

image-20211129202136128

数据表示成图

那么其他的数据是怎么可以表示成图的呢?

Imgae as graphs

我们将图片数据的像素点看成是一个节点,这样的话就可以构造出一个图:

image-20211129202820443

Text as graphs

用图来表示一段文本的话,那就是一个有向图来表示了,那么一段话中,每一个字符、单词、token等都可以作为图的节点:

image-20211129203321360

当然,文章也说明了,目前来说的图片和文本用图的形式来表示的话,并非是两者常用的编码方法,因为用图的形式来表示的话,会产生冗余的表示形式。

其他形式的数据表示

  • 分子图的表示:

    image-20211129204058449

  • 社交网络的表示:

image-20211129204110758

  • 比赛关系的表示(简单说一下这个例子:就是在跆拳道比赛中,每个人与其他人比赛之间的关系——是否进行比赛,可以用图的形式来表示):

image-20211129204826923

解决的问题方向或应用

那么图可以解决什么问题呢,可以从以下三个方面来考虑:

  • 图层面(graph-level)
  • 节点层面(node-level)
  • 边层面(edge-level)

首先是图层面的任务,文章中说到了一个任务就是查看或者说检查一个分子图中是否存在两个环:

image-20211129205703476

这类问题在图像中与分类问题很像,在文本中与情感分析的任务很想。


节点层面的任务,文中所举的例子是跆拳道的比赛问题——假设在比赛过程中指导员Mr. Hi和管理员John H产生了分歧,节点表示参与竞赛的人员,边表示关系,那么任务就是——正确分类参与人员是Mr. Hi一方的人还是John H一方的人:

image-20211129210328340

那么在图像中,就类似是图像的分割任务,每一个节点代表是一个像素;

在文本中,就类似预测句子中的单词的词性——词性标注;


那么边层面上考虑,文中提出了这样一个场景——假设在一场比赛中,人物都用节点来表示,那么边就用来表示节点之间的关系:

image-20211129210829481

也就是说,任务转为预测节点之间的关系,那么就很像是知识图谱中的关系抽取一样的作用:

image-20211129210943171

在机器学习中存在的问题

文章主要是针对在神经网络中存在的问题做了论述,即将神经网络用到图上该怎么表示图。

到目前,我们知道图有四种属性是需要我们来考虑的:

  • 节点;
  • 边;
  • 全图属性信息;
  • 连接性

前三个还可以表示——用向量来表示,最难来表示的就是最后一个——图的连接性,即如何来表示两个节点的连通性呢?

有人说可以用邻接矩阵来实现连通性的存储表示,但是这样会存在一些问题:

  1. 数据量很大的前提下 ,图是存储不了的;

  2. 如果用稀疏矩阵来表示地话,在GPU上计算是不能实现并行计算的(这也是目前来说待解决的问题);

  3. 邻接矩阵还有一个特点就是——一个图的信息可以用不同的邻接矩阵来表示,那么针对不同的数据的输入,神经网络该如何处理呢?也就是如何处理数据来实现无顺序性的表示。

    image-20211129213719468

文中提出了下面这样的表示方法:

image-20211129214841530

  • 对于图中的节点,用一个标量来表示(将图中的节点进行编号),类似One-hot的表示方法;
  • 对于图中的边,也用一个标量来表示,同样地还是用类似One-hot的方法来表示;
  • 这里的连接性用邻接列表来表示,列表的长度代表来边的个数,列表中的元素是一个二元组,分别表示的是边的两边联通的是哪两个节点;

图神经网络是什么?

文中先是给出了一个GNN的概念:

A GNN is an optimizable transformation on all attributes of the graph (nodes, edges, global-context) that preserves graph symmetries (permutation invariances).

翻译过来就是,图神经网络是一个能够在图的属性上进行转换,且能够保持图上的对称信息的。

对称信息的意思就是,将节点的位置进行重新打乱排序之后,图的结构还是不变的。

文中说使用了message passing neural network框架来进行构建GNN,当然还有其他的网络来进行表示。在该网络中,输入的是一个图网络,输出的还是一个图网络。

The simplest GNN

我们来构造一个最简单的GNN的例子,如下图所示,对于顶点向量(也就是我们前面提到的节点向量),边向量和全局向量,我们分别构造一个多层感知机。

image-20211130161320595

这样三个MLP就构成了一个GNN的层。

这个层的作用就是根据输入的顶点向量、边向量和全局向量,对应地输入到MLP中,然后输入对应的图,其中只是图的属性做出了改变,但是联通性或者说结构没有发生改变。

如何预测

那么接下来就考虑,如何去预测了?

  • 简单情况

先考虑最简单的二分类问题,对于顶点我们已经有了全部的顶点向量信息,通过这些顶点向量信息我们可以在其后面追加一个输出大小为2的全连接层,最后再用一个softmax做一个分类即可;

同样地,对于一个多分类问题,也是只需要在输出后面添加一个输出大小为n的全连接层,最后添加一个softmax作为预测即可。

对于线性回归问题,只需要一个输出大小为1的连接层即可。

下图的意思就是,给定最后一层的输出(是一个图),然后将顶点输入到全连接层中,最后得到预测的输出。

需要注意的是,所有的节点都共享同一个全连接层的参数;同理,所有的边也是共享同一个全连接层的参数。

image-20211130163028677

  • 复杂情况

如果没有顶点信息,但是仍然需要做顶点的情况预测,那么该怎么处理呢?

文中提到了一种方法就是——Pooling,该方法分两步:

  1. 对于需要被pool的元素(这里的元素是指与没有顶点信息相邻的边),收集它们向量表示;
  2. 对于收集到的全部向量做加法求和,得到一个新的向量,此时这个向量就是我们要求得的顶点向量;
  3. (其中还需要添加一个全局向量,但是文中并未提及,但是会在全局信息的共享中说明这个东西是什么)
image-20211130165121454

用公式的方法来表示的话,就是用下图来表示:

image-20211130170143142

上图中是说没有点,只有边的情况,那么对于只有点信息没有边的情况,那么可以用下面的方法来表示:

image-20211130170350855

因此,针对于上述的方法,我们可以看出,不管缺少哪种数据,我们都可以根据pool的方法来获得缺少的数据。

那么总结一个简单的GNN,就用下图来表示,先是输入一个图,然后通过MLP,得到最后的输出,如果缺少了数据,可以用pooling层来处理,然后再经过分类层得到最后的预测结果。

image-20211130171021377

信息传递

上述的方法有一个很大的局限性就是不能够利用图的结构信息来预测,可以看出上述的方法只是分别独立地对于点,边,全局信息作属性的修改,没有利用连接关系,那信息传递就可以很好地来解决这个问题。

其实消息传递的过程跟pooling的过程很是相似,过程可以用下图来表示(用相邻的节点信息来加和):

image-20211130172512604

用公式化的形式表示如下:

image-20211130173447125

前面讲到的pooling都是在最后的输出层之后做的,那么是否可以根据这个方法来提前对属性进行补全呢?

答案是可以的。

下面是根据这个方法,可以将图中的信息进行共享分布,本质上还是向量的相加(都是相邻的才能相加,换句话说就是只有是相邻与点V相连的边才能加到把点V的向量加到边上,同理边加到点上的道理也一样。)

image-20211130174210484

但是呢,究竟是先从点集加到边集好,还是先从边集加到点集好(两种方法会产生不一样的结果),尚未有定论。另外文中还给出了其他的方法,比如交替汇聚pool,这里就不做论述了。

全局信息的共享

到目前为止,我们所讨论的情况是存在这样的一个问题:无法共享不直接相邻点或边的信息。

这就是我们为什么要引入全局变量这个信息或概念的原因。

文中提出的说到方法就是引入一个图U——被称作master nodecontext vector.这个U,连接了图中所有的边和点,因此可以作为信息传递的桥梁,具体来说可以用下图来表示:

image-20211130214542140

搭建一个GNN

这一部分就是在文中有一个交互图了,体现了GNN对超参数的调整是很敏感的,虽然也不清楚图表示的是什么意思,在这里就不做阐述了。

文章后面还做了大量的讨论,有时间再补上吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/633948.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【LeetCode】24.两两交换链表中的节点

24.两两交换链表中的节点(中等) 方法一:递归 思路 代码 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x), n…

聊一聊mysql的MVC

技术主题 在mysql世纪使用中,经常涉及到MVCC的概念(Multi-Vsersion Concurrency Control),即多版本并发控制,一种并发控制方法,根本目的是主为了提升数据库的并发性能。 mvcc为什么产生 数据库最原生的锁…

解开索引迷局:聚簇索引与非聚簇索引的差异大揭秘!

大家好,我是小米!今天我们来聊一聊数据库中的索引,具体地说就是聚簇索引和非聚簇索引。这两者在数据库中扮演着重要的角色,对于我们理解数据库的存储和查询机制非常有帮助。下面就让我来给大家详细解释一下它们的区别吧&#xff0…

为不同的调制方案设计一个单载波系统(映射器-信道-去映射器)(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

RPC介绍

RPC介绍 1 介绍1.1 概述1.2 RPC的分裂发展 2 历史发展1969年11月,ARPAnet 开始建立。1974年:Jon Postel 和 Jim White发表了RFC6741975年:RFC684 作为RFC 674 的注释发表,对RFC 674 的争议进行回复。1976年:RFC 707 发…

C++学习之旅 -类和对象(重点)

文章目录 封装封装的意义案例1案例2 访问权限C中class和struct的区别成员属性私有化构造函数和析构函数构造函数析构函数构造函数的分类以及调用构造&调用 拷贝构造函数调用时机深拷贝&浅拷贝初始化列表类对象作为类成员静态成员C对象模型&this指针成员变量和成员函…

Mybatis Generator源码修改

文章目录 报java.net.MalformedURLException错误解决问题原因:编译的时候没有把下面的dtd文件打进去解决方法 XML文件判空优化-增加空字符串修改InsertSelectiveElementGenerator修改UpdateByPrimaryKeySelectiveElementGenerator XML文件判空优化-最佳解决方案 报j…

一文详解!接口测试 API 自动化测试框架

目录 前言 框架定位 框架架构图 框架介绍 技术栈 Case 展示 执行展示 框架优势: 前言 接口测试 API 自动化测试框架可以提高测试效率和自动化程度,通常包括 HTTP 客户端、测试数据管理、测试报告生成、测试用例管理和调度等功能。下面是一个常用…

【论文】attention is all you need

重点在第三节 attention is all you need摘要1. 绪论2. 背景3. 模型架构3.1 编码器和解码器堆叠 3.2 注意力3.2.1 缩放点积注意力(Scaled Dot-Product Attention)3.2.2 多头注意力机制3.2.3 模型中注意力的应用 3.3 职位感知前馈网络(Positio…

单链表OJ题:LeetCode--142.环形链表Ⅱ(判断第一次入环的节点)

朋友们、伙计们,我们又见面了,本期来给大家解读一下LeetCode中第142道单链表OJ题,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! 数据结构与算法专栏:数据结构与算法 个 人…

【网页设计】第 1 课 - 了解网页设计

欢迎来到博主 Apeiron 的博客,祝您旅程愉快 ! 时止则止,时行则行。动静不失其时,其道光明。 目录 1、缘起 2、了解网页设计 2.1、网页设计 2.2、网站结构 2.3、网站分类 2.4、页面鉴赏 3、总结 1、缘起 前段时间学习完了前…

OpenCV 图像与视频的基础操作

文章目录 引言创建和显示窗口如何通过 OpenCV 加载图片问题加载图片存在的问题如何通过 openCV 保存图片(保存图片)如何通过 OpenCV 保存图片如何利用 OpenCV 从摄像头采集视频(读取视频文件)如何从多媒体文件中读取视频帧&#x…

52、基于51单片机脉搏心率报警LCD 1602显示系统设计(程序+原理图+PCB图+Proteus仿真+参考论文+开题报告+任务书+外文文献+元器件清单等)

摘 要 脉搏心率测量仪在我们的日常生活中已经得到了非常广泛的应用,通过观测脉搏信号,可以对人体的健康进行检查,通常被用于保健中心和医院。为了提高脉搏测量仪的简便性和精确度,本课题设计了一种基于51单片机的脉搏测量仪。系统以51单片机…

C++设计模式 - 创建型模式之工厂模式

文章目录 C设计模式 - 创建型模式之工厂模式接口和针对接口编程 1. 简单工厂模式适用场合UML代码示例 2. 工厂方法模式适用场合UML代码示例 3. 抽象工厂模式适用场合UML代码示例 总结 C设计模式 - 创建型模式之工厂模式 工厂模式属于创建型模式,大致可以分为三类&a…

【Linux】信号量(基于环形队列的生产消费模型)

文章目录 POSIX信号量一、什么是信号量二、信号量接口1.初始化信号量2.销毁信号量3.申请信号量(等待信号量)4.释放信号量(发布信号量) 基于环形队列的生产消费模型一、结构介绍二、理论讲解三、代码实现 总结 POSIX信号量 POSIX信…

C语言之操作符详解

本章重点 1. 各种操作符的介绍 2. 表达式求值 给大家提到一些操作符,下面我们来给大家详细介绍 首先看算术操作符,其他几个都没什么可讲的我们来重点看一下/(除法) 整数除法(除号的两端都是整数) 浮点…

【漏洞复现】Apache RocketMQ 命令注入漏洞(CVE-2023-33246)

文章目录 前言声明一、漏洞描述二、漏洞危害三、影响版本四、环境搭建五、漏洞复现六、修复建议 前言 RocketMQ 是阿里巴巴在2012年开发的分布式消息中间件,专为万亿级超大规模的消息处理而设计,具有高吞吐量、低延迟、海量堆积、顺序收发等特点。同时它…

Shell脚本查询进程并kill进程(集群版)

记录:454 场景:使用Shell脚本查询进程并kill进程。使用Shell脚本远程执行脚本查询进程并kill进程。 版本:CentOS Linux release 7.9.2009。 1.使用Shell脚本查询进程并kill进程 1.1脚本 脚本名称:zk-kill_pid.sh 脚本内容&a…

从ROS1到ROS2无人机编程实战指南

亲爱的读者们,我今天非常荣幸地向大家推荐一本本人的全新力作——《从ROS1到ROS2无人机编程实战指南》。这本书站在初学者的角度,从入门到进阶,再到实战,循序渐进,是学习ROS1和ROS2的最佳选择。如今已在全国范围内上市…

Java spring boot 全解Camunda 7,从 0 到 1 构建工作流平台——第一节:各个开源框架对比

目录 1. Camunda 介绍2. Camunda 选型说明2.1 osworkflow2.2 jbpm2.3 ActivitiActiviti介绍各个版本的优缺点 2.4 flowable2.5 camundacamunda介绍主流版本介绍 2.6 n8n.io2.7 为什么选 camunda ? camunda7.x 还是 camunda 8.x ?为什么选 camunda?camun…