图神经网络教程3——循环图神经网络-2

news2024/11/26 2:34:42

目录

计算下游输出

序列图数据的扩展

图长短期记忆网络

循环转换在RGNN应用于图分类时的作用

数据集

算法

结果和讨论

门控循环单元

优缺点


前文索引

本篇是GRNN的第二篇文章,点击此处可到达第一篇文章的位置。

计算下游输出

一旦我们以图中的每个顶点为中心有了有用的嵌入,目标是根据这些值推断出有意义的输出(即执行下游任务)。输出函数𝑔负责获取图G (V, E)的收敛嵌入并创建所述输出。在实践中,输出函数𝑔,很像转换函数𝑓,是由前馈神经网络实现的,尽管以下的方法已经被使用,用于其他返回单个值,包括平均操作、虚拟超级节点和注意力总和。

直观地说,反复计算嵌入并随后计算下游输入的组合过程可以被解释为一个循环神经网络计算块序列(或有限的计算图,如图所示)(在上一篇文章中)。在监督学习的环境中,可以计算出一个损失信号,它量化了预测输出与标注的真值之间的误差。然后,通过沿着“展开”的计算图进行误差反向传播,可以对f和g进行训练。

序列图数据的扩展

到目前为止,在讨论递归时,我们主要提到了将计算技术迭代地应用于图中的邻域,以产生依赖于整个图中传播的信息的嵌入。然而,递归技术也可以指序列数据上的计算过程,例如时间序列数据。在图论中,序列数据是指可以被解释为具有随时间变化的特征的图的实例,包括时空图。例如,图1 (b)说明了图如何表示手部单幅图像中的骨骼结构,然而,如果我们要为移动手部的连续视频的每一帧创建这样的图,我们将有一个数据结构,可以解释为单个图的序列,或具有顺序特征的单个图,这些数据可以用于对视频中的手部动作进行分类。

与传统的序列数据一样,在处理序列的每个状态时,我们不仅要考虑当前状态,还要考虑来自前一个状态的信息,如图6 (a)所示。这个挑战的一个简单解决方案可能是简单地将前一个状态的图嵌入与当前状态的特征连接起来(如图6 (b)),但这种方法不能捕获数据中的长期依赖关系。在本节中,我们概述了传统深度学习的现有解决方案——如长短期记忆网络(LSTM)和门控循环单元(GRU)(在图6中概述)——如何扩展到图领域。 

图长短期记忆网络

图LSTM (GLSTM)利用LSTM单元,这些单元适应于对基于图的数据进行操作。虽然上述循环模块(图6 (b))采用了简单的连接策略,但GLSTM确保可以在LSTM的“单元状态”中编码长期依赖关系(图6 (c))。这缓解了梯度消失问题,其中长期依赖信号在整个网络反向传播时呈指数级减少。

GLSTM单元通过以下四个关键的处理元素来实现这一点,这些元素学会根据前一个状态的嵌入和当前状态的输入来计算有用的量(如图6 (c)所示)。

  1. 遗忘门利用L_f,提取范围[0,1]中的值,表示前一个单元格的状态中的元素应该被“忘记”(0)或保留。
  2. 输入门利用Li,提取[0,1]范围内的值,表示将添加到此单元格状态的调制输入量。
  3. 输入调制门利用L_n,提取范围为[-1,1]的值,表示从该单元格的输入中学习到的信息。
  4. 输出门利用L_o,计算[0,1]范围内的值,指示单元格状态的哪些部分应该作为该单元格的隐藏状态输出。

注:关于提取范围的问题,主要是由使用的激活函数决定的,使用sigmoid和ReLU则值在零和一之间,使用tanh则值在正负一之间。 

为了使用GLSTM,我们需要定义图6(e)中的所有算子。由于图G(V, E)可以被看作是大小可变的顶点和边的集合,我们可以将图的连接定义为分别对顶点特征和边特征进行的单独连接,其中使用了一些空填充以确保生成的张量具有固定大小。可以通过定义输入图的最大顶点数来实现这一点。如果GLSTM单元的输入信号具有固定大小,那么其他算子都可以被解释为传统的张量运算,并且在反向传播时整个过程是可微的。 

循环转换在RGNN应用于图分类时的作用

在这个独立的示例中,我们研究社交网络,它代表了丰富的图数据来源。由于社交网络应用程序的流行,为了分析、营销和影响的目的,准确的用户和社区分类变得极为重要。在这个示例中,我们研究了如何在图域中应用循环的转换函数来辅助进行图分类的预测。

数据集

我们将使用 GitHub Stargazer 的数据集。GitHub 是一个带有社交网络元素的代码共享平台。每个图形都由一组用户(顶点)及其相互关注关系(无向边)定义。每个图形被分类为一个网页开发小组或一个机器学习开发小组。没有顶点或边的特征——所有的预测完全基于图形的结构。

算法

我们将实验过渡函数的有限应用,而不是使用一个真正的RGNN,该RGNN将过渡函数应用于隐藏状态,直到达到某些收敛标准。过渡函数(transition)是一个简单的消息传递聚合器,它应用一组学习到的权重来创建大小为16的隐藏向量表示。在将隐藏表示提供给输出函数进行图分类之前,我们将看到应用该转换函数1、2、4和8次如何影响预测任务。在16个epoch的8096个图上进行训练,并在每个架构的2048个图上进行测试。

结果和讨论

正如预期的那样,连续的过渡函数导致计算出更有判别力的特征,从而导致图的最终表示更有判别力(类似于CNN中更多的卷积层)。

事实上,我们可以看到最终的隐藏表示变得更加线性可分(请参见图5中的TSNE可视化),因此,当将它们提供给输出函数(线性分类器)时,预测的分类通常是正确的。这是一项困难的任务,因为没有顶点或边的特征。对于相同的数据集和任务,最先进的方法实现了以下100个随机训练/测试分割的平均AUC平均值:GL2Vec [10] - 0.551, Graph2Vec [62] - 0.585, SF [16] - 0.558,

图5:x1, x2, x4, x8隐藏层网络的最终隐藏图表示的TSNE渲染。请注意,随着过渡函数的更多应用(相当于NN中的更多层),输入图的最终隐藏表示变得更线性可分到它们的类别(这就是为什么它们能够只用线性分类器进行更好的分类)。在这里,我们的转换函数𝑓是一个只有一层的“前馈神经网络”,因此𝑓的更高级的神经网络(或其他)实现可能会产生更高性能的rgnn。随着更多轮的转换函数被应用到隐藏状态,性能-和所需的计算-增加了。确保迁移函数应用程序数量一致,是开发简化GNN架构和减少迁移阶段所需计算量的关键。我们将在第4.2节中探索如何通过CGNNs实现这种改进的概念。 

门控循环单元

通过消除在每个单元中计算单元状态的需要,GRU为glstm提供了计算成本更低的替代方案。因此,gru有三个可学习的权重矩阵。

  1. 重置门L_r确定从当前状态计算要添加到隐藏状态的新信息时,从“忘记”或“保留”中保留多少信息。
  2. 更新门L_u确定从前一个隐藏状态中“忘记”或“保留”哪些信息。
  3. 候选门L_n确定来自重置输入的哪些信息将有助于下一个隐藏状态。

当重复模式不频繁时,GRU非常适合序列数据,而LSTM单元在需要捕获更频繁的模式信息的情况下表现良好。与GRU相比,LSTM也有过拟合的倾向,因此在样本量较低时,gru的表现优于LSTM单元。

优缺点

在本节中,我们解释了允许RGNN对图输入数据产生有用预测的前向传播。在前向传递期间,过渡函数𝑓递归地应用于输入图以为每个邻域创建高级特征。𝑓的重复应用确保在迭代𝑘时,嵌入h𝑘𝑖包含顶点𝑘远离v𝑖的边的信息。这些高级特性可以提供给输出函数来解决下游任务。在向后传递期间,神经网络𝑓和𝑔的参数根据通过在向前传递中定义的计算图反向传播的损失进行更新。循环处理单元也可以指处理基于图的顺序数据的方法,包括对LSTM和GRU的基于图的扩展。实际上,方程1中提供的计算嵌入的公式仅代表一种计算嵌入的方法。这种方法将在第4节中进行背景介绍,其中将介绍关于计算有用嵌入的更广泛的视角。虽然RGNN提供了一种简单的方法来处理通用图,但它们有许多缺点。也就是说,共享的过渡函数𝑓意味着在连续的迭代中使用相同的权重来提取特征,这对于深度学习场景来说并不理想,在这种场景中,低级特征(在网络的早期)之间的关系与高级特征(在网络的后期)之间的关系是不同的。此外,由于RGNN迭代直到收敛,它们具有可变长度的编码网络,这可能增加实现的复杂性。在下一节中,我们将讨论如何通过开发图域中卷积的形式化定义来缓解这些问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2061208.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

webm格式怎么转换成mp4?7个有效方法将webm转mp4

在数字媒体的浩瀚宇宙中,视频格式的多样性犹如繁星点点,既点亮了创意的火花,也铺设了内容分享的广阔道路。每一种视频格式都承载着其独特的技术优势与设计初衷,WebM便是其中一颗璀璨的新星,专为优化网络传输而生。它凭…

Unity | Shader基础知识(第二十二集:两次渲染)

目录 一、前言 二、“渲染两次” 三、本次成品介绍 四、第一次渲染代码 五、第二次渲染代码 六、截止目前的所有代码 七、调整代码 八、总结 一、前言 之前一直讲的shader文件中,都只写了一次CG代码。 为了大家对这部分的整体理解,我们这次渲…

微服务的保护

一、雪崩问题及解决方案 1.雪崩问题 微服务之间,一个微服务依赖多个其他的微服务。当一个微服务A依赖的一个微服务B出错时,微服务A会被阻塞,但其他不依赖于B的微服务不会受影响。 当有多个微服务依赖于B时,服务器支持的线程和并…

使用策略模式代替多个ifelse

传统的多个 public class OrderServiceImpl implements IOrderService {Overridepublic String handle(OrderDTO dto) {String type dto.getType();if ("1".equals(type)) {return "处理普通订单";} else if ("2".equals(type)) {return "…

PMP–知识卡片--产品管理知识体系

产品管理是公司为管理一个产品或者产品线的产品计划、产品市场和产品生命周期所采用的组织架构。产品管理是一个典型的强矩阵的管理方式。产品管理是企业或组织在产品生命周期中对产品规划、开发、生产、营销、销售和支持等环节进行管理的业务活动。 项目经理和产品有着直接、间…

xmind 2024下载,安装目录更改为其他盘

下载 最新版官网地址 更改目录

网络编程Day9_IO多路复用 20240821

运行1个服务器和2个客户端实现效果: 服务器和2个客户端互相聊天,服务器和客户端都需要使用select模型去实现 服务器要监视2个客户端是否连接,2个客户端是否发来消息以及服务器自己的标准输入流 客户端要监视服务器是否发来消息以及客户端自…

Go小技巧易错点100例(十七)

Go定时任务 在Go语言中,定时任务(也称为定时器或cron作业)具有多种作用,这些作用在应用程序的开发和运维中非常有用。以下是一些常见使用场景: 任务调度:定时任务可以在特定的时间点执行特定的任务&#…

云渲染服务大揭秘:为何它值得成为你的渲染新选择

云渲染是一种基于云计算的服务,它利用大量高性能计算机组成的集群来渲染高质量的图像和动画。这种服务能够显著加快3D动画或视觉效果项目的渲染速度,将原本可能需要数天的渲染任务缩短至数小时。 云渲染的优势 本文将探讨使用云渲染的好处,并…

【ACM出版,高录用EI快检索】第七届计算机信息科学与人工智能国际学术会议(CISAI 2024,9月6-8)

第七届计算机信息科学与人工智能国际学术会议(CISAI 2024) 将于2024年09月6-8日在中国浙江-绍兴举行。 计算机信息科学与人工智能国际学术会议的主题主要围绕“信息科学”与“人工智能”的最新研究展开,旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员…

React学习笔记,从入门到砸门

项目构建命令 npx create-react-app react-basic npx:node语法 create-react-app:项目模板 react-basic:项目名称 项目结构 项目打包和本地预览 项目打包npm run build本地预览(模拟服务器运行项目) 安装本地服务包…

STM32f407 网络接收 fpga 的 bin 文件并更新到 fpga series7(3)

STM32f407 网络接收 fpga 的 bin 文件并更新到 fpga series7(3) 简介 实验 3:在搭建好 tcp 服务器,并拟定好协议的前提下,接收每一个 bin 文件的块,配置到 fpga。 原理图 fpga fpga1 stm32 接线总结 // fpga引脚 stm32…

快速了解矿用电源特性及其性能测试利器电源ate检测系统

在矿产资源开采的每一个环节,矿用电源都扮演着幕后英雄的角色,它的作用不可小觑。那么什么是矿用电源呢?电源ate检测系统如何助力矿用电源性能测试呢? 矿用电源模块介绍 矿用电源是专门用于矿井等地下作业场所的重要电源设备&…

阿里MAXCOMPUTE数据专辑信息读取并同步数据表

阿里MAXCOMPUTE数据专辑信息读取并同步数据表 在阿里云大数据体系中,我们可以使用数据地图的数据专辑,对数据的类别等进行一个管理 那么管理后的数据,我们想要落表进行相关的数据分析,如何做呢? 查看阿里云官方文档…

虚幻5|制作刀光粒子效果

一,创建一个粒子效果 1.Niagara系统 2.右键添加发射器,创建一个空白 3.点击空白的渲染,选择条带渲染器 4.右侧选择自定义侧面矢量 5.按顺序如下,编辑刀光的周期和方向 6.添加一个spawn per frame,使刀光每帧都在生成&…

Upload-Lab第13关:POST上传方式如何巧妙利用%00截断法绕过上传验证

第13关概述 在Upload-Lab第13关中,服务器会对上传的文件进行严格的扩展名检查。只有符合白名单的扩展名(如.jpg、.png等)才能成功上传。我们的目标是绕过这种检查,将恶意文件(如.php)上传到服务器。以下是…

图神经网络教程4-卷积图神经网络

介绍 卷积神经网络在涉及图像的预测任务上取得了最先进的性能。通过将权值学习核与输入图像卷积,CNN根据其视觉外观提取感兴趣的特征,无论它们在图像中的位置是哪里。虽然图像只是图的一个特殊情况(见图1 (a)),但是为图领域定义一个广义卷积…

了解同步带选择同步带

同步带和轮选型 同步带传动属于皮带传动,但是改进了传统皮带传动无法保持严格的传动比的打滑问题,传统皮带传动依靠皮带和皮带轮张紧时产生的摩擦力传输动力,但是从动轮遇到障碍或超载荷时,皮带会在皮带轮产生滑动。 解决打滑问题…

企业高性能web服务器【Nginx详解】

一.Web 服务基础介绍 1.1 互联网发展历程 1993年3月2日,中国科学院高能物理研究所租用AT&T公司的国际卫星信道建立的接入美国SLAC国家实 验室的64K专线正式开通,成为我国连入Internet的第一根专线。 1995年马云开始创业并推出了一个web网站 中国黄页…

【其它-高效处理小技巧】如何批量备份263企业邮箱邮件

如何批量备份263企业邮箱邮件 近期由于有人离职,邮箱要注销,之前邮箱内有5000多封沟通邮件,为避免将来找不到沟通过程,所以需要备份。 目的:一次性备份所有沟通邮件 方法一: 少于20封邮件,推荐…