《图机器学习》-GNN Augmentation and Training

news2025/1/15 16:49:02

GNN Augmentation and Training

  • 一、Graph Augmentation for GNNs
    • 1、Feature Augmentation
    • 2、Structure augmentation
    • 3、Node Neighborhood Sampling

一、Graph Augmentation for GNNs

之前的假设:
Raw input graph = computational graph,即原始图等于计算图。

现在要打破这个假设,原因如下:

  • 如果图过于稀疏:消息传递效率低下
  • 如果图过于密集了:消息传递的开销太大
    • 如要点击查看某个名人的embedding,要汇聚其成千上万个追随者的信息,这个花销是很大的
  • 如果图很大:难以将计算图拟合到CPU内存中

所以,原始输入图不太可能恰好是嵌入的最佳计算图。因此需要Graph Augmentation,改变解构使之适于嵌入。


1、Feature Augmentation

为什么我们需要特征增强?
(1)、输入图没有节点特征;如只有邻接矩阵的时候。

解决方案:

  1. 为节点分配常量值
    如为每个节点都分配一个常数1,在一轮汇聚后,各节点就能学习到其邻居节点的个数。
    在这里插入图片描述
  2. 为节点分配唯一的IDs
    如为每个节点都分配one-hot编码
    在这里插入图片描述
    该方法每个node的向量不一样,增加了模型的表达能力,但是花费的代价非常大,如one-hot编码的维度和节点数量一致

两种方式的对比:

Constant node featureOne-hot node feature
表达能力中等。所有的节点都是相同的,但GNN仍然可以从图结构中学习高。每个节点都有唯一的ID,因此可以存储特定于节点的信息
归纳学习(推广到新的节点)高。推广到新节点很简单:我们为它们分配恒定的特征,然后应用我们的GNN低。不能泛化到新节点:新节点引入新ID, GNN不知道如何嵌入看不见的ID
计算成本低。只有一维特征高。O(|V|)维度特征,不能应用于大型图
使用范围任何图小图

为什么我们需要特征增强?
(2)、GNN很难学习某些结构

如:计算节点所处环的节点数
在这里插入图片描述

基于前面的GNN是不能够解答这个问题的,原因是这两个节点的计算图是一样的,学习出来的embedding大致类似

在这里插入图片描述
解决方案:
可以添加cycle count作为节点的特征,如下图;即开辟一个特征空间用于描述所需要的属性。
在这里插入图片描述

其他常用于数据增强的特征:

  • Node degree
  • Clustering coefficient
  • PageRank
  • Centrality

2、Structure augmentation

出发点: Augment sparse graphs(增强稀疏图)

  1. Add virtual edges

    • 常见的方法:通过虚边连接2跳邻居
    • 如:将邻接矩阵 A A A使用 A + A 2 A+A^2 A+A2代替
    • 实例:Bipartite graphs。
      使用2-hop的虚边将作者节点连接起来
      在这里插入图片描述
  2. Add virtual nodes
    增加一个虚拟节点,虚拟节点将于图中的所有节点相连接

    • 好处:
      1. 缩短节点之间的距离(均可两跳可达)
      2. 传递信息更多、更有效、更快
    • 在这里插入图片描述

3、Node Neighborhood Sampling

回顾之前的GNN计算图,所有节点都用于消息传递,如下图:

在这里插入图片描述

新的想法:
随机的选取邻居节点的子集用于计算图的构建(用于信息传递)

例如,可以在给定的层中随机选择2个邻居来传递消息,如下图:

在这里插入图片描述

在大图中,随机采样邻居节点的子集用于信息传递能够减少计算图;但会丢失信息,即获得了效率但失去了一些表现力。

为了弥补,可以在下一层中,当我们计算嵌入时,对不同的邻居进行采样(即每一层都采样不同的邻居用于计算图的构建),提升模型的鲁棒性。

在这里插入图片描述

该方法在实践中效果不错。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/379239.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

产品需求文档需要注意10件事

01什么是完美的产品需求文档(PRD)?就像产品经理一样,产品需求文档需要同时有效地执行许多不同的角色。该文档将由设计师,营销人员和工程团队使用,并且需要传达他们所需的所有必要信息。参考上面的漫画&…

html,

目录1. html新建1.1 html基本结构1.2 html细节2. 标签2.1 font标签2.2 字符实体2.3 标题标签2.4 超链接标签2.5 列表标签2.6 图片标签2.7 表格标签2.8 表单标签2.8.1基本使用2.8.2表单综合练习2.8.3表单格式化2.8.4表单使用细节2.8.5get请求2.8.6post请求2.9 其它标签2.9.1div标…

【JavaScript】第一章JavaScript入门

第一章 JavaScript入门JavaScript介绍JavaScript的起源JavaScript的应用JavaScript的特点JavaScript是脚本语言支持面向对象编程,面向过程编程/函数式编程支持跨平台执行JavaScript和ECMAScript的关系开发工具编辑器sublime textVisual Studio CodewebstormDreamwea…

安装VMWare虚拟机之后,发现网络贼卡,打开网页很慢

事情描述: 最近忙一个项目,需要到虚拟机中部署环境,安装完之后,就开整自己的项目了。 可以过几天,发现本地网络贼卡,打开各网页慢的一批,一开始还以为是路由器的问题,反复折腾之后排…

HBuilder X启动微信开发工具报错的问题

今天通过HBuilder X启动微信开发工具,报了如下的错: [微信小程序开发者工具] [error] IDE service port disabled. To use CLI Call, please enter y to confirm enabling CLI capability, or manually open IDE -> Settings -> Security Settings…

Android Studio相关记录

目录Android Studio 便捷插件Android LogcatJava文件的类头模板Android Studio 使用遇到的问题解决方案org.jetbrains.annotations.NullableBuild 控制台编译输出中文乱码Terminal 使用 git 命令窗口git 命令窗口中文乱码Android Studio 便捷插件 Android Logcat 配置路径 Fi…

【VUE】六 路由和传值

目录 一、 路由和传值 二、案例 三、案例存在无法刷新问题 一、 路由和传值 当某个组件可以根据某些参数值的不同,展示不同效果时,需要用到动态路由。 例如:访问网站看到课程列表,点击某个课程,就可以跳转到课程详…

【c#】学习DATATABLE排序

c#实现Datatable排序Datatable排序结果图代码展示总结Datatable排序 结果图 原数据 倒序 去重 筛选行 代码展示 1、使用datatable视图对table进行排序 //倒序排序 dt.DefaultView.Sort “CreateTime desc”; dt dt.DefaultView.ToTable(); 如果想升序排序&#xff0c…

kafka入个门

名词 topic 表 partation 水平扩展 leader 主 follow备 produce生产 offset偏移量 消息队列的流派 什么是 MQ Message Queue(MQ),消息队列中间件。很多人都说:MQ 通过将消息的发送和接收分离来实现应用程序的异步和解偶&#xf…

DASCTF X GFCTF 2022十月挑战赛 Web

from DASCTF X GFCTF 2022十月挑战赛 Web EasyPOP 就简单的php反序列化 源码 <?php highlight_file(__FILE__); error_reporting(0);class fine {private $cmd;private $content;public function __construct($cmd, $content){$this->cmd $cmd;$this->content …

Leetcode22. 括号生成

一、题目描述&#xff1a; 数字 n 代表生成括号的对数&#xff0c;请你设计一个函数&#xff0c;用于能够生成所有可能的并且 有效的 括号组合。 示例 1&#xff1a; 输入&#xff1a;n 3输出&#xff1a;[“((()))”,“(()())”,“(())()”,“()(())”,“()()()”] 示例 2&…

Java笔记028-集合章节练习

Java笔记028-集合章节练习编程题按要求实现&#xff1a;封装一个新闻类&#xff0c;包含标题和内容属性&#xff0c;提供get、set方法&#xff0c;重写toString方法&#xff0c;打印对象时只打印标题只提供一个带参构造器&#xff0c;实例化对象时&#xff0c;只初始化标题&…

【Java】Java进阶学习笔记(一)—— 面向对象(封装)

【Java】Java进阶学习笔记&#xff08;一&#xff09;—— 面向对象&#xff08;封装&#xff09;一、类中成分1、类中成分2、this关键字this() 访问构造器方法3、static关键字1. 成员变量的区分2. 成员方法的区分3. 成员变量访问语法的区分二、封装1、封装的定义封装的好处2、…

excel之古诗词打乱排序

最终效果 制作过程: 一、选择一首古诗&#xff0c;将正文内容连接起来&#xff0c;放在一个单元格中 二&#xff0c;由于这首诗是20字的&#xff0c;加工20个不重复的随机数&#xff0c;具体公式如下图 &#xff08;写好第一行数据&#xff0c;拖动下拉即可&#xff09; 其中…

虚拟机上安装openKylin详细步骤总结

一、创建虚拟机 首先获取操作系统安装镜像文件&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1tSuXmDk2ZILR4ieee6iImw?pwdcy47 提取码&#xff1a;cy47 &#xff08;1-1&#xff09;进入新虚拟机创建向导&#xff0c;选择“自定义”&#xff1a; &#xff08;1-…

创业做校园外卖平台,该如何把自己的平台宣传出去?

如何宣传校园外卖平台&#xff1f;主要看平台宣传&#xff0c;配套宣传工具不一样&#xff01; 我认为有以下几点&#xff1a; 1.建立以宿舍楼为基础的推广团队&#xff0c;依托平台分佣&#xff0c;并能做到每个宿舍楼的送餐和广告分发&#xff1b; 2.根据学生的消费习惯&a…

【带组态源码】Java物联网平台源码 Modus RTU协议 文档齐全 带移动手机端

▶ 组态功能强大、组件丰富 ▶ 组态设计功能强大&#xff1a;包括基础组件、消息组件、图表组件三大类 ▶ 基础组件包括&#xff1a;位按钮、窗口按钮、多态、图片按钮、流动、静态文本、动态变量、输入框、滑块、选择框、网格、矩形、椭圆、直线、自定义形状。 ▶ 图表组件包…

如何用Postman测试整套接口?测试流程是什么?

目录 基于postman测试接口(整套接口测试) 可以解决的问题 开启控制台 单个测试尝试 使用请求结果当参数 打印结果(JSON) 自定义可视化结果 随机参数 测试用例连接 一键测试接口集合 从swagger导入接口 自定义全局变量 总结感谢每一个认真阅读我文章的人&#xff01…

异步简单实现一人一单

本项目码云地址&#xff1a;https://gitee.com/flowers-bloom-is-the-sea/distributeNodeSolvePessimisticLockByRedis/tree/version3/ 项目前身&#xff1a;https://gitee.com/flowers-bloom-is-the-sea/distributeNodeSolvePessimisticLockByRedis/tree/version2.0/ 异步实…

java易错题锦集系列五

接口中不能有构造方法&#xff0c;抽象类中可以有。抽象类中构造方法作用&#xff1a;初始化抽象类的成员&#xff1b;为继承它的子类使用 定义在同一个包&#xff08;package&#xff09;内的类是可以不经过import而直接相互使用 final修饰的方法可以被重载 但不能被重写 从…