HGNN+笔记

news2025/1/16 5:38:43

1.Title

HGNN+: General Hypergraph Neural Networks(Yue Gao; Yifan Feng; Shuyi Ji; Rongrong Ji)【IEEE Transactions on Pattern Analysis and Machine Intelligence 2023

2.Conclusion

        This paper extend the original conference version HGNN, and introduce a general high-order multi-modal/multi-type data correlation modeling framework called HGNN + to learn an optimal representation in a single hypergraph based framework. In this method, hyperedge groups are first constructed to represent latent high-order correlations in each specific modality/type with explicit or implicit graph structures. An adaptive hyperedge group fusion strategy is then used to effectively fuse the correlations from different modalities/types in a unified hypergraph. After that a new hypergraph convolution scheme performed in spatial domain is used to learn a general data representation for various tasks. 

3.Good Sentence

        1、On one hand, the data correlation in the real world is far beyond pairwise correlation, which cannot be well modeled with a plain graph. For example, users in social networks may have different properties, and the correlation among those users could be in the manner of group, e.g., several users may share the same hobbies or are involved in the same event. Another limitation of simple graph is its weak capability in modeling multi-modal/multi-type real-world data.(The shortcoming of GNNs)

        2、Here, we want to highlight the second fusion strategy: Adaptive Fusion. It associates each hyperedge group with a learnable parameter, thus adaptively identifying the importance of different hyperedge groups to the overall hypergraph representation learning and better exploiting the complementary representation of multi-modal/multi-type information(The innovative point of this paper)

        3、However, considering that the information richness of different hyperedge groups varies a lot, such a simple Coequal Fusion cannot make full use of the multi-modal hybrid high-order correlations. Therefore, in this paper, we propose an adaptive strategy for the fusion of hyperedge groups, namely Adaptive Fusion.(The shortcomings of Coequal Fusion and how to improve it)


上如是超图与简单图的区别。       

 在本文中提出了基于超图卷积的表示学习来处理表示学习过程中的高阶数据相关性,并显示出不错的性能,该方法是 HGNN 的扩展,称为HGNN+。HGNN+的架构如图左部分所示,右边是一个超图卷积过程。

HGNN + 可以对高阶数据关联进行建模,并且易于与多模态/多类型数据融合。首先,为了更好地捕捉数据之间的底层高阶相关性,采用超图结构进行数据关联建模; 在处理多模态/多类型数据时,超图可以使用多模态/多类型数据生成不同类型的超边,然后直接将这些超边连接成一个超图。


hyperedge group:本文完善了超边组的概念。从数学上讲,超边组可以定义为节点集上的一个集合群组。而在节点集上,节点之间可能存在多类型关系。超边组可以基于一种关系构建,用以表示多重信息的不同特征。

        本文将建模分为两个步骤:超边组构建和融合。在有/无图结构的数据下,引入4种类型的超边组来生成超图,即特征空间中的  成对边(using pairwise edge)、属性(attribute)、 k -Hop和邻居(neighbor)。

        在生成多个超边组后,进一步有两种构建整体超图结构的方案。第一种是:直接连接不同的超边组的关联矩阵【Coequal Fusion】第二种是:将每个超边组与一个可学习参数相关联,从而自适应地识别不同超边组对整体超图表示学习的重要性,并更好地利用多模态/多类型信息的互补表示。【Adaptive Fusion


超图任务:

        给定一个超图,分类任务转向对超图上的顶点进行分类,其中超图上的标签需要通过超图结构进行平滑处理。该任务可以表述为正则化,如图: ,其中

是正则化器,也是监督经验损失。是分类函数。        

                令,那么上一个式子的矩阵形式为:\Delta是超图拉普拉斯算子


超图神经网络HGNN + 的框架:

        分两部分:超图生成和超图卷积。

        超图建模:在大多数情况下数据没有明确的超图结构。因此,我们需要使用不同的策略生成超图。通常,从头开始生成超图的情况可以分为三种场景,即具有图结构的数据、没有图结构的数据和具有多模态/多类型表示的数据。目前有三种超边生成策略,分别是成对边、 k -Hop和邻居。成对边和 k -Hop可用于具有图结构的数据生成超边组,在特征空间中通过邻居法从无图结构的数据生成超边组。最后,所有超边组将被进一步连接以生成整体超图。


        当数据关联与图结构相关时。在某些情况下,存在可用的成对数据关联,就是成对边,它的目标是直接将图结构转换为一组2-uniform的超边,如图所示

能够完全覆盖图结构中的低阶(成对)相关性,这是高阶相关性建模所需的基本信息 


Hyperedge group using k-Hop neighbors 旨在通过图结构中的 k -Hop 可到达位置找到中心点的相关顶点.带有k-Hop的超边组可以写成:

能够通过扩展图结构中的搜索半径来利用中心顶点的外部相关顶点,因此超边不止两个顶点组成,而是包含一组顶点


接下来是数据没有图结构时的方法

用属性的超边组。通过给定类似属性的数据,例如地理位置、时间和其他不同主体共享的特定信息,可以生成一组在属性空间中相邻的超边。其中每个超边代表一个属性(或属性的一个子类型)并连接共享同一属性 a 的所有主体。共享该属性 a 的顶点子集可以表示为


Hyperedge group using features

给定每个顶点的特征,可以通过在特征空间中查找每个顶点的邻居来生成,给定一个节点作为质心,可以通过K-近邻生成超边,也可以通过选择距离在d以内的所有节点生成超边


 超边组连接成超图

        通过上面的方法生成多个超边组以后,需要把它们组成起来形成最终所需要的超图。

        构造超图G的关联矩阵的最简单的方法就是直接将所有超边连接为,所有超边的权重为1,这种方法就叫Coequal Fusion。

        然而,考虑到不同超边的信息丰富度差异较大,这种简单的Coequal Fusion无法充分利用多模态混合高阶相关性。因此,本文提出了一种超边缘群融合的自适应策略,即自适应融合(Adaptive Fusion)。

自适应融合:

每个超边组都与一个可训练参数相关联,该参数可以自适应地调整多个超边组对最终顶点嵌入的影响。其定义为

其中 w_k∈R 是指定超边组 k 内所有超边共享的可训练参数。

向量是超边组k的权重向量。

copy(a,b)是把a复制b次的函数,最后返回一个size为b的向量

表示所有超边组中超边的和

W是一个代表权重的对角矩阵。

给定多模型/多类型数据,可以相应地生成多个超边组。从构建的超边组中生成超图关联矩阵 H 和超边权重矩阵 W ,然后将其输入到超图卷积层中进行进一步计算。


超图卷积

光谱卷积在AIII 2019的HGNN上提到了,这里仅关注空间上的卷积。

定义:对于超图中的每个顶点,聚合其相邻顶点信息,根据中心顶点与其邻域中每个顶点之间的“路径”进行自我更新。超图中的路径hyperpath,节点v1到vk的路径被定义为:超路径中的每两个相邻顶点都由一个超边分隔。两个顶点之间的超图中的信息通过相关的超边传输。

        对于消息的传播,首先,将超边集和节点集间的邻居关系定义为N。

根据上式,可以定义超边的节点邻居和节点的超边邻居,分别如下

基于以上三个定义,假设给定一个顶点α,以及一个超图G,超图卷积的目标是从α的超边邻居集中聚合信息 ,而为了获得中每个超边β的信息,又需要从超边β的顶点邻居集中聚合信息。这两个步骤形成了一个从节点特征信息集X^tX^{t+1}的闭合传递循环。因此,第t层的空间域超图卷积可以定义为:

x_\alpha ^tX^t是节点α∈V的在第t(=1,2,.....T)层时的输入特征向量,x_\alpha ^{t+1}是节点α的更新信息,m_\beta^{t }是超边β的信息,而w_\beta是与超边β相关联的权重,m_\alpha^{t }是节点α的信息。y_\beta^{t }是超边β的超边特征分别是第t层的节点信息函数、超边更新函数、超边信息函数和节点更新函数,可以针对指定的应用进行灵活定义


HGNNConv +:

\Theta ^t是第t层的可训练参数,σ(⋅) 是任意非线性激活函数,表示将节点特征和超边特征归一化,这能够累积收敛并在一定程度上防止抖动。

HGNNConv+的矩阵形式如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1281184.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Java SSM框架+Vue实现教学视频点播网站项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架Vue实现教学视频点播网站演示 摘要 随着现在网络的快速发展,网上管理系统也逐渐快速发展起来,网上管理模式很快融入到了许多学院的之中,随之就产生了“视频点播系统”,这样就让视频点播系统更加方便简单。 对于…

Spring IOC—基于XML配置和管理Bean 万字详解(通俗易懂)

目录 一、前言 二、通过类型来获取Bean 0.总述(重要) : 1.基本介绍 : 2.应用实例 : 三、通过指定构造器为Bean注入属性 1.基本介绍 : 2.应用实例 : 四、通过p命名空间为Bean注入属性 1.基本介绍 : 2.应用实例 : 五、通过ref引用实现Bean的相…

RHCSA学习笔记(RHEL8) - Part1.RH124

Chapter Ⅰ 入门 - Linux 开源系统,命令行,模块化(软件包的形势) - Windows 闭源Linux是类UNIX系统,mac系统也是类UNIX系统,所以二者的图形化界面比较相似 开源许可证:公共版权;宽…

JSP格式化标签 parseNumber指定格式字符串转数字类型

好 我们继续来说格式化标签 parseNumber 它的作用是讲一个字符串 转换为指定格式的数值型 老实说 这东西 作为了解把 实际开发中都不是用得少 我建议还是在java端就处理好 不建议在jsp中高这种类型转换的操作 基本格式如下 这几个属性都是我们这几期jsp标签的老朋友了 我们…

fastsocket提升nginx CPS性能分析

fastsocket是针对单机网络性能优化,提升单机的cps。 提升现在单机7LB服务的性能,预计cps的性能提升一倍。 内核对nginx的性能瓶颈损耗主要在内核的三把锁。 1. accpet的全局队列的sk_lock锁 2. new_inode中的全局inode_lock锁 3. sock_alloc_file中的…

固态硬盘与机械硬盘的区别

盘、磁道、扇区、柱面,这些都是机械硬盘的概念,固态硬盘没有这些东西,固态硬盘和机械硬盘虽然都叫硬盘,但是在原理层面有着本质上的区别。 速印机(理想、荣大等)、复印机(夏普、东芝、理光、佳能…

【论文阅读 + 核心代码定位解读】(2023 AAAI)HiCLR

Hierarchical Consistent Contrastive Learning for Skeleton-Based Action Recognition with Growing Augmentations Contribution 直接使用 strong augmentations 会导致图片/骨架点序列的结构变形和语义信息损失,从而导致训练过程的不稳定。于是本文提出了一种逐…

【BLE基础知识】--Slave latency设置流程及空中包解析

1、Slave latency基本概念 当BLE从设备对耗电量要求较高时,若需要节省耗电量,则可以通过设置Slave Latency参数来减少BLE从设备的耗电。 Slave Latency:允许Slave(从设备)在没有数据要发的情况下,跳过一定…

SQL Server 数据库,分离和附加数据库

2.2.4分离和附加数据库 如果要将数据库更改到同一计算机或不同计算机的不同SOL Server实例中,或要移动数据库文 件存储的位置,分离和附加数据库会很有用。可以将数据库的数据文件和日志文件从所在实例分离 出来,然后将它们重新附加同一或其他…

SpringDataRedis 操作 Redis,并指定数据序列化器

文章目录 1. SpringDataRedis 概述2. 快速入门2.1 导入pom坐标2.2 配置文件2.3 测试代码2.4 数据序列化器2.5 StringRedisTemplate2.6 总结 1. SpringDataRedis 概述 SpringData 是Spring 中数据操作的模块,包含对各种数据库的集成,其中对Redis的集成模…

KDE环境文件夹user-dirs为英文

KDE环境文件夹user-dirs 修改KDE主页文件夹为英文 该文件路径 ~/.config/user-dirs.dirs打开后会发现里面的内容如下 # This file is written by xdg-user-dirs-update # If you want to change or add directories, just edit the line youre # interested in. All local …

STM32踩坑--串口发送乱码

一、发现问题 今天在STM32F407新板子上测试串口时,发现发送数据一直乱码。 二、解决问题 针对STM32F407系列校准PLLCLK时钟: ①由 时钟树 可以看出PLLCLKHSE(高速外部时钟)*N/(M*P)。因为SYSTICK一般取最高的时钟168M&#xff…

行为型剩余的模式

1.中介者模式 package com.jmj.pattern.mediator;public abstract class Mediator {public abstract void constact(String message,Person person); }package com.jmj.pattern.mediator;public class MediatorStructure extends Mediator{private HouseOwner houseOwner;priva…

Elasticsearch:什么是大语言模型(LLM)?

大语言模型定义 大语言模型 (LLM) 是一种深度学习算法,可以执行各种自然语言处理 (natural language processing - NLP) 任务。 大型语言模型使用 Transformer 模型,并使用大量数据集进行训练 —— 因此规模很大。 这使他们能够识别、翻译、预测或生成文…

PMP-01

考纲 需要看的书籍 学习计划

设计模式之原型模式(2)--深拷贝的实现图文讲解

目录 前言Clone方法复制值类型变量引用类型成员变量只复制引用浅拷贝变深拷贝 示例详解注意事项总结 前言 在上一篇原型模式博客的基础上,今天第二次写,会详细讲解一下从浅拷贝到深拷贝的实现,我也有专门写过一篇关于浅拷贝与深拷贝的文章&am…

【机器学习】简单认识监督学习

简单认识监督学习 ⭐️Supervised learning⭐️Examples⭐️Specific example⭐️两种类型的监督学习算法🌙回归算法🌙分类算法 ⭐️总结 Hi~大家好呀!经历了暑假期间短暂的接触机器学习的一些算法,之后又对深度学习、yolo系列有些…

C++二维数组名到底代表个啥

题目先导 int a[3][4]; 则对数组元素a[i][j]正确的引用是*(*(ai)j)先翻译一下这个*(*(ai)j),即a后移i解引用,再后移j再解引用,这么看来a就应该是个二维数组,第一层存储行向量,一次解引用获得行向量的地址,…

【Leetcode题单】(01 数组篇)刷题关键点总结03【数组的改变、移动】

【Leetcode题单】(01 数组篇)刷题关键点总结03【数组的改变、移动】(3题) 数组的改变、移动453. 最小操作次数使数组元素相等 Medium665. 非递减数列 Medium283. 移动零 Easy 大家好,这里是新开的LeetCode刷题系列&…

数据库-MySQL之数据库必知必会22-26章

第 22 章 使用视图 视图是虚拟的表。与包含数据的表不一样,视图只包含使用时动态检索数据的查询。 使用视图 视图用CREATE VIEW语句来创建。 使用SHOW CREATE VIEW viewname;来查看创建视图的语句。 用DROP删除视图,其语法为DROP VIEW view…