论文阅读11——《Mutual Boost Network for Attributed Graph Clustering》

news2024/12/22 17:09:49

原文地址: 论文阅读11——《Mutual Boost Network for Attributed Graph Clustering》

作者:Xiaoqiang Yan, Xiangyu Yu, Shizhe Hu, Yangdong Ye

发表时间:预印本

论文地址:https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4195979

代码地址:https://github.com/Xiaoqiang-Yan/MBN

目录

    • 创新
      • 存在问题
      • 解决方案
    • 观点
    • 模型
      • 自编码器模块
      • 图自编码器模块
      • 表示增强模块
      • 自监督模块
    • 实验
      • 伪代码
      • 实验结果
    • 结论

创新

存在问题

  1. 现有区分表示的方法受到节点结构特征之间差异限制
  2. 如何保证由节点结构特征产生的聚类分配的一致性仍然是一个具有挑战性的问题,这往往会导致聚类性能下降现有方法忽略了这个问题

解决方案

  1. 提出一种新的双通道属性图聚类网络(MBN),它由自编码器图自编码器组成,可以相互学习交互,实现聚类性能相互提升
  2. 设计一种表示增强机制,以促进异构节点和结构特征的传播和融合。
  3. 首先提出一种新的表示增强模块,将来自节点结构特征的异构信息传播出去,用于学习综合表示。然后通过对比聚类分配,设计了一致性约束,提供了相互指导,使聚类分配趋于一致。最后在一个统一的框架下,以自监督的方式,同时优化表示学习和聚类分配过程。

观点

  1. 属性图聚类任务的关键前提学习节点的判别表示
  2. 现有的GCN虽然取得了很大的成功,但是由于过度依赖于邻居节点的信息集成,在拓扑节点特征融合方面并不理想,存在过平滑问题
  3. 自编码器和图自编码器学到的表示融合后是全面和可靠的,可以产生高置信度的辅助聚类分配。
  4. 现有的方法不能充分利用节点和拓扑结构来学习鉴别性的表示,他们不能保证由异构节点和结构特征产生的不同分配的聚类一致性,从而导致聚类性能不佳。

模型

在这里插入图片描述

自编码器模块

没啥好说的了,写了这么多篇论文阅读,都有自编码器模块,可以去前面的文章看。最终得到一个属性的重建损失,用于后面的模型训练。

图自编码器模块

与DFCN中IGAE模块类似,使用图卷积作为编码器部分,同时解码器部分也用图卷积
Z ( l + 1 ) = φ ( A ~ Z ( l ) U e ( l ) ) Z ^ ( k + 1 ) = φ ( A ~ Z ( k ) U d ( k ) ) \begin{aligned} Z^{(l+1)}&=\varphi(\widetilde{A}Z^{(l)}U_e^{(l)}) \\ \hat{Z}^{(k+1)}&=\varphi(\widetilde{A}Z^{(k)}U_d^{(k)}) \end{aligned} Z(l+1)Z^(k+1)=φ(A Z(l)Ue(l))=φ(A Z(k)Ud(k))
重建邻接矩阵
A ^ = σ ( Z Z ⊤ ) + σ ( Z ^ Z ^ ⊤ ) \hat{A}=\sigma(ZZ^\top)+\sigma(\hat{Z}\hat{Z}^\top) A^=σ(ZZ)+σ(Z^Z^)
最后通过以下损失函数进行训练:
L G A E = L f + δ L a L f = 1 2 N ∥ A ~ X − Z ^ ∥ 2 2 L a = 1 2 N ∥ A ~ − A ^ ∥ 2 2 \begin{aligned} &L_{GAE} =L_f+\delta L_a \\ &L_f = \frac{1}{2N}\|\widetilde{A}X-\hat{Z}\|_2^2 \\ &L_a = \frac{1}{2N}\|\widetilde{A}-\hat{A}\|_2^2 \end{aligned} LGAE=Lf+δLaLf=2N1A XZ^22La=2N1A A^22
分别表示GAE的损失函数、特征表示Z的重建损失、邻接矩阵的重建损失。

表示增强模块

用于传播和融合异构节点和结构信息,以获得更全面、更有区分度的表示。该模块包括两个步骤:层间信息传播和结构信息融合。首先,为了从图数据中提取更多的鉴别信息,将节点的纯属性特征集成到GCN中进行结构表示学习,对具有结构信息的特征信息的传播,通过线性计算将AE中的特征注入到GAE模块对应的层,这里说这么多其实还是SDCN中的传递算子进行的操作,公式也不展示了。

为了进一步提高表示质量,利用一个类似图卷积的算子来从邻居中集成结构信息
Z = A ~ ( Y ( L ) + Z ( L ) ) Z=\widetilde{A}(Y^{(L)}+Z^{(L)}) Z=A (Y(L)+Z(L))
其实就是用归一化拉普拉斯算子 A ~ \widetilde{A} A 对自编码器的最后一层嵌入表示 Y ( L ) Y^{(L)} Y(L)和图自编码器的最后一层嵌入表示 Z ( L ) Z^{(L)} Z(L)进行信息聚合的操作,所谓类似图卷积,就是将图卷积神经网络中的参数矩阵看作单位矩阵 I I I

自监督模块

这里与之前模型不同的是,没有使用自编码器嵌入 Y Y Y的辅助分布,而是使用图自编码器嵌入 Z Z Z的目标分布 Q Z Q_Z QZ和辅助分布 P Z P_Z PZ,对应的损失函数为:
L c l u = K L ( P Z ∥ Q Z ) = ∑ i ∑ j p i j log ⁡ p i j q i j L c o n = K L ( Q Z ∥ Q Y ) = ∑ i ∑ j q i j log ⁡ q i j q i j ′ \begin{aligned} L_{clu}&=KL(P_Z\|Q_Z)=\sum\limits_i\sum\limits_jp_{ij}\log\frac{p_{ij}}{q_{ij}} \\ L_{con}&=KL(Q_Z\|Q_Y)=\sum\limits_i\sum\limits_jq_{ij}\log\frac{q_{ij}}{q_{ij}'} \end{aligned} LcluLcon=KL(PZQZ)=ijpijlogqijpij=KL(QZQY)=ijqijlogqijqij
总的损失函数:
L = L r e c + α L c l u + β L c o n L r e c = L G A E + L A E \begin{aligned} &L=L_{rec}+\alpha L_{clu} + \beta L_{con} \\ &L_{rec}=L_{GAE}+L_{AE} \end{aligned} L=Lrec+αLclu+βLconLrec=LGAE+LAE
最终的聚类结果使用自编码器嵌入 Y Y Y的目标分布 Q Y Q_Y QY作为聚类结果:
r i = arg ⁡ max ⁡ j q i j r_i=\arg\max_jq_{ij} ri=argjmaxqij

实验

伪代码

在这里插入图片描述

实验结果

在这里插入图片描述

结论

提出一种新的双通道属性图聚类网络(MBN),该网络由自编码器和图自编码器组成,他们可以相互学习和交互。

MBN的优点:

  1. 利用所提出的表示增强模块,传播并融合来自节点特征和图结构的有价值的异构信息,用于识别图表示学习
  2. 提出一致性约束目标,以提高不同任务之间的聚类一致性。
  3. 设计了一个自监督模块,在一个统一的框架中同时优化图聚类性能和表示学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/31088.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Camtasia Studio2023喀秋莎免费实用的屏幕录像工具

CamtasiaStudio2023是一款非常不错的软件。总的来说CamtasiaStudio的功能从专业度来说,分别有:录制桌面,录制视频教程,录制音频;剪截视频,拼接合成视频,制作小视频Camtasia Studio是TechSmith的…

web网页设计期末课程大作业:环境保护主题网站设计——农业三级带表单带js(14页)HTML+CSS+JavaScript

🎀 精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

自顶向下计算机网络学习 传输层

自顶向下计算机网络学习 传输层一、概述和传输层服务1.1 传输层提供的服务1.2传输层和网络层的关系1.3 传输层协议可靠的、保序的传输:TCP不可靠、不保序的传输:UDP二、多路复用与解复用2.1 什么是复用与解复用2.2 面向连接(TCP)的多路复用与分解2.3 无连…

Verilog 实现无毛刺时钟切换电路,RTL代码设计+testbench代码测试,波形前仿真

Verilog 实现无毛刺时钟切换电路 1,原理2,无毛刺时钟切换3,RTL代码设计4,testbench测试代码5,RTL+testbench综合的 Netlist6,前仿真波形验证参考文献1 1,原理 想要切换时钟电路,最简单的方法肯定是使用一个MUX,control作为控制信号; control = 1, clk_output = clk_…

JVM 双亲委派模型

一言以蔽之,向上委托,向下委派。 向上委托:如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行,如果父类加载器还存在其父类加载器,则进一步向上…

家居建材如何在线管理订单?数商云采购系统实现订单发收货、退换货流程化管控

新时代的流程化业务,利用信息互通的时效性,提高员工执行力,提升市场竞争力,在悄无声息地促进企业发展。订单管理作为企业客户关系管理的有效延伸,能更好的把个性化、差异化服务有机的融入到客户管理中去,能…

220kV降压变电所电气部分初步设计33号

目录 1 绪论 5 1.1 概述 5 1.2 本次设计内容 5 1.3 本次设计任务 5 2 变电站总体分析 6 2.1变电所总体分析 6 2.2主变压器选择 7 3 电气主接线选择 10 3.1 电气主接线的概念 10 3.2 电气主接…

Linux —— 进程控制

1.进程控制的四个概念 进程控制分为四类,分别是: 进程创建进程终止进程等待进程替换 2.进程创建 2.1初识fork fork的作用是通过拷贝当前进程创建一个子进程,这两个进程的区别在于PID不同(还有一些资源、统计量也不同,但PID是我…

E. Split Into Two Sets(染色法判断二分图)

Problem - 1702E - Codeforces 波利卡普最近得到了一组n(数字n-偶数)的骨牌。每块多米诺骨牌包含1到n的两个整数。 他能把所有的骨牌分成两组,使每组骨牌上的数字都不一样吗?每张多米诺骨牌必须正好进入两组中的一组。 例如&…

7种主流数据分析软件比较及经典教材推荐

前言 STATA 软件优点:Stata以其简单易懂和功能强大受到初学者和高级用户的普遍欢迎。使用时可以每次只输入一个命令,也可以通过一个Stata程序一次输入多个命令。这样的话即使发生错误,也较容易找出并加以修改。尽管Stata的数据管理能力没有…

智慧点餐系统源码 扫码点餐小程序源码

🍓🍓文末获取联系🍓🍓 JAVAUniappMySQLWinForm 系统功能介绍 1、单/多门店自由切换; 2、扫码(桌号)点餐; 3、多规格商品; 4、手动/自动接单; 5、自助&am…

MyBatis-Plus标准数据层开发

1. 标准CRUD使用 对于标准的CRUD功能都有哪些以及MP都提供了哪些方法可以使用呢? 我们先来看张表: 功能自定义接口MP接口新增boolean save(T t)int insert(T t)删除boolean delete(int id)int deleteById(Serializeble id)修改boolean update(T t)int…

系统分析与设计 复习

文章目录系统分析与设计 复习第 1 章 系统分析与设计概述系统特性DevOps第 2 章 系统规划**系统规划步骤**规划模型诺兰模型**CMM 模型**系统规划方法战略集合转换法 SST关键成功因素法 CSF企业资源规划法 BSPCSB 三者联系和区别第 3 章系统分析系统分析概述业务流程图系统流程…

【微电网优化】萤火虫算法求解微电网优化问题【含Matlab源码 2146期】

⛄一、萤火虫算法求解微电网经济优化问题简介 利用迭代搜索法、剔除劣势策略法、逆推归纳法和最大最小优化方法[7,8,9]等均可实现博弈均衡点的求解。但当维数较大时, 这些方法可能存在搜索速度、路径和精度上的问题。萤火虫优化算法[10]由于其原理简单、参数少、易于实现、具有…

Maven中依赖无法导入的终极解决方案

maven依赖无法引入的问题解决 修改maven配置 添加阿里云的设置 阿里云云效maven官方配置指南 创建自己的maven库 jdk的导入设置 阿里云仓库官网 仓库服务 (aliyun.com) jar包下载所在位置 在命令终端进行jar包的引入 mvn install:install-file -Dfilejar包所在路径…

【SQLite】二、SQLite 和 HeidiSQL 的安装

作者主页:Designer 小郑 作者简介:浙江某公司软件工程师,负责开发管理公司OA、CRM业务系统,全栈领域优质创作者,CSDN学院、蓝桥云课认证讲师,开发过20余个前后端分离实战项目,主要发展方向为Vue…

生物素标记试剂:(1458576-00-5,1802908-00-4)Biotin-PEG4-alkyne,Dde-生物素-四聚乙二醇-炔

一、Biotin-PEG4-alkyne 【中文名称】生物素-四聚乙二醇-炔,生物素-四聚乙二醇-丙炔基 【英文名称】 Biotin-PEG4-alkyne 【CAS】1458576-00-5 【分子式】C21H35N3O6S 【分子量】457.58 【纯度】95% 【外观】 淡黄色或白色固体 (具体由其分子量大小决定…

web前端网页制作课作业:用DIV+CSS技术设计的静态网站【四大名著】中国传统文化主题题材设计

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

深入ftrace uprobe原理和功能介绍

上一章我们学习了,kprobe 可以实现动态内核的注入,基于中断的方法在任意指令中插入追踪代码,并且通过 pre_handler/post_handler去接收回调。另一个 kprobe 的同族是 kretprobe,只不过是针对函数级别的内核监控,根据用…

Arduino开发实例-RCWL0516微波雷达传感器驱动

RCWL0516微波雷达传感器驱动 接近感应是入侵警报、电灯开关以及其他家庭和工业自动化应用的常见应用。 电子工业中使用了多种接近检测方法。 最常见的方法是使用 PIR 传感器,它可以感应由温暖的身体引起的环境红外辐射的变化。 其他常见的方法包括使用反射的超声波或光束,其…