论文阅读09——《Deep Fusion Clustering Network》

news2024/10/5 19:12:41

论文阅读09——《Deep Fusion Clustering Network》

原文链接:论文阅读09——《Deep Fusion Clustering Network》

作者:Wenxuan Tu, Sihang Zhou, Xinwang Liu, Xifeng Guo, Zhiping Cai, En zhu, Jieren Cheng

发表时间:2021年5月18日

论文地址:https://ojs.aaai.org/index.php/AAAI/article/view/17198
代码地址:https://github.com/wxtu/dfcn

目录

  • 论文阅读09——《Deep Fusion Clustering Network》
    • 创新
      • 存在问题
      • 解决方案
    • 观点
    • 模型
      • IGAE模块
      • SAIF模块
      • 跨模态动态融合机制
      • 三重自监督机制
    • 实验结果
      • 消融结论
    • 结论

创新

存在问题

  1. 现有的研究缺乏动态融合机制来选择性地融合和细化图结构和节点属性信息以进行共识表示学习。以前的方法只是通过对齐或者拼接两部分信息,导致信息交互和合并不足。
  2. 未能从双方提取信息以生成健壮的目标分布(即"groundtruth"软标签)。现有的研究未能从两部分信息中生成目标分布使得网络训练的指导不够全面和准确,结果导致两个信息源之间的协商受阻,导致聚类性能不理想。
  3. 现有的大多数自编码器,无论是经典自编码器还是图自编码器,都只是用自己的潜在表示来重构输入。

解决方案

提出一种深度融合聚类网络(DFCN):

  1. 提出了一个基于相互依赖学习的结构和属性信息融合模块(SAIF),该模块将自编码器和图自编码器学习的表示显式合并,用于共识表示学习,以获得更全面、更准确的表示结构。
  2. 针对网络训练,设计一种可靠的目标分布生成方法和一种便于跨模态信息开发的三重自监督策略。

观点

  1. 将深度聚类分为五类:

    • 基于子空间聚类的方法

    《Latent Distribution Preserving Deep Subspace Clustering》

    《Deep Subspace Clustering Networks》

    《Cascade Subspace Clustering》等

    • 基于生成对抗网络的方法

    《ClusterGAN: Latent Space Clustering in Generative Adversarial Networks》

    《Balanced Self-Paced Learning for Generative Adversarial Clustering Network》等

    • 基于谱聚类的方法

    《Deep Spectral Clustering Using Dual Autoencoder Network》

    《SpectralNet: Spectral Clustering using Deep Neural Networks》等

    • 基于高斯混合模型的方法

    《Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding》

    《Unsupervised Clustering of Quantitative Imaging Phenotypes Using Autoencoder and Gaussian Mixture Model》等

    • 基于自寻优的方法

    《Unsupervised Deep Embedding for Clustering Analysis》

    《Improved Deep Embedded Clustering with Local Structure Preservation》

    《Semi-supervised Deep Embedded Clustering》

    《Adversarial Incomplete Multi-view Clustering》

    《Deep Adversarial Multi-view Clustering Network》等

  2. SDCN中自编码器可以提供互补属性信息,缓解GCN模块的过平滑现象,GCN同时可以向自编码器提供高阶结构信息。在该项工作中,GCN只充当自编码器的正则化器,GCN模块的学习特性没有被充分利用来指导自寻优网络训练,框架的表示学习缺乏两个子网络之间的协商。

  3. 经典的自编码器是对称的,而图卷积网络通常是非对称的,它们只需要潜在表示来重建邻接信息,而忽略了基于结构的属性信息也可以用来提高相应网络的泛化能力。

模型

在这里插入图片描述
作者精心设计了一个结构和属性信息融合(SAIF)模块,用于详细阐述两个源的信息处理。 首先,我们从局部全局两个角度集成了两种样本嵌入,用于共识表示学习。 然后,利用学生t分布估计潜在嵌入空间中样本点与预先计算的聚类中心之间的相似度,得到更精确的目标分布。 最后,我们设计了一个三重自监督机制,利用目标分布同时为AE、GAE和信息融合部分提供更可靠的指导。 此外,我们提出了一种改进的对称结构的图自动编码器(IGAE),并利用图解码器重构的潜在表示和特征表示来重建邻接矩阵

IGAE模块

Z ( l ) = σ ( A ~ Z ( l − 1 ) W ( l ) ) Z^{(l)}=\sigma(\widetilde{A}Z^{(l-1)}W^{(l)}) Z(l)=σ(A Z(l1)W(l))

Z ^ ( h ) = σ ( A ~ Z ^ ( h − 1 ) W ^ ( h ) ) \hat{Z}^{(h)}=\sigma(\widetilde{A}\hat{Z}^{(h-1)}\hat{W}^{(h)}) Z^(h)=σ(A Z^(h1)W^(h))

该部分损失函数:
L I G A E = L w + γ L a L_{IGAE}=L_w+\gamma L_a LIGAE=Lw+γLa

L w = 1 2 N ∥ A ~ X − Z ^ ∥ F 2 L_w=\frac{1}{2N}\|\widetilde{A}X-\hat{Z}\|_F^2 Lw=2N1A XZ^F2

L a = 1 2 N ∥ A ~ − A ^ ∥ F 2 L_a=\frac{1}{2N}\|\widetilde{A}-\hat{A}\|_F^2 La=2N1A A^F2

SAIF模块

在这里插入图片描述

  1. 由于AE和GAE的解码器都是用一致的潜在表示来重建输入,因此潜在嵌入的泛化能力得到了提高。
  2. 综合AE和GAE之间的互补信息,提高了生成目标分布的可靠性。
  3. 三重自监督学习机制将AE、GAE和融合部分的学习集成到一个统一的鲁棒系统中,进一步提高了聚类性能。

跨模态动态融合机制

融合模块中的信息集成包括四个步骤:

  1. 用一个线性组合操作结合AE和IGAE的潜在特征:
    Z I = α Z A E + ( 1 − α ) Z I G A E Z_I=\alpha Z_{AE}+(1-\alpha)Z_{IGAE} ZI=αZAE+(1α)ZIGAE

  2. 用一个类似图卷积操作(消息传递)来处理组合的信息。通过该操作,考虑数据内部的局部结构来增强初始融合嵌入 Z I Z_I ZI
    Z L = A ~ Z I Z_L=\widetilde{A}Z_I ZL=A ZI

  3. 引入自相关学习机制,利用样本间初步信息融合空间中的非局部关系。具体来说,首先通过下面公式计算归一化的自相关矩阵 S S S
    S i j = e ( Z L Z L T ) i j ∑ k = 1 N e ( Z L Z L T ) i k S_{ij}=\frac{e^{(Z_LZ_L^T)_{ij}}}{\sum_{k=1}^Ne^{(Z_LZ_L^T)_{ik}}} Sij=k=1Ne(ZLZLT)ike(ZLZLT)ij
    S S S为系数,通过考虑样本间的全局相关性来重组 Z L Z_L ZL Z G = S Z L Z_G=SZ_L ZG=SZL

  4. 采用跳跃连接鼓励信息在融合机制内顺利通过:
    Z ~ = β Z G + Z L \widetilde{Z}=\beta Z_G + Z_L Z =βZG+ZL

跨模态动态融合机制从局部和全局两个角度考虑样本的相关性,因此,该算法在精融合和精化AE和IGAE信息以学习一致性潜在表征方面具有潜在的优势。

三重自监督机制

学生 t t t分布和辅助 P P P分布与之前阅读的论文里一样,这里不再介绍。

首先采用鲁棒性更强的聚类嵌入 Z ~ \widetilde{Z} Z ,利用学生t分布生成目标分布 Q Q Q和辅助分布 P P P

通过学生t分布分别计算AE和IGAE在两个子网络潜在嵌入上的软聚类分布 Q ′ Q' Q Q ′ ′ Q'' Q

聚类损失:
L K L = ∑ i ∑ j p i j log ⁡ p i j ( q i j + q i i j ′ + q i j ′ ′ ) / 3 L_{KL}=\sum\limits_i\sum\limits_jp_{ij}\log\frac{p_{ij}}{(q_{ij}+q_{iij}'+q_{ij}'')/3} LKL=ijpijlog(qij+qiij+qij)/3pij
总的损失:
L = L A E + L I G A E + λ L K L L=L_{AE}+L_{IGAE}+\lambda L_{KL} L=LAE+LIGAE+λLKL

实验结果

在这里插入图片描述

消融结论

IGAE

本文提出的重构方法能够利用更全面的信息来提高深度聚类网络的泛化能力。 通过这种方法,潜在嵌入从原始图的属性空间继承了更多的属性保留了具有代表性的特征,从而产生更好的聚类决策

SAIF

  1. 局部全局两个角度探索图的结构和节点属性有助于学习一致性潜在表示,从而更好地进行聚类。
  2. 三重自监督策略成功地为AE、IGAE和融合部分的训练生成了更可靠的指导,使它们相互受益

跨模态动态融合机制

  1. 来自AE或IGAE的信息并不总是优于它们的对应信息结合这两个来源的信息可以潜在地提高混合方法的鲁棒性
  2. 两个源信息对DFCN的性能改进同样重要
  3. DFCN可以引入互补的双模态信息,使目标分布更加可靠鲁棒,从而更好地进行聚类。

总损失函数中 λ \lambda λ分析

  1. 超参数λ在提高聚类性能方面是有效的。
  2. 该方法在较宽的λ范围内性能稳定
  3. DFCN通过在所有数据集中设置λ为10来表现良好。

结论

本文提出了一种深度融合聚类网络(DFCN)。 在该方法中,核心组件SAIF模块通过动态跨模态融合机制和三重自监督策略来利用图结构和节点属性。 通过编码双方更多的共识信息和鉴别信息,构造鲁棒的目标分布,有效地提供精确的网络训练指导。 此外,所提出的IGAE能够帮助提高所提方法的泛化能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/25815.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java基础五大机制 —— SPI机制基础(一)

1、什么是SPI机制 SPI(Service Provider Interface),是JDK内置的一种 服务提供发现机制,可以用来启用框架扩展和替换组件,主要是被框架的开发人员使用,比如java.sql.Driver接口,其他不同厂商可…

Fast-DDS库的安装教程

Fast-DDS库的安装教程0 序言1 安装依赖2 安装Fast-DDS2.1 编译foonathan_memory_vendor2.2 编译Fast-CDR2.3 编译Fast-DDS2.4 编译Fast-DDS-Gen2.5 添加环境变量2.6 验证3 参考资料4 写在最后工欲善其事,必先利其器。首先要知道 Fast-DDS是什么?要知道 Fast-DDS是什…

wy的leetcode刷题记录_Day48

wy的leetcode刷题记录_Day48 声明 本文章的所有题目信息都来源于leetcode 如有侵权请联系我删掉! 时间:2022-11-21 前言 补前几天的blog 目录wy的leetcode刷题记录_Day48声明前言808. 分汤题目介绍思路代码收获654. 最大二叉树题目介绍思路代码收获808. 分汤 今…

Boc-QAR-AMC,CAS号:201849-55-0/113866-20-9

胰蛋白酶的高反应性底物,前列腺素和matriptase的荧关底物 编号: 199467中文名称: 标记肽Boc-QAR-7-氨基-4-甲基香豆素.HCl英文名: Boc-Gln-Ala-Arg-AMCCAS号: 201849-55-0/113866-20-9单字母: Boc-QAR-AMC三字母: Boc-Gln-Ala-Arg-AMC氨基酸个数: 3分子式: C29H42O8…

低代码维格云常用组件入门教程

1. 维格云常用组件功能简介 工作区的成员可以根据自己的业务习惯,将工作区内的应用、门户添加到常用组件。添加后成员可以直接从门户的常用组件中操作相应的应用、门户 2. 维格云常用组件配置方式 2.1 添加常用组件 在门户中拖拽或点击添加常用组件2.2 设置组件标题 在右侧编…

中学化学教学参考杂志社中学化学教学参考编辑部2022年第15期目录

刊庆专稿 试论“文化化学”教学思想的实践意义与样态 刘英琦; 1-4 课改在线《中学化学教学参考》投稿:cn7kantougao163.com 凝练观念 重构实践 引领评价——谈《义务教育化学课程标准(2022年版)》的修订 周青; 4-6 领悟化学课程的育人标准——基于《义务…

阿里、字节等神创,必须是全网最全的Netty核心原理手册

时间飞逝,转眼间毕业七年多,从事 Java 开发也六年了。我在想,也是时候将自己的 Java 整理成一套体系。 这一次的知识体系面试题涉及到 Java 知识部分、性能优化、微服务、并发编程、开源框架、分布式等多个方面的知识点。 写这一套 Java 面试…

【SpringBoot笔记28】SpringBoot集成ES数据库之操作doc文档(创建、更新、删除、查询)

这篇文章,主要介绍SpringBoot集成ES数据库之操作doc文档(创建、更新、删除、查询)。 目录 一、SpringBoot操作ES文档数据 1.1、创建文档 1.2、更新文档 1.3、删除文档 1.4、查询文档 1.5、判断文档是否存在 1.6、批量创建文档 一、Spr…

高手系列!数据科学家私藏pandas高阶用法大全 ⛵

💡 作者:韩信子ShowMeAI 📘 数据分析实战系列:https://www.showmeai.tech/tutorials/40 📘 本文地址:https://www.showmeai.tech/article-detail/394 📢 声明:版权所有,转…

CubeMX+VSCode+Ozone的STM32开发工作流(二)VSCode环境配置

neozng1hnu.edu.cn 本教程的示例代码是笔者参加RoboMaster机甲大师赛为机器人编写的控制器框架,你可以直接克隆仓库,阅读仓库下的Markdown文档获得更好的体验,记得点一个小⭐: basic_framework: basic_framework (gitee.com)所有安装包也可以…

OceanBase TableAPI实践案例(Rust)

引子 这是OceanBase TableAPI实践案例(Java)的姊妹篇,上一篇比较全面的比较全面的介绍了TableAPI的相关概念,以及基本的环境搭建,因此这篇不再赘述。本文将主要介绍TableAPI的Rust客户端obkv-table-client-rs &#x…

Visio画图更改连接线的弧形和调整跨线

目录前言准备参考问题解决问题一解决问题二前言 最近在使用Visio画图时,出现了一些问题,于是上网查了一下,将方法记录下来。 准备 Visio2021 参考 Visio中,如何修改连接线的跨线样式? 问题 (1) 使用连接线的时候…

【微信小程序】使用 Cryptojs 解密微信绑定手机号码

很抱歉断更了一段时间,因为最近在做一个项目比较忙,正好项目中小程序板块需要解密手机号码来提交给接口,小程序中虽然提供了获取手机号按钮点击事件:bindgetphonenumber,但是该事件的处理函数中只能获取到加密过的手机…

新力量,新希望|明道云伙伴大会2022秋圆满落幕

2022年10月28日至29日,明道云伙伴大会(2022年秋)在上海顺利举办。来自北京大兴国际机场、广汽本田、京东方、天津钢管、深圳龙华区卫健局、可口可乐、山东移动、浙江移动、上海电气数科、金科信息、艾默生电气等超过五百位参会者同台交流。行…

工业物联网的数据集成

随着网关技术的不断发展,创新、高效的软件解决方案及IT架构在工业物联网系统架构中将发挥着更为重要的作用。其中,工业物联网集成工业数据的一个关键问题在于如何利用软件、IT和创新算法来部署网络解决方案,从而使得生产效率更高。 &#xff…

Java中 this 和 super 的用法与区别

在Java的学习与开发者我们经常遇到this和super关键字,那么它们的用法和区别是什么呢? 一、this关键字 1.this是什么? this 是自身的一个对象,代表对象本身,可以理解为:指向对象本身的一个指针。 2.this…

javaScript之数组中reduce的详细介绍及使用

一、reduce功能接受及定义(自我理解) reduce方法为数组中的一个高阶函数,接受两个参数,第一个参数为回调函数,第二个为初始值。如果不给入初始值则会以数组第一项为初始值!reduce会循环数组每一项&#xf…

数据库-深度剖析mysql索引原理(上)(三)

目录 一、什么是索引 二、索引由来 三、索引本质 四、索引数据结构 1、hsah 2、Btree 五、myISAM 和Innodb这两个数据库的索引是如何实现的呢? 1、首先看 MYSAM 1、以主键Id字段建立索引 2、以name字段来建立索引 2、在看Innodb数据库引擎的数据库 1、以…

Linux安装Jenkins详细步骤

安装jdk yum安装不需要配置环境变量 安装maven 下载maven 压缩包上传至服务器 解压缩 修改maven配置文件镜像地址 配置环境变量 安装Git 安装Jenkins war包下载 安装运行Jenkins 安装jdk 【Linux】Linux8 安装 JDK(适用于各个版本)_写bug的程…

JavaScript 数值 Number

目录1 数值 number1.1 数值储存1.2 数值表示1.2.1 数值分隔符1.3 特殊数值1.3.1 正零和负零1.3.2 NaN1.3.3 Infinity1.4 数值相关的全局方法1.5 Number 对象1.5.1 Number()1.5.2 Number 静态属性1.5.3 Number 静态方法1.5.4 Number 实例方法1.5.5 自定义方法1.6 Math 对象1.6.1…