深度学习聚类再升级!新算法实现强悍性能,准确率超98%

news2025/1/22 9:22:39

深度聚类不仅继承了传统聚类算法的优点,在对高维和非线性数据的处理能力,以及自适应性和抗噪性方面也具有很大优势。

具体来说,结合深度学习的聚类算法通过利用深度神经网络的强大特征提取能力,自动学习和识别数据中的复杂结构和模式,能够在无需人工干预的情况下实现更高的聚类性能和准确度

比如集成时空深度聚类(ISTDC)模型,它使用四种算法和变分贝叶斯高斯混合模型(VBGMM)聚类方法进行说明,在0-back与2-back任务上该模型实现了最高平均聚类准确率98.0%,比现有方法提高了11.0%。

除ISTDC外,还有一些很值得学习的深度学习聚类算法最新成果,我从中挑选了11篇,简单提炼了可参考的创新点,希望可以给同学们提供论文灵感。

论文原文以及开源代码需要的同学看文末

Integrated Spatio-Temporal Deep Clustering (ISTDC) for cognitive workload assessment

方法:论文提出一种基于ISTDC框架的深度聚类模型,并比较其与现有研究的差异。研究缺口在于目前的模型对于相同实验数据集的分类准确性较低,而这篇论文的主要贡献是提出了一种有效的深度特征表示方法,以及使用VBGMM聚类方法对工作负荷水平进行分类。方法包括实验设计和数据采集,以及对聚类结果和性能进行分析。

创新点:

  • 提出的多模态深度VAE模型与VBGMM聚类方法相结合,用于工作负荷分类。

  • 提出的IST-VAE模型的性能在很大程度上取决于VAE模型的结构和超参数。

  • 提出的多模态深度聚类模型在具有不同任务复杂度的三种不同工作负荷条件下进行评估。

  • 提出的IST-VAE模型的整体复杂度为(LSTM网络的时间复杂度 + CNN模型的计算复杂度 + VBGMM聚类算法的复杂度)。

Gene-SGAN: discovering disease subtypes with imaging and genetic signatures via multi-view weakly-supervised deep clustering

方法:Gene-SGAN是一种基于生成对抗网络和变分推断的基因引导弱监督聚类方法,旨在从表型和基因特征中识别与疾病相关的亚型,具有独特的影像和基因特征。该方法通过从参考总体(例如健康对照的脑测量)到目标总体(例如患者队列)的表型测量的一对多映射,学习捕捉与疾病相关的多样性脑变化模式,以减少与疾病无关的变化的混淆因素,如人口统计因素或与疾病无关的基因影响。

创新点:

  • Gene-SGAN是一种基于生成对抗网络和变分推断的多视图弱监督深度聚类方法,用于从基因和成像特征中识别与疾病相关的亚型。

  • Gene-SGAN通过学习生成模型从参考人群(例如健康对照组)到目标人群(例如患者群体)的表型测量之间的一对多映射,从而捕捉与疾病相关的大脑变化模式的多样性。

  • Gene-SGAN通过低维潜变量空间将表型和基因的异质性分解为反映疾病亚型的潜变量。

Hard Sample Aware Network for Contrastive Deep Graph Clustering

方法:本论文提出了一种新的对比深度图聚类方法,称为Hard Sample Aware Network (HSAN)。该方法通过设计综合相似度度量准则和动态样本加权策略,引导网络关注难以区分的正样本和负样本。

创新点:

  • 提出了Hard Sample Aware Network (HSAN)方法,通过引入综合相似性度量准则和动态样本加权策略,引导网络关注难样本。

  • 设计了全面的相似性度量准则,同时考虑属性和结构信息,更好地揭示样本间的关系。

  • 提出了样本加权策略,动态加权难样本对,降低易样本对的权重,从而提高网络的区分能力。

Hard Regularization to Prevent Deep Online Clustering Collapse without Data Augmentation

方法:本文提出了一种无数据增强的在线深度聚类方法,旨在防止聚类崩溃。作者通过概率化的方式来决定将一批数据点分配给哪个聚类簇,给定聚类中心和数据点的特征,从而推导出一种直观的优化目标,用于进行硬聚类分配。

创新点:

  • 提出了一种无数据增强的在线深度聚类方法,通过正则化硬分配来防止坍塌问题。

  • 在贝叶斯框架中表达了聚类问题,推导出一个直观的优化目标,并证明了与最大化聚类分配和数据索引之间的互信息的目标的等效性。

  • 该方法在四个常用图像聚类数据集上优于现有方法,并且能够提供更准确的聚类结果。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“新聚类”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1719188.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【小白专用24.5.30已验证】Composer安装php框架thinkPHP6的安装教程

一、框架介绍 1、框架简介和版本选择 Thinkphp是一种基于php的开源web应用程序开发框架ThinkPHP框架,是免费开源的、轻量级的、简单快速且敏捷的php框架。你可以免费使用TP框架,甚至可以将你的项目商用; ThinkPHP8.0 是目前框架正式版的最新版…

Spring 框架:Java 企业级开发的基石

文章目录 序言Spring 框架的核心概念Spring 框架的主要模块Spring Boot:简化 Spring 开发Spring Cloud:构建微服务架构实际案例分析结论 序言 Spring 框架自 2002 年发布以来,已经成为 Java 企业级开发的标准之一。它通过提供全面的基础设施…

家政预约小程序10公众号集成

目录 1 使用测试号3 工作流配置4 配置关注事件脚本5 注册开放平台6 获取公众号access_token6 实现关注业务逻辑总结 我们本次实战项目构建的相当于一个预约平台,既有家政企业,也有家政服务人员还有用户。不同的人员需要收到不同的消息,比如用…

11- Redis 中的 SDS 数据结构

字符串在 Redis 中是很常用的,键值对中的键是字符串类型,值有时也是字符串类型。 Redis 是用 C 语言实现的,但是它没有直接使用 C 语言的 char* 字符数组来实现字符串,而是自己封装了一个名为简单动态字符串(simple d…

基于强化学习的控制率参数自主寻优

1.介绍 针对控制建模与设计场景中控制参数难以确定的普遍问题,提出了一种基于强化学习的控制律参数自主优化解决方案。该方案以客户设计的控制律模型为基础,根据自定义的控制性能指标,自主搜索并确定最优的、可状态依赖的控制参数组合。 可…

ToDesk提示会话数通道限制 - 解决方案及兑惠码分享

如果您最近在体验ToDesk这款远程操控工具时,遇到了提示信息告知“高速通道服务已到期”或“会话数受限”,这表明您本月享受的免费额度——即120小时的使用时间和最多300次的连接机会——已经耗尽。为了解锁无限制的使用时长与连接次数,建议您…

自动驾驶中的长尾问题

自动驾驶中的长尾问题 定义 长尾问题(Long-Tail Problem)是指在数据分布中,大部分的数据集中在少数类别上,而剩下的大多数类别却只有少量的数据。这种数据分布不平衡的现象在许多实际应用中广泛存在,特别是在自动驾驶…

20240531在飞凌的OK3588-C开发板上跑原厂的Buildroot测试USB摄像头

20240531在飞凌的OK3588-C开发板上跑原厂的Buildroot测试USB摄像头 2024/5/31 20:04 USB摄像头分辨率:1080p(1920x1080) 默认编译Buildroot的SDK即可点亮USB摄像头。v4l2-ctl --list-devices v4l2-ctl --list-formats-ext -d /dev/video74 …

双指针法 ( 快乐数 )

「快乐数」 定义为: 对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为 1,也可能是 无限循环 但始终变不到 1。如果这个过程 结果为 1,那么这个数就是快乐数 编写一个算法来判断一个…

linux /www/server/cron内log文件占用空间过大,/www/server/cron是什么内容,/www/server/cron是否可以删除

linux服务器长期使用宝塔自带计划任务,计划任务执行记录占用服务器空间过大,导致服务器根目录爆满,需要长期排查并删除 /www/server/cron 占用空间过大问题处理 /www/server/cron是什么内容?/www/server/cron是否可以删除&#xf…

基于VGG16使用图像特征进行迁移学习的时装推荐系统

前言 系列专栏:【深度学习:算法项目实战】✨︎ 涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域,讨论了各种复杂的深度神经网络思想,如卷积神经网络、循环神经网络、生成对…

AutoMQ 自动化持续测试平台技术内幕

01 背景 AutoMQ[1] 作为一款流系统,被广泛应用在客户的核心链路中,对可靠性的要求非常的高。所以我们需要一套模拟真实生产场景、长期运行的测试环境,在注入各种故障场景的前提下验证 SLA 的可行性,为新版本的发布和客户的使用提…

c# - 运算符 << 不能应用于 long 和 long 类型的操作数

Compiler Error CS0019 c# - 运算符 << 不能应用于 long 和 long 类型的操作数 处理方法 特此记录 anlog 2024年5月30日

【论文精读】SAM

摘要 本文提出Segment Anything&#xff08;SA&#xff09;&#xff0c;一个可prompt的视觉分割模型&#xff0c;通过一个 能实现视觉特征强大泛化的任务在包含大量图像的数据集上对模型进行预 训练&#xff0c;旨在通过使用prompt工程解决新数据 分布上的一系列下游分割问题。…

深入了解diffusion model

diffusion model是如何运作的 会输入当时noise的严重程度&#xff0c;根据我们的输入来确定在第几个step&#xff0c;并做出不同的回应。 Denoise模组内部实际做的事情 产生一张图片和产生noise难度是不一样的&#xff0c;若denoise 模块产生一只带噪声的猫说明这个模块已经会…

【Python】 Python中的递增和递减操作符:简单易懂的指南

基本原理 在Python中&#xff0c;递增&#xff08;increment&#xff09;和递减&#xff08;decrement&#xff09;操作符是用于快速增加或减少变量值的快捷方式。这些操作符在很多编程语言中都有出现&#xff0c;它们提供了一种方便的方式来对变量进行自增&#xff08;&#…

【JavaEE进阶】——带你详细了解Spring日志以及配置日志

目录 &#x1f6a9;Spring日志的认识 &#x1f6a9;Spring日志的作用 &#x1f6a9;观察日志 &#x1f6a9;使用日志 &#x1f388;在程序中得到日志对象 &#x1f388;使⽤⽇志对象输出要打印的内容 &#x1f6a9;日志框架的介绍 &#x1f388;门面模式(外观模式&…

鸿蒙ArkTS声明式开发:跨平台支持列表【透明度设置】 通用属性

透明度设置 设置组件的透明度。 说明&#xff1a; 开发前请熟悉鸿蒙开发指导文档&#xff1a; gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。 从API Version 7开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版…

GIS Java 生成四至图

目录 前言 操作步骤&#xff1a; 1&#xff0c;求出多边形的四至点 2&#xff0c;下载地图 3&#xff0c;绘制多边形 前言 对于地图上的一个多边形地块&#xff0c;其四至图就是能够覆盖这个多边形的最小矩形&#xff0c;也就是求出这个多边形的最东点&#xff0c;最西点&…

如何从浅入深理解transformer?

前言 在人工智能的浩瀚海洋中&#xff0c;大模型目前无疑是其中一颗璀璨的明星。从简单的图像识别到复杂的自然语言处理&#xff0c;大模型在各个领域都取得了令人瞩目的成就。而在这其中&#xff0c;Transformer模型更是成为大模型技术的核心。 一、大模型的行业发展现状如…