阅读笔记-A Cluster Separation Measure

news2025/1/23 12:09:29

A Cluster Separation Measure(一种聚类分离测度

1.这篇论文要解决什么问题?要验证一个什么科学假设?

问题是确定数据中聚类的适当数量,解决这种问题的两种方法都取决于确定指数中相对较大的变化,而不是指数的最小化或最大化,因此,一般来说,需要人为解释和主观分析什么是参数中的“较大变化”。

两种方法:一种常用的技术依赖于针对多个簇绘制优化参数,并选择参数值发生较大变化的簇数作为最佳值。

第二种方法是分层的等级技术通常寻求组间融合的大变化。

2.这篇论文有哪些相关研究,这些研究是怎么分类的?有哪些研究员值得关注?

3、论文中提到的解决方案是什么,关键点在哪儿?提出了一种度量,它表示假设具有数据密度的聚类的相似性,该数据密度是距离聚类的向量特征的递减函数。该度量可用于推断数据分区的适当性,因此可用于比较数据的各种划分的相对适当性。该措施既不依赖于分析的聚类数,也不依赖于数据分区的方法,并且可以用于指导聚类搜索算法。提出了一个新的聚类参数该参数的最小化似乎表明数据集的自然分区

这个定义中,aki是向量ai的第k个分量,而ai是第i个聚类的质心。简单来说,质心是一个聚类中所有数据点的平均值向量。

举个例子来说明:假设我们有一个二维数据集,包含以下数据点:

(1, 2), (3, 4), (5, 6), (7, 8), (9, 10)

现在我们将这些数据点分为两个聚类,第一个聚类包含前三个数据点,第二个聚类包含后两个数据点。

对于第一个聚类的质心,我们计算每个维度的平均值,即(1+3+5)/3 = 3和(2+4+6)/3 = 4。所以第一个聚类的质心是(3, 4)。

对于第二个聚类的质心,我们计算每个维度的平均值,即(7+9)/2 = 8和(8+10)/2 = 9。所以第二个聚类的质心是(8, 9)。

在这个例子中,aki表示第i个聚类的质心向量ai的第k个分量。

R的意义在于,它是每个聚类与其最相似聚类的相似性度量的系统范围平均值。因此,聚类的“最佳”选择将是使这种平均相似性最小化的聚类。

当p = 2时,Mij是质心之间的欧几里得距离如果q = 1,则Si成为聚类i中的向量到聚类i的质心的平均欧几里得距离。如果q = 2,则Si是聚类中的样本到相应聚类中心的距离的标准偏差。如果p = q = 2,则Rij是为聚类i和j计算的经典Fisher相似性度量的倒数。

4、论文中的实验是如何设计的?各个实验分别得到了什么结论?

图2(a)示出了改编自Ball和Hall的集群系统测试集的225个点的数据集。图2(b)的相关曲线图示出了对于q = 0.5、1.0、2.0和p = 2.0的最小20个K值的k的性能。如图2(b)所示,当K = 8时,R最小,当K = 9时,R值大约大10%。

图3(a)和3(b)显示了130个点的数据集及其相关的R图。对应于R的四个局部最小值的分区在图3(c)中指示。在K = 3、6、10和13处,R的局部最小值近似相等,这是由于13个小簇中的每一个的密度大致相等,而它们在大簇中的间隔近似相等。聚类分离度量表明相邻的小聚类与大聚类具有大致相同的相似性。

图4中110个数据点和相关的k图显示在图4(a)和图4(B),其中三个组分区被选择为最佳,由虚线指示。随后对分配给第三组的那些点进行分析。图4(c)中示出了相关的R曲线图,而图4(a)中的细虚线示出了指示为最佳的分离。值得注意的是,图4(c)中的最小R高于图4(b)中的最小R。如果不是这种情况,图4(a)中的聚类3将在全局数据集的最佳划分中被细分

图5中R是针对Fisher在一系列统计检验中使用的四维鸢尾数据计算的。四个测量的每一个50名成员的三个品种的花鸢尾Setosa,鸢尾Versicolor,和鸢尾Virginica。已知Iris Setosa可线性分离,其他两个鸢尾Virginica和鸢尾Versicolor有相当大的重叠。如图5所示,选择K = 2作为数据的最佳划分,而在K = 9和K = 17处发现R的局部最小值。

5、这篇论文到底有什么贡献?(三句话内说明)新在什么地方?

聚类分析通常是数据分析的第一步要求用户向分析系统提供参数值,例如最小可接受的聚类距离或最小可接受的标准偏差, “所有聚类算法的一个共同缺点是它们的性能高度依赖于用户设置的各种参数。事实上,“适当”的设置通常只能通过试验和错误的方法来确定。如果将其纳入聚类搜索算法中,这里提出的度量基本上克服了这一困难,因为它只需要用户指定p和q指数,这相当于只需要用户指定要使用的距离和分散度量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1330214.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

免费PHP完美运营的最新短视频打赏系统学习版

免费PHP完美运营的最新短视频打赏系统学习版 一、介绍 免费PHP完美运营的最新短视频打赏系统学习版,是一款基于PHP开发的打赏系统,具有强大的功能和稳定的性能。相比于市面上的其他打赏系统,它更加完善,几乎无bug,能…

Socket.D 基于消息的响应式应用层网络协议

首先根据 Socket.D 官网 的副标题,Socket.D 的自我定义是: 基于事件和语义消息流的网络应用协议。官网定义的特点是: 基于事件,每个消息都可事件路由所谓语义,通过元信息进行语义描述流关联性,有相关的消…

《数字图像处理-OpenCV/Python》连载:图像的阈值处理

《数字图像处理-OpenCV/Python》连载:图像的阈值处理 本书京东 优惠购书链接 https://item.jd.com/14098452.html 本书CSDN 独家连载专栏 https://blog.csdn.net/youcans/category_12418787.html 第 9 章 图像的阈值处理 图像的阈值处理简单、直观,计算…

ES-mapping

类似数据库中的表结构定义,主要作用如下 定义Index下的字段名( Field Name) 定义字段的类型,比如数值型、字符串型、布尔型等定义倒排索引相关的配置,比如是否索引、记录 position 等 index_options 用于控制倒排索记录的内容,有如…

【PWN学习】cannary绕过方式汇总

背景 利用cannary解题在现在的CTF比赛中似乎已经过时了,只是为了学习了解一下。 绕过的4种方式 目前我了解到的方式主要有以下4种 forksspstack_chk_failTLS canary attack fork 每次进程重启后的Canary是不同的,但是同一个进程中的Canary都是一样…

探秘JDK 10:崭新特性悉数解析

欢迎来到我的博客,代码的世界里,每一行都是一个故事 探秘JDK 10:崭新特性悉数解析 前言局部变量类型推断(var关键字)线程本地握手背景和用途:如何使用:优势: 改进的option集合工厂方法List.of() 方法&#…

化繁为简,Python快速入门,从基础到实践的学习。

文章目录 前言一、安装与运行命令行运行 python 文件 二、变量和简单数据类型2.1 变量命名规则2.2 字符串2.2.1 字符串的简单运算title()upper()、lower() 2.2.2 合并(拼接)字符串2.2.3 使用制表符或换行符来添加空白2.2.4 删除空白2.2.5 Python 2 中的 …

Arduino开发实例-APDS-9930环境光和趋近传感器驱动

APDS-9930环境光和趋近传感器驱动 文章目录 APDS-9930环境光和趋近传感器驱动1、APDS-9930介绍2、硬件准备及接线3、驱动实现1、APDS-9930介绍 APDS-9930模块由环境光、红外线和接近传感器组成。 检测距离可达 100 毫米。 APDS-9930 传感器测量环境光。 该传感器还可以在黑暗中…

trino-435版本windows下源码编译

一、源码下载地址 https://github.com/trinodb/trino/tags 二、编译环境及工具准备 1、maven &#xff08;1&#xff09;版本&#xff1a;3.6.3 &#xff08;2&#xff09;settings.xml配置 <?xml version"1.0" encoding"UTF-8"?> <settin…

融资项目——vue之事件监听

vue通过v-on进行事件监听&#xff0c;在标签中使用v-on:xxx&#xff08;事件名称&#xff09;进行监听&#xff0c;事件触发的相应方法定义在Vue对象中的methods中。如下图所示&#xff1a; 上述代码对按钮进行监听&#xff0c;点击按钮后就会触发solve函数。

2016年第五届数学建模国际赛小美赛C题对超级细菌的战争解题全过程文档及程序

2016年第五届数学建模国际赛小美赛 C题 对超级细菌的战争 原题再现&#xff1a; 最近有很多关于我们抗生素耐药性危机的讨论。进化出的能够抵抗抗生素的细菌每年杀死70万人&#xff0c;越来越强大的细菌正在世界各地传播。研究人员担心&#xff0c;我们将进入一个后抗生素时代…

分子动力学模拟

天玑算科研服务_模拟计算_超算租用_实验测试天玑算科研服务致力于营造良好科研生态环境&#xff0c;加速科研成果转换&#xff0c;500余位TOP高校博士计算工程师团队&#xff0c;涉及第一性原理、分子动力学模拟、有限元等领域&#xff0c;为电池、能源、化工、生物医药等领域提…

尚硅谷图解Java设计模式

尚硅谷图解Java设计模式 第 1 章 内容介绍和授课方式Java 设计模式内容介绍先看几个经典的面试题设计模式的重要性 课程亮点和授课方式 第 2 章 设计模式七大原则设计模式的目的设计模式七大原则单一职责原则基本介绍应用实例单一职责原则注意事项和细节 接口隔离原则(Interfac…

HarmonyOS构建第一个ArkTS应用(FA模型)

构建第一个ArkTS应用&#xff08;FA模型&#xff09; 创建ArkTS工程 若首次打开DevEco Studio&#xff0c;请点击Create Project创建工程。如果已经打开了一个工程&#xff0c;请在菜单栏选择File > New > Create Project来创建一个新工程。 选择Application应用开发&a…

18 Vue3中使用v-model绑定文本域

概述 使用v-model绑定文本域则属于不太常见的情况了&#xff0c;因为文本域一般会被富文本替代&#xff0c;而富文本的话一般又会引入一些第三方的富文本库&#xff0c;所以在真实的开发中&#xff0c;使用v-model绑定文本域的场景实际上并不多见。 这里&#xff0c;我们了解…

如何在Windows上搭建WebDAV服务并通过内网穿透实现公网访问

文章目录 前言1. 安装IIS必要WebDav组件2. 客户端测试3. 使用cpolar内网穿透&#xff0c;将WebDav服务暴露在公网3.1 安装cpolar内网穿透3.2 配置WebDav公网访问地址 4. 映射本地盘符访问 前言 在Windows上如何搭建WebDav&#xff0c;并且结合cpolar的内网穿透工具实现在公网访…

安全、效率、成本:混合云数据库管理的三重挑战!

随着业务需求的不断演变&#xff0c;数据在多云平台之间流动&#xff0c;给数据库管控带来了新的层次和复杂性。这给数据库管控带来了前所未有的挑战。企业可能面临着一系列问题&#xff0c;包括安全性挑战、管理复杂性、性能与效率问题、成本控制难题、缺乏统一的管理视图以及…

C++ 链表

目录 链表结构 一&#xff0c;单链表 1.实现基本的增删查改 2.对链表进行一些操作 &#xff08;1&#xff09;删除等于给定值的所有节点。 &#xff08;2&#xff09;翻转链表 &#xff08;3&#xff09; 返回中间节点的地址 &#xff08;4&#xff09;倒数第k个节点 &…

运维管理平台哪个好?如何挑选合适的运维管理平台?

运用运维管理平台来处理一些内部后勤事务或者对外的售后服务&#xff0c;是现在很多企业采用的管理方法&#xff0c;优势是成本较低&#xff0c;效率更高。那么&#xff0c;运维管理平台哪个比较好呢&#xff1f; 选择运维管理平台要先找准自己的需求&#xff0c;然后才能选出合…

Android JNI入门到基础

一、JNI项目创建 AS创建项目时选择NativeC 会创建一个基本的JNI项目 MainActivity中写java层的native方法 具体实现在cpp文件中 native-lib.cpp #include <jni.h> #include <string>extern "C" JNIEXPORT jstring JNICALL Java_com_cn_techvision_j…