数学建模 —— 聚类分析(3)

news2024/11/15 20:09:33

目录

一、聚类分析概述

1.1 常用聚类要素的数据处理

1.1.1 总和标准化

1.1.2 标准差标准化

1.1.3  极大值标准化

1.1.4 极差的标准化

1.2 分类

1.2.1 快速聚类法(K-均值聚类)

1.2.2 系统聚类法(分层聚类法)

二、分类统计量距离

2.1 明式(Minkowski)距离

 2.2 马氏(Mahalanobis)距离

2.3 兰氏(Canberra)距离

三、常用的聚类方法

 3.1 最短距离法

 3.2 最长距离法

 3.3 中间距离法

 3.4 重心法

 3.5 类平均法

 3.6 离差平方和法

四、Matlab进行聚类

五、SPSS步骤


一、聚类分析概述

        聚类分析根据一批样品的许多观测指标,按照一定的数学公式具体地计算一些样品或一些参数(指标)的相似程度,把相似的样品或指标归为一类,把不相似的归为一类。

        在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。而为了使不同量纲,不同取值范围的数据能够放在一起进行比较,在进行聚类分析之前,首先要对聚类要素进行数据处理。

1.1 常用聚类要素的数据处理

1.1.1 总和标准化

        分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即

        这种标准化方法所得到的新数据满足

1.1.2 标准差标准化

 由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有

1.1.3  极大值标准化

 经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1

1.1.4 极差的标准化

 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在01之间。 

1.2 分类

1.2.1 快速聚类法(K-均值聚类)

        基本思想开始时按照一定方法选取一批凝聚点,然后让样本向最近的凝聚点聚类,形成初始分类,之后再按照最近距离原则修改不合理的分类,直到合理为止。

        快速聚类过程是寻找初始分类的有效方法,采用的算法是最小化与类均值间距离平方和的标准迭代算法,其结果是高效率地生成大数据文件的不相交的分类

1.2.2 系统聚类法(分层聚类法)

        系统聚类分析就是通过对变量的测量,将比较接近的样本找出来归为一类,进一步再将比较接近的类合并成为新的类,逐层合并直到最后合并成为一类。
        系统聚类产生的结果不在聚类的开始,也不在聚类的最终,而是在其过程中。研究者将根据聚类过程适当截取聚类结论。

系统聚类的一般程序

首先,不论是定量数据还是定性数据,都应确定分类统计量,用以测定样本之间的亲疏程度,主要通过样本之间的距离、样本间的相关系数来确定;   

分类统计量:样本间的距离或相关系数

其次,利用统计量将样品进行分类。

二、分类统计量距离

2.1 明式(Minkowski)距离

 2.2 马氏(Mahalanobis)距离

2.3 兰氏(Canberra)距离

 2.相关系数

三、常用的聚类方法

八种聚类计算距离的递推公式最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法

3.1 最短距离法

步骤:

 3.2 最长距离法

 3.3 中间距离法

 3.4 重心法

 3.5 类平均法

 3.6 离差平方和法

四、Matlab进行聚类

 

五、SPSS步骤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1793203.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue3 递归循环展示下级盒子

index.vue主文件 <template><div><RecursiveCard :data"rootTask" /></div> </template><script> import { reactive } from vue; import RecursiveCard from ./test.vue; // 递归组件的路径export default {components: {Recu…

使用HTML、CSS和JavaScript编写一个注册界面(一)

倘若文章或代码中有任何错误或疑惑&#xff0c;欢迎提出交流哦~ HTML和CSS 首先&#xff0c;我们需要编写一个简洁的注册界面。 简单编写下&#xff0c;如下&#xff1a; 呈现效果为&#xff1a; <!DOCTYPE html> <html lang"en"><head><me…

DockerCompose中部署Jenkins(Docker Desktop在windows上数据卷映射)

场景 DockerJenkinsGiteeMaven项目配置jdk、maven、gitee等拉取代码并自动构建以及遇到的那些坑&#xff1a; DockerJenkinsGiteeMaven项目配置jdk、maven、gitee等拉取代码并自动构建以及遇到的那些坑_jenkins的安装以及集成jdkgitmaven 提示警告-CSDN博客 Windows10(家庭版…

v31支架固定方式

CK_Label_v31 夹子固定方式 底座粘贴固定方式

Nvidia/算能 +FPGA+AI大算力边缘计算盒子:中国舰船研究院

中国舰船研究院又称中国船舶重工集团公司第七研究院&#xff0c;隶属于中国船舶重工集团公司&#xff0c;是专门从事舰船研究、设计、开发的科学技术研究机构&#xff0c;是中国船舶重工集团公司的军品技术研究中心、科技开发中心&#xff1b;主要从事舰船武器装备发展战略研究…

三丰云免费服务器

三丰云网址&#xff1a; https://www.sanfengyun.com 可申请免费云服务器&#xff0c;1核/1G内存/5M宽带/有公网IP/10G SSD硬盘/免备案。 收费云服务器&#xff0c;买2年送1年&#xff0c;有很多优惠

10分钟搞定!用DearPyGui打造你的Python界面

大家好&#xff0c;在Python的众多第三方库中&#xff0c;DearPyGui是一个非常独特且强大的库。它不仅能帮助开发者快速构建图形用户界面&#xff08;GUI&#xff09;&#xff0c;还简化了很多复杂的操作。 什么是DearPyGui&#xff1f; DearPyGui是一款基于ImGui的Python图形…

前端canvas绘图,利用canvas在图片上面绘制标记以及给canvas添加点击事件。

前端canvas绘图&#xff0c;利用canvas在图片上面绘制标记以及给canvas添加点击事件。 需要实现的效果如下图: 首先需要一个承载的核心画布 <canvas id"canvas" width"800" height"600"></canvas>全部代码&#xff1a; <!DOCT…

JVMの内存泄漏内存溢出案例分析

1、内存溢出 内存溢出指的是程序在申请内存时&#xff0c;没有足够的内存可供分配&#xff0c;导致无法满足程序的内存需求&#xff0c;常见的内存溢出情况包括堆内存溢出&#xff08;Heap Overflow&#xff09;和栈溢出&#xff08;Stack Overflow&#xff09;&#xff1a; …

短视频外卖平台区域代理怎么拿?两种方法!

抖音外卖平台区域代理怎么拿&#xff1f;市面上只有两种途径可走。没有其他任何方法。 一是拿抖音官方区域服务商身份&#xff0c;第一个要求是保证金50万&#xff0c;公司必须还要有20个人以上的社保证明。同时还要提供企业半年的银行资金流水。如果小型公司基本是不用考虑的…

R语言数据探索和分析21-中国GDP及其影响因素多元线性回归分析

一、研究背景和意义 GDP 是宏观经济中最受关注的经济统计数字&#xff0c;目前我国国内生产总值年均增长率均明显高于同期美、日等发达经济体和巴 西、俄罗斯、南非、印度等其他金砖国家&#xff0c;成为世界经济增长的主力军&#xff0c;GDP 的增长对一个国家有着十分重要的意…

30天变现5位数,涨粉2w,用AI做治愈系插图,5分钟一套,太香了(附工具教程)

前段时间和一位朋友聊天&#xff0c;他说现在靠 AI 赚到钱的&#xff0c;全是那些卖课的&#xff01;还说得很气愤。 我竟然一时不知道说什么好。 虽然我并不认同他的说法&#xff0c;但也没有再说什么了。 因为人们往往会根据自己已有的认知体系&#xff0c;去判断一件事。…

【Python字符串攻略】:玩转文字,编织程序的叙事艺术

文章目录 &#x1f680;一.字符串基础&#x1f308;二.查看数据类型⭐三.转化❤️四.字符串索引&#x1f6b2;五.字符串切片&#x1f3ac;六.字符串切片-步长☔七.反向切片注意事项&#x1f6b2;八.字符串&#x1f4a5;查&#x1f4a5;改&#x1f4a5;删 ❤️九.字符串拼接&…

引擎:UI

一、控件介绍 Button 按钮 创建一个按钮 按钮禁用 精灵模式 颜色模式 缩放模式 绑定点击事件 EditBox 输入框 Layout 布局 支持水平排列、垂直排列、背包排列 PageView 页面视图 ProgressBar 进度条 RichText 富文本 绑定点击事件 事件可以被其它标签包裹 图文混排 Scroll…

2年JAVA今日头条3轮面试经历

面头条的时候已经是十月底了。大半个月没有面试&#xff0c;之前准备的知识点比如http状态码之类的记忆性的东西&#xff0c;早就忘光了。 二面的时候问了一堆状态码&#xff0c;全都不记得了。面试官态度很好&#xff0c;跟我说&#xff0c;你现在不记得了&#xff0c;说明你…

[数据集][目标检测]医疗防护服检测数据集VOC+YOLO格式649张7类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;649 标注数量(xml文件个数)&#xff1a;649 标注数量(txt文件个数)&#xff1a;649 标注类别…

骨传导耳机有哪些是值得入手的?看完这篇推荐就懂了!

骨传导耳机在运动圈非常的受欢迎&#xff0c;因为佩戴运动的时候&#xff0c;骨传导耳机能够稳固佩戴&#xff0c;无论是跳跃或者是摇晃身体等&#xff0c;耳机都不会轻易掉落&#xff01;而很多朋友对于骨传导耳机总是想尝试却又害怕掉坑&#xff01;于是为了给大家提供更多的…

Gradio.NET:一个快速制作演示demo网页的利器

Gradio介绍 Gradio是一个用于创建机器学习模型交互界面的Python库。它允许开发者快速为他们的模型创建一个简单的web界面&#xff0c;以便于非技术用户和其他开发者进行交互和测试。 Gradio的主要优点是易用性和灵活性。你只需要几行代码就可以为你的模型创建一个交互界面。你…

前端实现输入内容计算密码强度

提示:记录工作中遇到的需求及解决办法 文章目录 前言一、思路二、计算密码强度分数密码强度动画展示效果完善动画效果完整代码前言 平时我们在浏览各种网站和 APP 的时候,都接触过密码这个东西~ 密码设置的好不好,关乎到你的账号安全性,越复杂的密码越安全,所以密码强度…

【Python数据挖掘实战案例】机器学习LightGBM算法原理、特点、应用---基于鸢尾花iris数据集分类实战

一、引言 1、简要介绍数据挖掘的重要性和应用 在数字化时代&#xff0c;数据已经成为企业和社会决策的重要依据。数据挖掘作为一门交叉学科&#xff0c;结合了统计学、机器学习、数据库技术和可视化等多个领域的知识&#xff0c;旨在从海量数据中提取有价值的信息&#xff0c…