【机器学习】第10章 聚类算法

news2024/11/25 14:25:24

一、概念

1.聚类

(1)是无监督学习,其实无监督学习就是无中生有,不给你标准答案(标签啊啥的),然后让你自己来。

(2)聚类就是这样,让机器自己根据相似特征把相似的东西放到一块。

(3)聚类就是将集合划分成由类(相)似的对象组成的多个类的过程。

聚类分析是研究(样品或指标)分类问题的一种统计分析方法。

(4)概念:

聚类是把各不相同的个体分割为有更多相似性子集合的工作,聚类生成的子集合称为簇(cluster)。

(5)聚类的要求

生成的簇内部的任意两个对象之间具有较高的相似度,于不同簇的两个对象间具有较高的相异度。

其中度量就用前面学习的欧氏距离,曼哈顿距离等进行测量。

(6)聚类的好坏不存在绝对标准

如扑克牌可以按花色分,也可以按数字分,具体情况具体分析。

(7)聚类与分类的区别:

聚类所要求划分的类是未知的,是无意识的,一般把它理解为无监督学习。

而分类算法是有训练样本的,属于监督学习。

(下面图,先是分类,后是聚类,可以很明显的看出标签的提示)

2.K-Means聚类算法

由聚类思想脱胎而生的nb算法之一。

(1)其中K代表要求划分成K个簇,means是均值的意思,也就是说每个簇的中心点是该簇中所有点的均值。

(2)保证每个簇必须包含一个对象,也要保证每个对象有且仅属于一个簇。

(3)流程:

a.随机选择k个点作为初始的聚类中心,注意这些点它可以是样本得到点,也可以不是。

b.对于剩下的点,根据其与聚类中心的距离,将其归入最近的族。

c.对每个族,计算所有点的均值作为新的聚类中心,注意这个点是产生出来的。

d.重复2、3直到聚类中心不再发生改变

(整个过程类似蠕动,中心点不断蠕动,直到发现好的地方)

(4)局限性:

a.图像过于抽象,平均值不靠谱

b.数据量过大是,收敛缓慢

(5)聚类分析的度量指标

a.外部指标:指用事先指定的聚类模型作为参考来评判聚类结果的好坏

b.内部指标:是指不借助任何外部参考,只用参与聚类的样本评判聚类结果好坏

二、习题

多选题:

3. 聚类的宗旨是(BD

A、类内距离最大化  

B、类间距离最大化  

C、类间距离最小化  

D、类内距离最小化  

判断题:

19. 聚类的目的是对样本集合进行自动分类,以发掘数据中隐藏的信息、结构,从而发现可能的商业价值。 ( T)      

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1834045.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WACV2024 分割相关论文摘要小结速览67篇

WACV2024 分割相关论文摘要小结速览 Paper1 Robust Source-Free Domain Adaptation for Fundus Image Segmentation 摘要小结: 无监督域自适应(UDA)是一种学习技术,它将源域中从标记训练数据学习到的知识转移到只有未标记数据的目标域。这对…

星际航行概论分享

作者最近看到了一篇钱学森的著作《星际航行概论》 PDF格式下载: 星际航行概论.pdf: https://url83.ctfile.com/f/45573183-1272939884-48f07e?p7526 (访问密码: 7526)

【GlobalMapper精品教程】085:coverage格式转shp案例教程

文章目录 一、Coverage格式介绍二、globalmapper转换shp1. 加载coverage2. coverage转shp一、Coverage格式介绍 Coverage 是一种用于存储矢量数据的地理相关数据模型,它包含地理要素的空间(位置)数据和属性(描述性)数据。Coverage 使用一组要素类来表示地理要素。每个要素…

【包管理】Node.JS与Ptyhon安装

文章目录 Node.JSPtyhon Node.JS Node.js的安装通常包括以下几个步骤: 访问Node.js官网: 打开Node.js的官方网站(如:https://nodejs.org/zh-cn/download/)。 下载安装包: 根据你的操作系统选择对应的Node…

在Windows环境下设置定时任务(任务计划程序)(Python)

文章目录 前言一、准备执行的test.py文件二、准备test.bat批处理文件(系统环境变量)三、设置定时任务(任务计划程序) 前言 计划任务是系统的常见功能,利用任务计划功能,可以将任何脚本、程序或文档安排在某…

《Windows API每日一练》4.5 GDI映射模式

上一节讲述设置绘图模式时,包括设置背景模式、混合模式,还有一个就是映射模式。本节我们将详细讲述映射模式。 本节必须掌握的知识点: 设备坐标和逻辑坐标 视口和窗口 MM_TEXT映射模式 度量映射模式 自定义映射模式 第27练:GDI映…

Aigtek高压放大器在柔性爬行机器人驱动性能研究中的应用

实验名称:柔性爬行机器人的材料测试 研究方向:介电弹性体的最小能量结构是一种利用DE材料的电致变形与柔性框架形变相结合设计的新型柔性驱动器,所谓最小能量是指驱动器在平衡状态时整个系统的能量最小,当系统在外界的电压刺激下就…

归并排序个人见解

归并排序个人见解 思路实现代码实现题目 思路实现 归并排序属于分治算法,分治算法有三个步骤: 分:将问题划分为多个规模较小的子问题,这些子问题与原始问题相似。治:递归地解决这些子问题。如果子问题足够小&#xf…

【WEB前端2024】3D智体编程:乔布斯3D纪念馆-第42课-多人联机-实时互动

【WEB前端2024】3D智体编程:乔布斯3D纪念馆-第42课-多人联机-实时互动 使用dtns.network德塔世界(开源的智体世界引擎),策划和设计《乔布斯超大型的开源3D纪念馆》的系列教程。dtns.network是一款主要由JavaScript编写的智体世界…

【JVM结构、JVM参数、JVM垃圾回收】

JVM:Java Virtual Machine java虚拟机 虚拟机:使用软件技术模拟出与具有完整硬件系统功能、运行在一个隔离环境中的计算机系统。 JVM官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/index.html java 一些命令 javac 将文件编…

【Netty】nio处理acceptreadwrite事件

📝个人主页:五敷有你 🔥系列专栏:Netty ⛺️稳中求进,晒太阳 1.处理accept 1.1客户端代码 public class Client {public static void main(String[] args) {try (Socket socket new Socket("localhost…

秋招突击——6/16——复习{整理昨天的面试资料}——新作{删除链表倒数第n个节点}

文章目录 引言复习新作删除链表倒数第N个节点题目描述个人实现参考实现 总结 引言 主管面,面的很凄惨,不过无所谓了,我已经尽力了。上午都在整理的面经,没有复习算法,而且这两天要弄一下论文,二十号就要提…

Aspice介绍——测试流程

文章目录 ASPICE简介一、V字模型的示意二、测试领域2.1 SWE.6:软件合格性测试过程目的过程成果基本实践(BP) 2.2 SYS.4:系统集成和集成测试过程目的过程成果基本实践(BP) 2.3 SYS.5:系统合格性测试过程目的…

AI早班2024.6.18

先一步知道AI未来! 全球AI新闻速递 1.绿米 AI 智能存在传感器 FP1E开售。 2.摩尔线程 师者AI:完成70亿参数教育AI大模型训练测试。 3.Google 在 AI 功能推出新功能,需要明确说明可能出错的地方。 4.北大、快手攻克复杂视频生成难题&#…

【unity笔记】三、冰山碰撞变成碎块效果

一、模型准备 共需准备两个模型,一个原始模型,一个破碎后的模型。 破碎后的模型制作教程: 下载Blender 导入原始模型在添加偏好设置中添加Cell Fracture插件,调整模型碎裂效果。导出,保存到项目预制体文件夹。 二、…

性能测试项目实战

项目介绍和部署 项目背景 轻商城项目是一个现在流行的电商项目。我们需要综合评估该项目中各个关键接口的性能,并给出优化建议,以满足项目上线后的性能需要。 项目功能架构 前台商城:购物车、订单、支付、优惠券等 后台管理系统&#xf…

基于springboot实现药店管理系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现药店管理系统演示 摘要 传统信息的管理大部分依赖于管理人员的手工登记与管理,然而,随着近些年信息技术的迅猛发展,让许多比较老套的信息管理模式进行了更新迭代,药品信息因为其管理内容繁杂,管理数…

wireshark使用情况与网口调试记录

wireshark使用情况与网口调试记录 前言wireshark无法获取本地数据方法一——Npcap方法二——WinPcap效果 UDP组播,却一直捕获到127.0.0.1总结 前言 在网口调试中,wireshark使用较多,常出现一些无法捕获或者ip获取数据不正确的情况&#xff0…

webpack工作流程

webpack工作流程 初始化参数:从配置文件和 Shell 语句中读取并合并参数,得出最终的配置对象用上一步得到的参数初始化 Compiler 对象加载所有配置的插件执行对象的 run 方法开始执行编译根据配置中的entry找出入口文件从入口文件出发,调用所有配置的Loader对模块进…

如何确保pcdn的稳定性?(壹)

确保PCDN的稳定性是一个重要任务,涉及多个方面的操作和考虑。以下是一些建议,帮助你确保PCDN的稳定性: 一.选择合适的服务器与硬件: 选择稳定可靠的服务器供应商和硬件设备,确保服务器具有高可用性和容错…