【人工智能】— 无监督学习、K-means聚类(K-means clustering)、K-means损失函数,目标函数

news2024/11/25 12:31:59

【人工智能】— 无监督学习、K-means聚类(K-means clustering)、K-means损失函数,目标函数

  • 无监督学习
  • 聚类(Clustering)
  • K-means聚类(K-means clustering)
  • K-means损失函数
  • 目标函数
    • 策略:交替最小化

无监督学习

无监督学习是指在没有标签的数据上进行学习,即没有监督信号的指导下进行模型训练。在无监督学习中,我们主要关注从无标签数据中学习出数据的低维结构和隐藏的模式。

通过无标签数据,我们可以预测以下内容:

  1. 低维结构:通过无监督学习算法如主成分分析(PCA),我们可以发现数据中的主要变化方向和低维表示,帮助我们理解数据的内在结构和进行数据降维。
  2. 集群结构:通过聚类算法如K均值聚类或层次聚类,我们可以将无标签数据划分为不同的组或类别,从而发现数据中的集群结构。
  3. 关联规则:通过关联规则挖掘算法如Apriori算法或FP-growth算法,我们可以发现数据中的频繁项集和关联规则,揭示不同特征之间的关联关系。

聚类(Clustering)

• 将数据对象分组为子集或“簇”:

  • 簇内具有高相似性
  • 簇间具有低相似性

• 聚类是一项常见而重要的任务,在科学、工程、信息科学和其他领域中都有广泛的应用:

  • 对具有相同功能的基因进行分组
  • 对具有相似政治观点的个体进行分组
  • 对具有相似主题的文档进行分类
  • 从图片中识别相似的对象

在这里插入图片描述

输入:输入点的训练集
输出:将每个点分配到一个簇中
其中 D t r a i n = { x 1 , . . . , x n } Dtrain = \{x1, ..., xn\} Dtrain={x1,...,xn}为输入点的训练集
( C ( 1 ) , . . . , C ( n ) ) (C(1), ..., C(n)) (C(1),...,C(n)) 为将每个点分配到的簇,其中 C ( i ) C(i) C(i) 属于 { 1 , . . . , k } \{1, ..., k\} {1,...,k} 表示第 i 个点所属的簇。

K-means聚类(K-means clustering)

K-means的目标是最小化所有数据点与其所属簇中心点之间的欧氏距离的平方和。

K-means的算法过程如下:

  1. 随机选择K个初始簇中心点(质心)。
  2. 将每个数据点分配到与其最近的簇中心点所对应的簇。
  3. 更新每个簇的中心点为该簇中所有数据点的平均值。
  4. 重复步骤2和步骤3,直到簇中心点不再发生明显变化或达到预定的迭代次数。

K-means损失函数

x \textbf{x} x为样本, μ C ( j ) μ_{C(j)} μC(j)表示某个簇 C ( j ) C(j) C(j)的中心,
下式表示将 x j x_j xj分到 C ( j ) C(j) C(j)这个簇上时,到簇中心 μ C ( j ) μ_{C(j)} μC(j)的欧式距离求和
在这里插入图片描述

目标函数

找到如何划分簇 C C C、如何选择簇中心 μ μ μ,使得每个簇的样本到簇中心的欧氏距离和最小
在这里插入图片描述

策略:交替最小化

  • 步骤1:如果知道聚类中心,可以找到最佳 C C C

    • 固定 μ μ μ,优化 C C C
      在这里插入图片描述
      将每个点指定给最近的聚类中心
  • 步骤2:如果知道集簇分配 C C C,可以找到最好的聚类中心 μ μ μ

    • 固定 C C C,优化 μ μ μ
      在这里插入图片描述
      解决方案:第 i i i个簇中选择该簇所有点的平均值重新作为簇中心,正好是步骤2(重新选择聚类中心)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/663048.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pikachu靶场-url重定向

打开测试界面 不安全的URL跳转 发现有四条超链接,依次打开都会进行内容跳转 当我们点击最下面的一个超链接,可以看到url变成了这样 我们对urli进行参数修改 设置payload为 http://ip:port/vul/urlredirect/urlredirect.php?urlhttp://www.baidu.com输…

Unity的IL2CPP

​ 目录 背景 概念 AOT编译器 运行时库 对比 Mono IL2CPP IL2CPP打包注意事项 类型裁剪 泛型实例 泛型方法 背景 在Unity4.6.1 p5以后版本中,在PlayerSettings—>Other Settings—>Scripting Backend有mono和il2cpp两个选项,它们是Un…

面试阿里,嫌弃面试官装逼当场怒怼,“把我的简历还给我”,疑似被拉黑

好家伙,这奇葩事可真是多,前两天和粉丝聊天,他说前段时间面试阿里的测试岗,最后和面试官干起来了。 我问他为什么,他说没啥,就觉得面试官太装B了,就爱问一些虚而不实的东西,显得自己…

Web自动化中常用的跳过验证码操作

目录 前言 通过cookies值登录 通OCR识别验证码 总结 前言 自动化测试中经常需要避免手动输入验证码的操作,因为这会增加测试成本,耗费测试人员的时间。通过自动化程序跳过验证码,可以减少测试时间,提高测试效率。 安静今天通过几个…

增值税高企业发展受限怎么办?采用此方法可化险为夷!

增值税高企业发展受限怎么办?采用此方法可化险为夷! 《税筹顾问》专注于园区招商,您的贴身节税小能手,合理合规节税 企业的发展,一方面需要依靠自身的生产经营,那么另一方面就需要在一些支出上尽可能的开源…

如何用 Python 给树莓派 Pico RP2040 编程

使用 MicroPython,仅用 8 行代码,我们就可以实现 LED 闪烁程序。 下载安装 Python IDE:Thonny Thonny 是 一个面向初学者的 Python IDE 环境,自带 Python,相对简单,比较容易上手。对于树莓派 Pico 开发&am…

实验篇(7.2) 12. 站对站安全隧道 - 仅一方发起连接(FortiGate-IPsec) ❀ 远程访问

【简介】上一篇实验发现,两端都是可以远程的公网IP的话,两端防火墙都可以发出连接请求,并且都能够连通。这样的好处是安全隧道不用随时在线,只在有需求时才由发起方进行连接。但是现实中很多情况下只有一端公网IP可以远程&#xf…

实战:求年月日时间前后遇到的坑和解决方式

这里写目录标题 前言正确实例:错误实例: 需求 前言 这周接到一个时间转换任务需要处理,本来没什么问题,后来完成后发现时间有偏差,又重写了一遍代码,感觉很有记录必要性,希望看过的小伙伴可以避…

代理ip会不会影响网络速度和稳定性

代理ip是一种可以帮助用户隐藏真实IP地址的技术,通常使用代理服务器作为中介来连接互联网。代理ip在网络安全、隐私保护、跨区域访问等方面都有广泛的应用。但是,使用 代理ip是否会影响网络速度和稳定性这一问题也一直备受关注。下面是一些有关代理ip对网…

k8s部署redis集群

写在前面 一般来说,REDIS部署有三种模式。 单实例模式,一般用于测试环境。哨兵模式集群模式 后两者用于生产部署 哨兵模式 在redis3.0以前,要实现集群一般是借助哨兵sentinel工具来监控master节点的状态。 如果master节点异常&#xff0c…

计算机网络管理-网络管理软件SNMPc软件的下载,安装和使用教程说明

⬜⬜⬜ 🐰🟧🟨🟩🟦🟪(*^▽^*)欢迎光临 🟧🟨🟩🟦🟪🐰⬜⬜⬜ ✏️write in front✏️ 📝个人主页:陈丹宇jmu &am…

树莓派4B移植5G模块驱动(RG200U-CN)

1、查看Linux内核版本 uname -r2、根据内核版本在Github上下载Linux内核源码(最好再Github上确定一下有没有这个分支) git clone --depth1 https://github.com/raspberrypi/linux --branch rpi-5.15.y3、下载依赖库 $ sudo apt update$ sudo apt inst…

【白话机器学习系列】白话 Dropout

白话 Dropout 文章目录 什么是Dropout理解缩放举个例子 什么是Dropout Dropout 是神经网络的一种正则化技术,它在训练时以指定的概率 p p p(常见值为 p 0.5 p0.5 p0.5)丢弃一个单元(连同连接)。在测试时&#xff…

【JUC并发编程】

本笔记内容为狂神说JUC并发编程部分 目录 一、什么是JUC 二、线程和进程 1、概述 2、并发、并行 3、线程有几个状态 4、wait/sleep 区别 三、Lock锁(重点) 四、生产者和消费者问题 五、八锁现象 六、集合类不安全 七、Callable ( 简单 )…

windows10企业版安装西门子博途V15---03安装仿真软件

1、选点这个 2、进入03.SIMATIC_PLCSIM_Advanced_V3,这个是什么东西,它就是真实的硬件设备的仿真软件,也就是说,现在没有真正的PLC硬件,PLC是这样的东西,它是一个硬件产品,而现在不可能去买个硬…

TRUNCATE 语句到底因何而慢?

作者通过源码分析 truncate 语句形成慢 SQL 的原因和解决方案,并与 MySQL 5.7就相关实现逻辑进行对比。 问题现象 收到反馈某测试环境执行批量操作时,有 truncate 语句存在于慢查询日志中。担心上线后可能影响数据库,请求 DBA 配合分析。 …

第八章 模型篇:transfer learning for computer vision

参考教程: transfer-learning transfer-learning tutorial 文章目录 transfer learning对卷积网络进行finetune把卷积网络作为特征提取器何时、如何进行fine tune 代码示例加载数据集构建模型fine-tune 模型模型作为feature extractor 定义train_loop和test_loop定…

【K8S系列】如何高效查看 k8s日志

序言 你只管努力,其他交给时间,时间会证明一切。 文章标记颜色说明: 黄色:重要标题红色:用来标记结论绿色:用来标记一级论点蓝色:用来标记二级论点 Kubernetes (k8s) 是一个容器编排平台&#x…

【C#每日一记】多线程实现的贪吃蛇原理—不允许你还不知道

👨‍💻个人主页:元宇宙-秩沅 👨‍💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由 秩沅 原创 👨‍💻 收录于专栏:uni…

软件测试技能,JMeter压力测试教程(一)

目录 前言 一、安装Java环境 二、安装JMeter环境 三、启动JMeter脚本测试 四、查看报告文件 前言 使用jmeter做压测的时候,在windows上不太稳定,所有一直在 Linux 服务器上使用 jmeter 做压力测试 本篇记录下 Linux上搭建 jmeter 环境&#xff0c…