opencv实战项目十六:kmeans图像颜色聚类:

news2024/11/15 5:04:20

文章目录

  • 前言
  • K-means介绍
  • 效果


前言

在数字化时代,图像处理技术已成为计算机视觉领域的重要组成部分。其中,图像颜色聚类作为一项关键技术在众多应用场景中发挥着重要作用,如图像分割、物体识别、色彩调整等。K-means算法作为一种经典的聚类方法,以其简洁、高效的特点在图像颜色聚类领域得到了广泛应用。本文将围绕K-means图像颜色聚类技术,探讨其原理、实现方法以及在实际应用中的价值,为广大图像处理爱好者和技术人员提供参考。

K-means介绍

K-means算法是一种基于距离的聚类方法,它旨在将一组数据点划分为K个簇(Cluster),其中每个簇的内部数据点尽可能相似,而不同簇的数据点尽可能不同。
K-means算法的核心思想是通过迭代过程将数据点分配到K个簇中,使得每个数据点与其所属簇的中心点(均值)的距离之和最小。算法的步骤如下:

初始化: 随机选择K个数据点作为初始簇中心。
分配: 对于每个数据点,计算其与各个簇中心的距离,并将其分配到最近的簇中心所代表的簇。
更新: 重新计算每个簇的数据点的平均值,作为新的簇中心。
迭代: 重复步骤2和步骤3,直到满足停止条件,如簇中心的变化小于某个阈值或达到预设的迭代次数。

在opencv中集成了k-means方法,其函数为cv2.kmeans()函数介绍:
cv2.kmeans()函数是实现K-means聚类算法的一个高效工具。这个函数可以用于对数据进行聚类分析,特别是在图像处理中,它常用于颜色量化,即将图像中的颜色缩减到一定数量的聚类中心所代表的颜色。

retval, bestLabels, centers = cv2.kmeans(data, K, bestLabels, criteria, attempts, flags)
参数说明:
data: 一个浮点型数组,每一行代表一个样本,每一列代表一个特征。在图像颜色聚类中,通常是一个(N, 3)的数组,N是像素点的数量,3代表颜色通道(例如RGB)。
K: 聚类的数目,即我们想要将数据点划分成的簇的数量。
bestLabels: 输出数组,用于存储每个样本的簇索引。如果提供,则该数组将被用作初始标签,并且函数将使用这些标签进行优化。
criteria: 聚类算法的终止条件,这是一个包含三个元素的元组:type,max_iter,epsilon。
type:用于指定停止标准的类型,通常使用cv2.TERM_CRITERIA_EPS或cv2.TERM_CRITERIA_MAX_ITER,或者两者的组合。
max_iter:最大的迭代次数。
epsilon:所需的准确度。

attempts: 使用不同初始标签执行算法的次数,算法会返回最佳聚类的结果。
flags: 用于指定初始中心的选取方法,可以是cv2.KMEANS_PP_CENTERS或cv2.KMEANS_RANDOM_CENTERS。默认值为cv2.KMEANS_PP_CENTERS,它使用K-means++算法来选择初始中心,这通常比随机选择更有效。

返回值:

retval: 聚类中心之间的最小平方距离。
bestLabels: 每个样本的簇索引数组。
centers: 聚类中心的数组,每一行代表一个簇中心。

使用案例:

# 导入所需的库
import numpy as np
import cv2

# 读取输入图像
img = cv2.imread(r'D:\ultralytics-main\1724896328042.png')
z = img.reshape((-1,3))

# 转换为 np.float32
z = np.float32(z)

# 定义标准,聚类的数量K并应用kmeans()
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)
K = 2
ret,label,center=cv2.kmeans(z,K,None,criteria,10,cv2.KMEANS_RANDOM_CENTERS)

# 转换回uint8,并制作原始图像
center = np.uint8(center)
res = center[label.flatten()]
res2 = res.reshape((img.shape))

# 显示图像
cv2.imshow('k = 2',res2)
cv2.waitKey(0)
cv2.destroyAllWindows()

注:K=2可以实现图像二值化的效果,与传统二值化相比K-means算法在图像二值化中展现出其独特的优势,它能够根据图像内容的特征自适应地选择阈值,从而在处理不同光照条件和复杂背景的图像时,找到更合适的阈值,这一点相较于传统的全局阈值二值化方法更具灵活性。并且,K-means不仅考虑了像素间的相对关系,而且其不依赖于图像的特定统计特性,使得该方法适用于包括灰度图像和彩色图像在内的各种类型。然而,K-means图像二值化也存在局限性,如对初始聚类中心选择的敏感性,以及可能不适用于所有图像类型,特别是在处理非常嘈杂的图像时,可能需要额外的预处理来提升二值化的效果。

效果

原图:
在这里插入图片描述
二值化图:
在这里插入图片描述
可以看到没有收到阴影的影响,分割出比较干净的二值图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2089913.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java性能优化传奇之旅--Java万亿级性能优化之电商平台高峰时段性能大作战:策略与趋势洞察

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

Redis基础知识学习(入门篇)

文章目录 五大数据结构一. String: 字符串二. Hash: 散列概念性质 三. List: 列表四. Set: 集合特点 五. Sorted Set: 有序集合 五大数据结构 一. String: 字符串 数据结构中,字符串要单独用一种存储结构来存储,称为串存储结构。这里的串指的就是字符串…

性能分析之使用 Jvisualvm dump 分析示例

一、前言 在 JMeter 入门系列中相信大家对工具使用已经没问题,今天开起性能测试进阶系列之 jvisualvm 工具简单学习,目标是通过演示 Jvisualvm 工具定位代码,帮助性能测试工程师直接定位代码位置,协助开发解决性能问题&#xff1…

Flink CDC MySQL数据同步到Doris表同步配置生成工具类

工具类 生成的配置 要同步表为: customer_user.tb_business_user_info express.route_push_service 请提前自行到doris中建好目标数据库,如果没有会报错 同步的配置文件如下:(将配置内容保存为xxx.yaml文件到flink cdc提交任务&…

昇腾 Ascend 概念澄清 Host、Device、AI core、AI CPU、DVPP、AIPP、AscendCL、AscendC

昇腾 Ascend 概念澄清 Host、Device、AI core、AI CPU、DVPP、AIPP、AscendCL、AscendC flyfish Ascend C开发算子,偏低。 AscendCL开发应用,偏高。 AI core、AI CPU、DVPP都属于计算资源。 Ascend C开发的算子运行在AI Core上。 AIPP用于在AI Core上完…

TimeWheel算法介绍及在应用上的探索

作者:来自 vivo 互联网服务器团队- Li Fan 本文从追溯时间轮算法的出现,介绍了时间轮算法未出现前,基于队列的定时任务实现,以及基于队列的定时任务实现所存在的缺陷。接着我们介绍了时间轮算法的算法思想及其数据结构&#xff0c…

手撕数据结构与算法——拓扑排序

拓扑排序是图论中的一个重要概念,它在许多领域如任务调度、课程规划等都有广泛的应用。在这篇文章中,我们将探讨拓扑排序的基本概念、算法实现以及在C/C中的实现方法。 拓扑排序简介 拓扑排序是针对有向无环图(DAG)的一种排序算法…

二叉树(数据结构)

1.两种特殊的二叉树 1. 满二叉树 : 一棵二叉树,如果 每层的结点数都达到最大值,则这棵二叉树就是满二叉树 。也就是说, 如果一棵 二叉树的层数为 K ,且结点总数是2^k-1 ,则它就是满二叉树 。 2. 完全二叉树 : 完…

为你的LLM应用增加记忆能力

1. 记忆系统的重要性 我们都知道,大模型本身是无状态、无记忆的。默认情况下,我们向大模型发起的每次提问,在其内部都会被视为一次全新的调用。尽管诸如 ChatGPT 等聊天应用内置了部分记忆功能,可以记录用户最近几轮的聊天信息&a…

ChatTTS容器构建教程

一、模型介绍 ChatTTS 是专门为对话场景设计的文本转语音模型,例如 LLM 助手对话任务。它支持英文和中文两种语言。最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。 ChatTTS WebUI如下&#x…

【单片机原理及应用】实验:LED循环控制

目录 一、实验目的 二、实验内容 三、实验步骤 四、记录与处理 五、思考 六、成果文件提取链接 一、实验目的 熟悉Proteus x8原理图与C51程序的联合仿真调试方法,掌握C51延时函数和循环控制的方法 二、实验内容 【参照图表】 (1)创建一…

晚宴扫码查询桌号

在现代社交活动中,晚宴的组织和管理越来越依赖于技术手段。为了提高晚宴的效率和参与者的体验,我们可以通过一个简单的扫码查询系统来实现快速查找桌号和座位号。以下是详细步骤: 1. 电脑端上传查询信息 访问云分组官网。 使用微信扫码登录…

AcrelEMS3.0企业微电网智慧能源平台的设计与应用-安科瑞 蒋静

1系统概述 1.1 概述 2020年9月,我国明确提出2030年“碳达峰”与2060年“碳中和”目标。2022年6月,科技部、国家发展改革委、工业和信息化部、生态环境部、住房城乡建设部、交通运输部、中科院、工程院、国家能源局共同研究制定了《科技支撑碳达峰碳中和…

netty编程之实现断点续传(分片发送)功能

写在前面 在我们使用各种网盘的时候,可以随时的暂停上传,然后继续上传,这其实就是断点续传的功能,本文就看下在netty中如何实现断点续传的功能。 1:核心点介绍 1.1:RandomAccessFile RandomAccessFile类…

汽车信息安全--MCU Flash读保护真的没有后门吗?

目录 1.修bug修出的灵感 2.串行编程接口协议 3.毛刺攻击 4.RH850 串行编程模式 5.小结 1.修bug修出的灵感 ECU量产后通过密码控制来防止通过Debug口读取Flash的程序和数据。 这是应该是共识了,但是这样做真的就万无一失了吗? 最近解决了个问题&…

Linux操作系统在虚拟机VM上的安装【CentOS版本】

目录 准备工作 "CPU虚拟化"的方法 VMware的安装 Linux镜像文件的下载 开始安装 声明 新建虚拟机 安装CentOS7.6 配置Linux(CentOS7.6)操作系统 配置分区【学习者可以直接点击自动配置分区,不过还是建议学习一下手动分区】 分区原则 添加分区 …

适配制造业的设备管理系统有哪些?本文给你答案!

本文将带大家盘点10款设备管理系统,供企业选型参考。 外包单位数量众多,但难以对他们进行统一协同管理?危险作业的作业申请、作业审批使用线下纸质版,不仅效率低还管控力不足?相关部门想监测、管理设备安全风险&#x…

AcWing898. 数字三角形

线性DP 董晓老师的讲解是从下标0开始算的,其实我们从1开始也可以,我感觉这里从1开始更好理解。是从下往上计算的。j负责列的计算,往上计算时逐步收窄横向的范围,i是纵向的从下往上算, 下面是内存布局 下面是逻辑上的…

【网络安全】打开这份“开学礼” 谨防骗子“冲业绩”

吉祥知识星球http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247485367&idx1&sn837891059c360ad60db7e9ac980a3321&chksmc0e47eebf793f7fdb8fcd7eed8ce29160cf79ba303b59858ba3a6660c6dac536774afb2a6330#rd 《网安面试指南》http://mp.weixin.qq.com/s…

今年读过最绝的一本书!《自然语言处理原理、方法与应用》,几乎把自然语言处理讲透了【附PDF】

书籍内容介绍: 本书系统阐述自然语言处理基础知识,以及自然语言处理高级模型应用等高级知识。 全书共11章:第1~5章为自然语言处理的基础知识,第6~11章将自然语言处理知识应用于实战。书中主要内容包括预训…