【机器学习随笔】基于kmeans的车牌类型分类注意点

news2024/12/24 21:53:40

kmeans是无监督的聚类算法,可用于数据的分类。本文尝试用kmeans对车牌类型进行分类,记录使用过程中的注意点。
kmeans使用过程中涉及两个大部分,模型与分析。模型部分包括训练模型和使用模型,分析部分主要为可视化分析。两部分的主要流程如下。

训练与使用

训练模型与使用模型
数据可视化
数据分布的可视化展示
下面对主要的部分进行解释和代码说明
一、数据集与预处理
使用车牌数据,车牌数据为rgb图片数据,共7种类型的车牌500张。主要想从颜色上进行区分,所以数据不进行灰度化,而是提取了r分量与g分量的比值做为输入。同时图片需要展开成一维数据送入kmeans的接口

img = img.convert('RGB')
r, g, b = img.split()
r_array = np.array(r).flatten().astype(float)#0.592
g_array = np.array(g).flatten().astype(float)#0.436
b_array = np.array(b).flatten().astype(float)#0.554
img_array = r_array/g_array#0.816

二、kmeans参数配置
定义了7分类,将随机数从0-79进行尝试,取数据最好的。

from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
images_data = scaler.fit_transform(images_data)
# 定义聚类数量
n_clusters = 7  # 根据实际情况选择聚类的数量
# 使用KMeans进行聚类
bestacc = 0
for i in range(80):
    kmeans = KMeans(n_clusters=n_clusters,max_iter=8,random_state=i)#, random_state=42)
    kmeans.fit(images_data)
    # 输出每个图片所属的聚类
    pre_labels = kmeans.labels_

每次循环后计算acc,数据好的acc就保存下来。

   acc = getacc(pre_labels,gt_labels)
    if acc >= bestacc:
        bestacc = acc
        model_path = 'kmeans_model_'+str(i)+'.joblib'
        joblib.dump(kmeans, model_path)
    print("iter:",i," Acc:", acc)

计算acc时需要注意的地方:1、训练好的标签与标定标签之间不一样,我的解决方法是:提取预测标签相同的目标,统计其中标定标签个数最多的那个做为这一类的真实标签。
2、需要注意,该方法可能存再多个标定标签的个数是一样的,这时候需要自己检查,选择一下。
完成上两步后,可进一步获取预测标签与真实标签的映射关系,后续预测其他数据时,经过转换就可以直接看到预测标签与标定标签的关系。

三、可视化问题
1、图片数据进行处理后,是一维向量,对于128x48大小的车牌而言,是转换成1*6144维度的向量。高维向量难以用散点图的形式进行可视化,所以需要对数据进行降维,得到一个二维向量,即可在平面上显示,此处用PCA进行降维。
2、降维后的数据,按类进行区分,计算其均值做为类中心位置。
3、计算每类数据与中心位置的距离
4、获得距离后即可进行可视化。

pca = PCA(n_components=2,whiten=True)
X_reduced = pca.fit_transform(data)
    cluster_centers=[]
for clust in range(7):
    indices_of_clust = np.where(labels == clust)[0]
    cluster_centers.append(np.mean(X_reduced[indices_of_clust], axis=0))
cluster_centers = np.array(cluster_centers)
distances = [np.linalg.norm(x - cluster_centers[label]) for x, label in zip(X_reduced, labels)]

    # 可视化
    plt.figure(figsize=(10, 8))
    scatter = plt.scatter(X_reduced[:, 0], X_reduced[:, 1], c=labels, cmap='magma', s=[d*50 for d in distances])
    centers = plt.scatter(cluster_centers[:, 0], cluster_centers[:, 1], c='red', marker='x')
    plt.title('K-Means Clustering with Centroids and Distances')
    plt.xlabel('Feature 1')
    plt.ylabel('Feature 2')
    unique_labels = np.unique(labels)
    colors = scatter.cmap(scatter.norm(unique_labels))
    legend_elements = [plt.Line2D([0], [0], marker='o', color='w', label=f'Label {label}', markerfacecolor=color, markersize=10) for label, color in zip(unique_labels, colors)]

四、可视化效果
在这里插入图片描述
可视化效果图:其中0是黄牌,3,4是新能源牌。从颜色上看,新能源的两类绿色较难分开,黄色与绿色也很大程度上重叠。
至此,完成了kmeans的验证和可视化,从颜色上对车牌进行区分会受限于相同颜色不同类型的干扰,也会有黄绿难区分的的情况

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2134712.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

这东西有点上头,不小心刷到天亮了。。。

相信很多每天勤奋刷题的小伙伴已经发现了,面试鸭又又又升级更新了! 打开首页就让人眼前一亮,优化了岗位分类导航栏,找起目标题库更轻松了。毕竟鸭鸭目前已经有 6000 道面试题、上百个题库,一不小心就会淹没在浩瀚题海…

如何优化MySql的性能

优化MySQL的性能是一个复杂但至关重要的任务,它涉及到多个层面的调整和优化。以下是一些关键的步骤和策略,可以帮助你提高MySQL数据库的性能: 1. 优化数据库设计 选择合适的数据类型:确保你使用的数据类型是适合你的数据的&#…

Three.js 实战【4】—— 3D地图渲染

初始化场景&准备工作 在vue3threejs当中,初始化场景的代码基本上是一样的,可以参考前面几篇文章的初始化场景代码。在这里进行渲染3D地图还需要用到d3这个库,所以需要安装一下d3,直接npm i即可。 再从阿里云这里提供的全国各…

SQL server 6.5升级到SQL server 2019的方法

背景: 对日项目,客户的旧系统的数据库用的是SQL server 6.5,操作系统是windows NT。新系统要求升级到SQL server 2019,查了下资料发现旧系统的版本实在是太久远了,90年代的。 数据库部分的升级思路是这样的&#xff…

git 更新LingDongGui问题解决

今天重新更新灵动gui的代码,以便使用最新的arm-2d,本来以为是比较简单的一件事情(因为以前已经更新过一次),却搞了大半天,折腾不易啊,简单记录下来,有同样遇到问题的同学参考&#x…

AI算法部署方式对比分析:哪种方案性价比最高?

随着人工智能技术的飞速发展,AI算法在各个领域的应用日益广泛。AI算法的部署方式直接关系到系统的性能、实时性、成本及安全性等多个方面。本文将探讨AI算法分析的三种主要部署方式:本地计算、边缘计算和云计算,并详细分析它们的优劣性。 一、…

基于vue框架的宠物交流平台1n2n3(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。

系统程序文件列表 项目功能:会员,宠物信息,宠物类型,团队信息,申请领养,团队申请,领养宠物 开题报告内容 基于Vue框架的宠物交流平台开题报告 一、项目背景 随着现代生活节奏的加快与人们情感需求的日益增长,宠物已成为众多家庭不可或缺的重要成员。…

基于Python的影视数据可视化---附源码75141

摘 要 本文基于Python语言,设计并实现了一个影视数据可视化系统,包括首页、公告通知、新闻资讯和电影信息等功能模块。通过对影视数据的采集、处理和可视化展示,该系统旨在为用户提供全面的影视信息和数据分析服务。在研究背景中&#xff0c…

编译运行 webAssembly(wasm)

环境准备&#xff1a; lunix下docker 参考https://hub.docker.com/r/emscripten/emsdk 拉编译环境 docker pull emscripten/emsdk 编译 随便找个目录&#xff0c;敲下面命令&#xff0c;编译一个webAssembly 程序 # create helloworld.cpp cat << EOF > hellowo…

Android Studio 新生成key store 打包apk报 Invalid keystore format

Android Studio 新生成key store 打包apk报错 Execution failed for task :app:packageDebug. > A failure occurred while executing com.android.build.gradle.internal.tasks.Workers$ActionFacade > com.android.ide.common.signing.KeytoolException: Failed …

充电宝什么品牌比较好用?2024年最值得推荐充电宝品牌!

近年来&#xff0c;随着电子设备使用需求的增加&#xff0c;充电宝市场呈现出蓬勃发展的态势。优秀的充电宝产品不仅能够提供稳定的充电速度&#xff0c;还具备方便携带的体验&#xff0c;深受用户喜爱。然而&#xff0c;面对市场上众多品牌和型号的选择&#xff0c;如何找到最…

C++库std::clamp

C库std::clamp std::clamp: 轻松掌握值的范围限制 目录 1. 引言2. std::clamp 基本概念2.1 函数签名2.2 参数说明2.3 返回值 3. 基本用法4. 深入理解 std::clamp4.1 实现原理4.2 注意事项 5. 高级用法5.1 自定义比较函数5.2 与 lambda 表达式结合 6. 实际应用场景6.1 图形编程…

全球安防监控、工业检测摄像机市场规模情况一览

一、全球安防监控市场规模情况综合分析 &#xff08;1&#xff09;全球安防监控摄像机市场规模 全球市场研究公司Research Nester统计&#xff0c;2023年全球安防监控摄像机市场规模为811.1亿元&#xff0c;预测到2028年&#xff0c;全球安全与监控市场规模预计将达到1869.3亿…

将 Parallels Desktop(PD虚拟机)安装在移动硬盘上,有影响吗?

当我们谈论在移动硬盘上安装 Parallels Desktop&#xff08;简称PD虚拟机&#xff09;及其对性能的影响时&#xff0c;特别是在运行如Unigraphics这样的资源密集型软件时&#xff0c;用户需要在便携性与性能之间找到最佳平衡。本文将深入探讨PD虚拟机装在移动硬盘有影响吗&…

(javaweb)mysql---DDL

一.数据模型&#xff0c;数据库操作 1.二维表&#xff1a;有行有列 2. 3.客户端连接数据库&#xff0c;发送sql语句给DBMS&#xff08;数据库管理系统&#xff09;&#xff0c;DBMS创建--以文件夹显示 二.表结构操作--创建 database和schema含义一样。 这样就显示出了之前的内容…

类和对象(中)【上篇】(构造,析构,拷贝函数)

&#x1f31f;个人主页&#xff1a;落叶 目录 类的默认成员函数 构造函数 无参构造 带参构造函数 全缺省构造函数 析构函数 对⽐C和C解决括号匹配问题 C语言版的Stack C版的Stack 拷⻉构造函数 类的默认成员函数 默认成员函数就是⽤⼾没有显式实现&#xff0c;编译器会…

如何查看微信聊天记录,防员工私单(有效监管员工电脑微信聊天的方法)

在企业管理中&#xff0c;防止员工私单&#xff08;即员工绕过公司直接与客户交易&#xff09;是管理中的一大难题。 许多员工使用微信进行日常工作沟通&#xff0c;而如果管理不到位&#xff0c;容易产生私单问题&#xff0c;影响企业的利益。 为了解决这一问题&#xff0c;…

【自费2W真机测评】三款热门/旗舰宠物空气净化器米家、希喂、352对比试用!

我家老大是三个月大的时候接回来的&#xff0c;接回来前就是家教好的小猫咪一只&#xff0c;不乱尿、不掉毛的。看朋友家都被猫咪掉毛困扰着&#xff0c;我还嘚瑟觉得自己养可好了&#xff0c;根本不掉毛。养了三个月老大长成大猫猫了&#xff0c;我又觉得我可以了&#xff0c;…

浏览器插件快速开启/关闭IDM接管下载

假设你已经为浏览器安装了IDM扩展&#xff0c;那么按下图的点击顺序&#xff0c;可以快速开启或关闭IDM的下载接管&#xff0c;而不必在IDM软件的设置->选项中&#xff0c;临时作调整。

再次进阶 舞台王者 第八季完美童模全球赛代言人【孟梓娴】赛场+秀场超燃合集!

7月20-23日&#xff0c;2024第八季完美童模全球总决赛在青岛圆满落幕。在盛大的颁奖典礼上&#xff0c;一位才能出众的少女——孟梓娴迎来了她舞台生涯的璀璨时刻。 代言人——孟梓娴&#xff0c;以璀璨童星之姿&#xff0c;优雅地踏上完美童模盛宴的绚丽舞台&#xff0c;作为开…