机器学习:knn算法实现图像识别

news2024/11/14 13:33:49

1、概述

        使用K-近邻(K-Nearest Neighbors, KNN)算法对手写数字进行识别的过程。通过读取一张包含多个手写数字的图片,将其分割成单独的数字图像,并将其作为训练和测试数据集。

2、数据处理思路

1、图像分割该数据有50行100列,每个数字占据20*20个像素点,可以进行切分

2、划分出训练集和测试集

3、每个数据的像素点为20*20,将其全部变成一列1*400格式,转换成数值特征

4、最后使用KNN算法训练模型,使用测试集评估模型的性能

3、方法:

  1. 数据准备: 描述如何获取和准备"digits.png"图片数据。
  2. 图像预处理: 包括图像读取、灰度转换和图像分割。
  3. 数据集划分: 说明如何将图像分割后的小块划分为训练集和测试集。
  4. 特征提取: 描述如何将图像数据转换为适合KNN算法处理的数值特征。
  5. 模型训练: 详细说明如何使用KNN算法训练模型,包括参数设置和训练过程。
  6. 模型评估: 描述如何使用测试集评估模型的性能,包括准确率的计算方法。
  7. 数据检测:输入数据进行判断。
import cv2
import numpy as np#导入库
#数据准备
img=cv2.imread("digits.png")#cv2读取文件

#图像预处理
gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#将读取的文件变成灰度图
splited=[np.hsplit(i,100) for i in np.vsplit(gray,50)]#将该图切成50行100列

#数据集划分
x=np.array(splited)#将切好后的数据以数组的形式保存
train=x[:,:50]#前面50列定义为训练集
test=x[:,50:100]#后面50列定义为测试集

#特征提取
#每一个数据占据20*20的像素,将其转换成一列1*400格式重新塑形并转换为浮点数类型,以便用于K-近邻算法的输入。
train1=train.reshape(-1,400).astype(np.float32)
test1=test.reshape(-1,400).astype(np.float32)
#训练集中0-9,各有250个,是train1的结果,np.newaxis改变维度和上面训练集维度相同
train_result=np.repeat(np.arange(10),250)[:,np.newaxis]
test_result=np.repeat(np.arange(10),250)[:,np.newaxis]

#模型训练
#创建K-近邻算法的实例
knn=cv2.ml.KNearest_create()
#将train1按照1*400的格式为特征,train_result为标签进行训练,cv2.ml.ROW_SAMPLE(将数据一行行输出)
knn.train(train1,cv2.ml.ROW_SAMPLE,train_result)
#将测试集带入,k近邻设置为3(建议为奇数,尽量避免出现相同的数量)
ret,result,neighbours,dist=knn.findNearest(test1,k=3)
#ret:检测操作成功
#result: 这是存储搜索结果。
#neighbours: 这将是一个列表,包含每个测试点的最近邻的索引。
#dist: 这将是一个列表,包含每个测试点到其最近邻的距离

#模型评估
#比较测试结果和测试集结果
matches=result==test_result
#统计正确的数量
correct=np.count_nonzero(matches)
#求占比
accuracy=correct*100.0/result.size
print(accuracy)

#数据检测
imgn=cv2.imread("p6.png")
grayn=cv2.cvtColor(imgn,cv2.COLOR_BGR2GRAY)
xn=np.array(grayn)
testn=xn.reshape(-1,400).astype(np.float32)
ret,resultn,neighbours,dist=knn.findNearest(testn,k=5)
print(resultn)

4、结果(使用knn进行效果不好,自己手写的准确率不高)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2047757.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

手机设备IP地址切换:方法、应用与注意事项

在当今数字化时代,手机已成为我们日常生活中不可或缺的一部分。无论是工作、学习还是娱乐,手机都扮演着重要角色。然而,随着网络环境的日益复杂,有时我们需要切换手机设备的IP地址以满足特定的需求,如保护隐私、绕过地…

算法笔记:空间填充曲线

空间填充曲线(Space-filling curve)是一种数学曲线,它可以无间断地覆盖一个多维空间的每一个点,从而实现从一维到多维的映射。用以解决连续与离散空间之间的映射问题。空间填充曲线的应用广泛,包括图像处理、地理信息系…

基于微信小程序的诗词智能学习系统的设计与实现(全网独一无二,24年最新定做)

文章目录 前言: 博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为…

dos攻击漏洞思路小结

前言 想挖掘src拒绝服务类型的漏洞,搜索了一圈社区相关文章较少,这里根据自己的一些实战案例归纳思路来抛砖引玉,希望能对各位师傅有所帮助! 从黑盒视角搭配实际场景,说明如何具体操作能够快速的挖掘拒绝服务漏洞。 …

vue3中使用useStore(),返回undefined的踩坑记录

vue3中使用useStore(),返回undefined,排查后,记录一下的踩坑记录。 总结为,三检查: 1、一检查版本 在package.json中检查,vuex是否正常引入: 版本也要确认一下: vue3对应vuex4的…

使用光流进行相机运动估计

文章目录 基本相机移动区分动作的核心思想了解代码参考 基本相机移动 从我的非专业角度来看,尽管已知的摄像机运动有多种,但我们应该概述其中三种: 一种是将摄像机安装在轨道上并移动——卡车、移动式摄影车、基座摄像机停留在同一位置并旋…

MySQL中的distinct和group by哪个效率更高?

前言 大家好,我是月夜枫~~ 一、distinct和group by的区别 1.1.作用方式和应用场景 ‌group by和‌distinct的主要区别在于它们的作用方式和应用场景。 group by用于对数据进行分组和聚合操作,通常与聚合函数(如COUNT、SUM、AVG等&#xf…

学习分享:微软Edge浏览器全解析(请按需收藏)

成长路上不孤单😊【14后小学生一枚,C爱好者,持续分享所学,如有需要欢迎收藏转发😊😊😊😊😊😊😊】 微软Edge浏览器是一款由微软开发的现代网页浏览…

Python(PyTorch)硅光电倍增管和量化感知训练亚光子算法验证

🎯要点 🎯亚光子光神经网络矩阵计算 | 🎯光学扇入计算向量点积 | 🎯表征测量确定不同光子数量下计算准确度 | 🎯训练全连接多层感知器基准测试光神经网络算法数字识别 | 🎯物理验证光学设备设置 | &#x…

【闭包】闭包知识点总结

一、什么是闭包? ——官方解释: 一个函数对周围状态的引用捆绑在一起,内层函数中访问到其外层函数的作用域 ——简单解释: 👉 闭包内层函数可以引用的外层函数的变量 ——闭包优势 可以保护内部变量,不让外…

黑马前端——days11_综合案例

文章目录 一、首页1、页面开头2、快捷导航2.1 页面框架2.2 格式文件 3、头部模块3.1 页面框架3.2 格式文件 4、导航栏4.1 页面框架4.2 格式文件 5、页面主模块5.1 页面框架5.2 格式文件 6、推荐模块6.1 页面框架6.2 格式文件 7、楼层模块7.1 页面框架7.2 格式文件 8、页面底部8…

webrtc学习笔记2

音视频采集和播放 打开摄像头并将画面显示到页面 1. 初始化button、video控件 2. 绑定“打开摄像头”响应事件onOpenCamera 3. 如果要打开摄像头则点击 “打开摄像头”按钮,以触发onOpenCamera事件的调用 4. 当触发onOpenCamera调用时 a. 设置约束条件&#xff0c…

虚幻UE5安装报错误代码:SU-PQR5

找到图标的快捷方式 “Epic Games Launcher”右键属性,在目标最后添加-SkipBuildPatchPrereq,如下图: 最后,见证奇迹成功打开软件,可以继续安装啦。 参考资料: 【图片】求教各位大佬--错误代码SU-PQR5【ep…

Linux网络编程—socket、bind

一、socket创建套接字 socket是用来创建网络通信或本地通信的套接字&#xff0c;跟文件有关&#xff1a;告诉系统&#xff0c;PCB&#xff08;进程控制块&#xff09;控制的数据应该向哪个套接字写入、或读取&#xff1b;这个套接字是在TCP/IP协议下运行的 #include <sys/t…

配置MySQL主从,配置MySQL主主 +keeplive高可用

在大数据-Hadoop体系中 配置MySQL主主keeplive高可用 注意&#xff1a;这个是我两年前的word文档&#xff0c;可以当作参考文档有个思路参考一下&#xff0c;但是里面可能有些地方有误 另外 :关于一些企业级实战技术可以参考这篇mysql 物理备份 MySQL 全量备份 增量备份 差异…

NFTScan 正式上线 AI Search 浏览器,实现 NFT 数据双重搜索功能

近日&#xff0c;NFT 数据基础设施服务商 NFTScan 正式对外发布了 AI Search 浏览器&#xff0c;这一创新工具旨在为 NFT 生态中的开发者和用户提供简洁高效的 NFT 数据搜索与查询服务。NFTScan 的这一举措不仅帮助用户更方便地访问相关的 NFT 数据&#xff0c;还大幅提升了数据…

STM32F407ZGT6无操作系统移植lwip2.1.3,,具备DHCP功能

1.工程添加网络库文件 (1).拷贝文件夹 解压en.stsw-stm32070.zip压缩包,把STM32F4x7_ETH_LwIP_V1.1.1\Libraries\STM32F4x7_ETH_Driver文件夹下的inc和src文件夹拷贝到 STM32F407\FWLIB\STM32F4x7_ETH_Driver文件夹目录下&#xff1a; (2).重命名头文件 进入STM32F407\FWLI…

【TM1638不能成功读回按键值】

8led8按键8数码管。主函数调用TM1638_ReadData2&#xff0c;打印了返回值&#xff0c;无论是否按键&#xff0c;都一直打印255&#xff0c;为什么全是1&#xff0c;看来读数据函数有问题啊。 u8 TM1638_ReadData2(void) {uint8_t i;uint8_t temp0x00;TM1638_DIOModeInput();/…

前端读取response.headers异常:Cannot read properties of undefined (reading ‘split‘)

[TOC](前端读取response.headers异常:Cannot read properties of undefined (reading ‘split’) ) 前端读取response.headers异常 Cannot read properties of undefined (reading ‘split’) TypeError: Cannot read properties of undefined (reading ‘split’) 报错解释&a…

如何修改计算机ip地址?几招教你轻松改

在日常使用计算机的过程中&#xff0c;有时我们需要修改计算机的IP地址&#xff0c;无论是出于网络安全、网络管理还是其他特定需求。然而&#xff0c;对于非专业人士来说&#xff0c;这一过程可能显得复杂且充满挑战。但别担心&#xff0c;本文将带您了解IP地址基础知识&#…