计算机机器视觉——构建数字识别项目(OpenCV入门实践)

news2025/1/16 14:04:43

项目简介

        ---我们的项目是使用OpenCV来识别图片中的数字。我们将使用一个预训练的模型,将图片中的数字转换为对应的数字标签。为了实现这个功能,我们需要完成以下步骤: 

——安装必要的软件包和库
——————准备数据集
————————训练模型
——————————测试和优化模型
————————————使用模型进行预测


步骤一:环境配置

  •         首先,我们需要安装Python和OpenCV。在命令行中运行以下命令:

# 安装Python  
sudo apt-get install python3  
  
# 安装pip  
sudo apt-get install python3-pip  
  
# 安装OpenCV  
pip3 install opencv-python

 步骤二:准备数据集

        为了训练模型,我们需要一个包含数字和对应标签的数据集。在本例中,我们将使用MNIST数据集,它包含了手写数字的大型数据库。你可以从OpenCV的官方网站下载MNIST数据集。解压后,将数据集的路径设置为/path/to/mnist

步骤三:训练模型

        在Python中,我们可以使用OpenCV的CascadeClassifier类来训练模型。首先,我们需要一个预训练的Haar特征分类器。这个分类器可以从OpenCV的官方网站下载。解压后,将分类器的路径设置为/path/to/classifier.xml

  • 接下来,我们将使用OpenCV的cv2.CascadeClassifier类来训练模型:

import cv2  
  
# 加载预训练的Haar特征分类器  
face_cascade = cv2.CascadeClassifier('/path/to/classifier.xml')  
  
# 读取图片并转换为灰度图像  
img = cv2.imread('/path/to/image.jpg')  
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  
  
# 检测人脸区域并转换为矩形框列表  
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

 

步骤四:测试和优化模型

        为了测试模型的性能,我们可以使用测试数据集进行测试。首先,我们需要将测试数据集中的图像和标签保存到文件中。然后,我们使用Python脚本来读取这些文件,并使用训练好的模型进行预测。最后,我们可以计算模型的准确率和其他性能指标。在代码中添加以下内容:

# 读取测试数据集中的图像和标签并存储到文件中  
# 使用适当的方法将图像转换为灰度图像,并保存到文件中,例如:convert_image_to_gray.py脚本。  
# 将标签保存到标签文件中,例如:save_labels.py脚本。

 步骤五:使用模型进行预测

        一旦模型训练完毕并经过测试,我们就可以使用它来识别新的图像。以下是一个简单的示例,展示如何使用模型来识别图像中的数字:
# 读取测试图像和标签文件  
image_path = '/path/to/test/image.jpg'  
label_path = '/path/to/labels.txt'  
  
# 读取图像并转换为灰度图像  
img = cv2.imread(image_path)  
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  
  
# 检测数字区域并转换为矩形框列表  
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))  
  
# 提取每个数字的矩形框区域  
for (x, y, w, h) in faces:  
    # 从原始图像中提取数字区域  
    digit = img[y:y+h, x:x+w]  
    # 对提取的数字进行识别  
    digit_label = predict_digit(digit)  
    # 在原始图像上绘制数字标签  
    cv2.putText(img, str(digit_label), (x, y), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)  
  
# 显示带有标签的图像  
cv2.imshow('Image with labels', img)  
cv2.waitKey(0)  
cv2.destroyAllWindows()

 

        在这个示例中,我们首先加载测试图像和标签文件。然后,我们将图像转换为灰度图像,并使用训练好的模型来检测数字区域。对于每个检测到的数字,我们从原始图像中提取其矩形框区域,并使用predict_digit()函数对其进行预测。最后,我们在原始图像上绘制数字标签,并显示带有标签的图像。


 总结

        通过这个项目,我们学习了如何使用OpenCV进行计算机视觉任务的基本步骤。我们首先安装了必要的软件包和库,然后准备了数据集。接着,我们训练了一个简单的模型来识别数字。最后,我们测试了模型的性能,并使用它来识别新的图像。这个项目只是一个起点,计算机视觉领域还有许多其他有趣的任务等待我们去探索。希望这个项目能帮助你入门计算机视觉领域,并激发你对计算机视觉的兴趣。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1413848.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TensorFlow2实战-系列教程1:回归问题预测

🧡💛💚TensorFlow2实战-系列教程 总目录 有任何问题欢迎在下面留言 本篇文章的代码运行界面均在Jupyter Notebook中进行 本篇文章配套的代码资源已经上传 1、环境测试 import tensorflow as tf import numpy as np tf.__version__打印结果 ‘…

【开源】基于JAVA的房屋出售出租系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 房屋销售模块2.2 房屋出租模块2.3 预定意向模块2.4 交易订单模块 三、系统展示四、核心代码4.1 查询房屋求租单4.2 查询卖家的房屋求购单4.3 出租意向预定4.4 出租单支付4.5 查询买家房屋销售交易单 五、免责说明 一、摘…

前端怎么监听手机键盘是否弹起

摘要: 开发移动端中,经常会遇到一些交互需要通过判断手机键盘是否被唤起来做的,说到判断手机键盘弹起和收起,应该都知道,安卓和ios判断手机键盘是否弹起的写法是有所不同的,下面讨论总结一下两端的区别以及…

专业120+总分400+海南大学838信号与系统考研高分经验海大电子信息与通信

今年专业838信号与系统120,总分400,顺利上岸海南大学,这一年的复习起起伏伏,但是最后还是坚持下来的,吃过的苦都是值得,总结一下自己的复习经历,希望对大家复习有帮助。首先我想先强调一下专业课…

嵌入式学习第十一天

1.数组和指针的关系: 1.一维数组和指针的关系: int a[5] {1, 2, 3, 4, 5}; int *p NULL; p &a[0]; p a; 数组的数组名a是指向数组第一个元素的一个指针常量 a &a[0] a 的类型可以理解为 int * 有两种情况除…

《动手学深度学习(PyTorch版)》笔记4.4

注:书中对代码的讲解并不详细,本文对很多细节做了详细注释。另外,书上的源代码是在Jupyter Notebook上运行的,较为分散,本文将代码集中起来,并加以完善,全部用vscode在python 3.9.18下测试通过。…

SpringBoot自定义全局异常处理器

文章目录 一、介绍二、实现1. 定义全局异常处理器2. 自定义异常类 三、使用四、疑问 一、介绍 Springboot框架提供两个注解帮助我们十分方便实现全局异常处理器以及自定义异常。 ControllerAdvice 或 RestControllerAdvice(推荐)ExceptionHandler 二、…

软件设计师——计算机网络(四)

📑前言 本文主要是【计算机网络】——软件设计师——计算机网络的文章,如果有什么需要改进的地方还请大佬指出⛺️ 🎬作者简介:大家好,我是听风与他🥇 ☁️博客首页:CSDN主页听风与他 &#x1…

架构整洁之道-设计原则

4 设计原则 通常来说,要想构建一个好的软件系统,应该从写整洁的代码开始做起。这就是SOLID设计原则所要解决的问题。 SOLID原则的主要作用就是告诉我们如何将数据和函数组织成为类,以及如何将这些类链接起来成为程序。请注意,这里…

chroot: failed to run command ‘/bin/bash’: No such file or directory

1. 问题描述及原因分析 在busybox的环境下,执行 cd rootfs chroot .报错如下: chroot: failed to run command ‘/bin/bash’: No such file or directory根据报错应该rootfs文件系统中缺少/bin/bash,进入查看确实默认是sh,换成…

vertica10.0.0单点安装_ubuntu18.04

ubuntu的软件包格式为deb,而rpm格式的包归属于红帽子Red Hat。 由于项目一直用的vertica-9.3.1-4.x86_64.RHEL6.rpm,未进行其他版本适配,而官网又下载不到vertica-9.3.1-4.x86_64.deb,尝试通过alian命令将rpm转成deb,但…

【GitHub项目推荐--30 天学会XXX】【转载】

30 天学会 React 这个项目是《30 天 React 挑战》,是在 30 天内学习 React 的分步指南。它需要你学习 React 之前具备 HTML、CSS 和 JavaScript 知识储备。 除了 30 天学会 React,开发者还发布过 30 天学会 JavaScript 等项目。 开源地址:…

解读BEVFormer,新一代CV工作的基石

文章出处 BEVFormer这篇文章很有划时代的意义,改变了许多视觉领域工作的pipeline[2203.17270] BEVFormer: Learning Birds-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers (arxiv.org)https://arxiv.org/abs/2203.17270 BEV …

数论Leetcode204. 计数质数、Leetcode858. 镜面反射、Leetcode952. 按公因数计算最大组件大小

Leetcode204. 计数质数 题目 给定整数 n &#xff0c;返回 所有小于非负整数 n 的质数的数量 。 代码 class Solution:def countPrimes(self, n: int) -> int:if n < 2:return 0prime_arr [1 for _ in range(n)]prime_arr[0], prime_arr[1] 0, 0ls list()for i in…

链表--102. 二叉树的层序遍历/medium 理解度C

102. 二叉树的层序遍历 1、题目2、题目分析3、复杂度最优解代码示例4、适用场景 1、题目 给你二叉树的根节点 root &#xff0c;返回其节点值的 层序遍历 。 &#xff08;即逐层地&#xff0c;从左到右访问所有节点&#xff09;。 示例 1&#xff1a; 输入&#xff1a;root […

Django开发_20_form表单前后端关联(2)

根据上一篇文章的代码,进一步了解掌握GET,POST的运行机制 一、实例代码 views.py: def show_reverse(request):if request.method "GET":return redirect(reverse("work4:fill"))if request.method "POST":hobby request.POST.get("h…

Android Studio离线开发环境搭建

Android Studio离线开发环境搭建 1.下载离线和解压包2.创建工程3.创建虚拟机tips 1.下载离线和解压包 下载地址 百度网盘&#xff1a;https://pan.baidu.com/s/1XBPESFOB79EMBqOhFTX7eQ?pwdx2ek 天翼网盘&#xff1a;https://cloud.189.cn/web/share?code6BJZf2uUFJ3a&#…

Apache SeaTunnel 数据集成插件开发最新经验总结!

在Apache SeaTunnel的最新插件开发中&#xff0c;connector-v2 maxcompute 连接器实现了基于CatalogTable SaveMode的新版本。 本文主要给大家分享了源端的关键改动包括弃用了过时的方法&#xff0c;改为通过CatalogTable实现数据传递。汇端则增加了对multi-table sink和save…

HTML+JavaScript-04

JavaScript中的循环 for语句 一个for循环会一直执行&#xff0c;直到循环条件为false for(let i0; i<array.length-1; i){//当遍历完数组后结束循环console.log(array[i] "<br/>");//循环语句 }do...while语句 do...while 语句一直重复直到指定的条件求…

深入理解Redis:如何设置缓存数据的过期时间及其背后的机制

目录 Redis 给缓存数据设置过期时间 Redis是如何判断数据是否过期的呢&#xff1f; 过期的数据的删除策略 Redis 内存淘汰机制 Redis 给缓存数据设置过期时间 一般情况下&#xff0c;我们设置保存的缓存数据的时候都会设置一个过期时间。为什么呢&#xff1f; 因为内存是有…