华南农业大学|图像处理与分析技术综合设计|题目解答:定位数显区域并分离电表数字

news2025/1/23 9:26:52

设计任务

图 28 是一幅正在运行的数字电表图像(ipa28.jpg),试采用图像处理与分析

技术,设计适当的算法和程序,找出电表的数显区域,计算目标区域的长宽比

和像素面积;并提取其中面积最大的 6 个数字字符。请按统一要求写出算法原

理、设计流程,并完成程序测试与分析等内容。

算法设计

解题思路

运用阈值分割、开运算、取反等方法,使图像只剩下液晶显示屏上的数字和背景作为连通域;运用膨胀,使液晶显示屏上的每个数字都合成独立的一个连通域。之后只需找最小的6个连通域即可提取出数字。

设计方案说明

先把图片转换为灰度图G,再进行阈值分割,条件为强度>200,得到二值图BW。此时液晶显示屏上数字区域的像素值都是0,使用较大阈值作用于bwareaopen函数(可以去掉小于某个面积的连通域),可以去掉一些比较亮的大区域,得到BW1。之后对BW1取反,使用小阈值作用于bwareaopen函数,去掉一些比较暗的区域,得到BW2。还有一些区域和数字的亮度接近,但是又比最小的数字的一部分(数字1的上部)大,所以进行膨胀操作,使数字连通成一个整体,得到BW3。再进行开运算,可以去掉不关心的区域,得到得到只有6个数字以及数显区域外面构成的7个连通域的BW4。将取反后的BW4作用于regionprops函数,可以得到数显区域的边界框,通过函数返回的结构体里Area、BoundingBox属性,可以得到包围区域的面积以及计算出长宽比。然后将BW4应用于bwlabel,提取出表示数字的连通区域即可。

关键算法的设计原理

阈值分割:数显屏幕较亮,对于灰度图,取强度>某较大值进行阈值分割,可以在液晶屏中清楚分割数字、字符与屏幕,同时可以去掉一些强度为阈值以下的元素。

开运算:各个连通域组成的像素面积有差异,可以通过取反操作灵活进行以面积为阈值的开运算,去除不关心元素。

膨胀:对于液晶屏上显示的数字字符,其类似于七段数码管,“每段数码管”之间间隙小,可以选取适当大小的方形结构元素,膨胀使得“每段数码管”相连。

计算长宽比(宽高比):使用工具函数返回的长与宽(宽与高)计算。

算法步骤

图1

算法步骤如图1,与程序流程完全一致。

程序设计

算法名称:阈值分割、开运算、取反、膨胀、边界框包围连通域、连通域分析

工具函数

阈值分割:I_gray > 200,其中I_gray为原图像经灰度转换得到的灰度图。

开运算:bwareaopen。作用是去掉像素面积为某个阈值以下的连通域。

取反:~。

膨胀:strel函数和imdilate函数。

边界框包围连通域:regionprops。返回stats的BoundingBox字段中有四个属性,依次是矩形框左上角y坐标、矩形框左上角x坐标、矩形框宽(即题目中的长)、矩形框高(即题目中的宽)。

连通域分析:使用bwlabel函数,返回连通域的标签L和连通域总数num。

设计分析符合题目要求。使用matlabr2020b版本。由于使用算法简单有效步骤少,时间复杂度O(I),空间复杂度O(I)(I为给定图像素数目),系统性能良好。

测试分析:

图2

图2从左到右,为原图→灰度图→阈值分割后图(阈值200)。

图3

图3从左到右,分别为开运算后图(阈值5000)→取反后开运算图(阈值255)→腐蚀后图(结构元素取12*5的矩形)→开运算后图(阈值1000)。

图4

图4为识别到数显区域的框图,准确度高。

图5

图5为各连通区域标注图。可看出图中有7个连通区域,取6个较小的连通区域,保存输出如图6~图11。满足要求。

  

                                             图6                                                     图7

  

                                             图8                                                     图9

  

                                             图10                                                     图11

图12

图12为数显区域长宽比和像素面积的结果,满足要求。

特点和优势:算法简单有效。

存在的问题和不足:边界框识别没有完全框住数显区域,可以使用透视变换优化。

代码

clc,clear

%% step1 -- 预处理
I = imread('ipa28.jpg');  
I_gray = rgb2gray(I);  
BW = I_gray > 200; % 阈值分割

%% step2 -- 开运算,去除不关心的元素
BW1 = bwareaopen(BW, 5000);  % 假设小于5000像素的物体为噪声
BW2 = bwareaopen(~BW1,255);

%% step3 -- 膨胀图像,使数码管显示的数字成为一个整体
SE = strel('rectangle',[12,5]);
BW3 = imdilate(BW2, SE);

%% step4 -- 开运算,再次去除不关心的元素
BW4 = bwareaopen(BW3, 1000);

%% step5 -- 用边界框包围数显区域,得到像素面积计算边界框的宽高比并输出
stats = regionprops(~BW4, 'BoundingBox', 'Area');
bbox = stats.BoundingBox;
area = stats.Area;
aspect_ratio = bbox(3) / bbox(4);
disp("数显区域长宽比:"+num2str(aspect_ratio));
disp("数显区域面积:"+num2str(area));

%% step6 -- 对数显区域应用连通域分析,找到所有的数字字符
[L, num] = bwlabel(BW4); % 找到所有的连通区域,并用不同的标签表示
RGB = label2rgb(L); % 将标签转换为颜色图像

for k = 2:num
    BW_k = (L == k); % 提取第k个连通区域的像素
    imwrite(BW_k, sprintf('digit%d.png', k-1)); % 保存图像
end

%% 
figure(1),subplot(131),imshow(I);title("原图");
subplot(132),imshow(I_gray);title("灰度图");
subplot(133),imshow(BW);title("阈值分割后图");

%%
figure(2),subplot(141),imshow(BW1);title("开运算");
subplot(142),imshow(BW2);title("取反后开运算");
subplot(143),imshow(BW3);title("经过膨胀");
subplot(144),imshow(BW4);title("继续开运算");

%% 画出边界框
figure(3),imshow(I);
hold on;
rectangle('Position', [bbox(1),bbox(2),bbox(3),bbox(4)], ...
    'EdgeColor','r','LineWidth',2); % 绘制边界框
hold off;

%% 显示连通区域
figure(4),imshow(RGB); % 显示连通区域

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/748311.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

免费的云数据库:探索PlanetScale,划分分支的MySQL Serverless平台

最近我发现了一个非常有趣的国外MySQL Serverless平台,它叫做PlanetScale。这个平台不仅仅是一个数据库,它能像代码一样轻松地创建开发和测试环境。你可以从主库中拉出一个与之完全相同结构的development或staging数据库,并在这个环境中进行开…

使用Pycharm

本人没有单独安装python,而是直接安装了anaconda 使用Pycharm创建项目 项目取名为HelloWorld,环境使用前面安装的anaconda pycharm安装模块的方法: 打开Pycharm>File > Settings>Project: Python>Project Interpreter

面试题更新之-hook中setState原理

文章目录 hook是什么?hook中setState原理 hook是什么? 在React中,Hook是一种用于在函数组件中添加状态和其他React特性的函数。它们被引入到React 16.8版本中,旨在解决使用类组件编写复杂逻辑时出现的一些问题。 使用Hook&#…

Redis的哨兵机制

Redis的哨兵机制是一套独立的模式,哨兵可看作是一个独立的进程,该进程发送命令,等待Redis的响应,达到监控Redis服务的作用。 如果在规定的时间内,接收不到Redis服务器的响应,那就说明Redis出现了问题&…

通用文字识别OCR 之实现自动化办公

摘要 随着技术的发展,通用文字识别(OCR)已经成为现代办公环境中不可或缺的工具之一。OCR技术可以将印刷或手写文本转换为可编辑或可搜索的数字文本,极大地提高了办公效率并实现了自动化办公。本文将深入探讨OCR技术在实现自动化办…

Promise的理解和使用(从入门到精通)

Promise的理解和使用 1.1Promise是什么 1、抽象表达 Promise是一门新的技术(ES6规范)Promise是JS进行异步编程的新解决方案(旧方案是单纯的使用回调函数) 2、具体表达: 从语法上来说:Promise是一个构造…

C++—C++程序基础

文章目录 1 数据类型1.1 基本数据类型1.2 字面值常量1.3 左值和右值1.4 引用与指针 2 基本输入输出2.1 输出2.2 输入 3 函数3.1 内联函数3.2 函数的重载 1 数据类型 1.1 基本数据类型 在C中,除了C语言中的int,char,float,double…

小程序主包超1.5MB分包处理流程优化方案

"subPackages": [// 分包1 {"root": "src, // 根目录"pages": [{"path": "views/business/index", // 页面路径"name": "business_index","aliasPath": "/business/index",&…

2023年9月广州/重庆/长沙/深圳DAMA-CDGA/CDGP认证考试报名

据DAMA中国官方网站消息,2023年度第三期DAMA中国CDGA和CDGP认证考试定于2023年9月23日举行。 报名通道现已开启,相关事宜通知如下: 考试科目: 数据治理工程师(CertifiedDataGovernanceAssociate,CDGA) 数据治理专家(CertifiedDataGovernanc…

浅析神经网络模型算法在手写文字识别中的重要作用

神经网络模型是什么?与OCR有何不同? 神经网络模型是一种机器学习算法,用于对数据进行模式识别和预测,可应用于各种任务包括图像识别、自然语言处理等。而OCR(Optical Character Recognition)是一种特定的应…

我在阴影之中 - InsCode Stable Diffusion 美图活动一期

写在前面:博主是一只经过实战开发历练后投身培训事业的“小山猪”,昵称取自动画片《狮子王》中的“彭彭”,总是以乐观、积极的心态对待周边的事物。本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域,如今终有小成…

第24章:事务基础知识

一、数据库事务Transactions 1.为什么要使用事务 事务可以让数据库保持一致性,通过事务的机制恢复到某个时间点,即使系统崩溃数据库修改的数据不会丢失。 2.存储引擎支持事务的情况 命令: show engines; 只有InnoDB支持事务 3.事务基本概念 事务&a…

【第四章 flutter学习之flutter基础组件】

文章目录 一、目录结构二、创建一个flutter项目三、创建自定义组件四、Container组件 就是divalignment 内容对齐方式decoration 类似border 为BoxDecoration的类 五、Text属性六、image组件六、icon组件总结、 一、目录结构 android、ios各自平台的资源文件 lib 项目目录 linu…

今天给大家分享两款实用的软件

在现代社会中,我们越来越依赖各种各样的软件来提高效率、获得信息和享受娱乐。所以,今天我将与大家分享两款我个人常用且非常实用的软件,一起来看看吧。 人工桌面: 人工桌面是一款备受欢迎的动态桌面壁纸软件,它为我们…

webRTC实现P2P音视频通话(无服务端)

文章目录 先看效果视频对话源码htmlvue2 音频对话源码遇到问题解决方案 先看效果 视频对话源码 html 虽然是vue项目&#xff0c;但是我写在了主页的index页面&#xff0c;仅仅为了测试&#xff0c; <!DOCTYPE html> <html lang"en"> <head><me…

mysql练习---备份/索引/视图

目录 一、备份与还原 二、索引 三、视图 一、备份与还原 CREATE DATABASE booksDB; use booksDB;CREATE TABLE books ( bk_id INT NOT NULL PRIMARY KEY, bk_title VARCHAR(50) NOT NULL, copyright YEAR NOT NULL );INSERT INTO books VALUES (11078, Learning MySQL, 2…

springboot mybatis 双数据库 多数据源

1. 依赖 mybatis相关&#xff1a; <dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-boot-starter</artifactId><version>3.4.2</version> </dependency> <dependency><groupId>com.baomid…

【socket编程】TCP服务器、UDP服务器、本地套接字【C语言代码实现】

目录 0. 准备知识 0.1 大小端概念 0.2 网络字节序和主机字节序的转换 0.3 点分十进制串转换&#xff08;IP地址转换函数&#xff09; 0.4 IPV4结构体&#xff1a;&#xff08;man 7 ip&#xff09; 0.5 IPV6套接字结构体&#xff1a;&#xff08;man 7 ipv6&#xff09; …

IllegalStateException,BeanCreationException报错解决

报错解决 but cannot be delegated to target bean. Switch its visibility to package or protected.

Java反射-反射API、类加载过程

反射 Java反射API是Java语言实现动态性的关键&#xff0c;它允许动态的创建对象、赋值、以及调用对象的方法&#xff0c;同时反射也是实现动态代理的关键&#xff0c;涉及到反射相关的几个类主要有 Class、ClassLoader&#xff0c;Field、Method、Constructor、Proxy等。因为在…