OpenCV实现提取水平线和垂直线,提取验证码

news2024/10/5 19:16:44

1.提取水平线和垂直线

在之前的博客中,我们介绍了很多形态学操作。其中,膨胀与腐蚀操作可以使用任意的结构元素,例如矩形、圆、直线等各种自定义形状。

提取水平线和垂直线的具体步骤见下:

1.1.步骤一:读入原始图像

使用imread函数读入原始图像:

1.2.步骤二:转换为灰度图像

使用cvtColor函数将原始图像转换为灰度图像:

当然,也可以直接通过修改imread的参数直接将原始图像转换成灰度图像读进来。具体请见:【OpenCV基础】第二课:加载、修改、保存图像。

1.3.步骤三:转换为二值图像

这一步我们需要使用一个新的API:adaptiveThreshold

该API的参数说明:

 
1
2
3
4
5
6
7
8
9
void adaptiveThreshold(
	InputArray src,
	OutputArray dst,
	double maxValue,
	int adaptiveMethod,
	int thresholdType,
	int blockSize,
	double C
);
  1. InputArray src是输入图像。
  2. OutputArray dst是输出图像。
  3. double maxValue用于计算第5个参数。
  4. int adaptiveMethod是阈值的计算方法,同样也用于计算第5个参数。有两种方式:
    • ADAPTIVE_THRESH_MEAN_C:阈值等于blockSize内像素的平均值减去第7个参数C
    • ADAPTIVE_THRESH_GAUSSIAN_C:阈值等于blockSize内像素的高斯均值(即高斯加权的均值)减去第7个参数C
  5. int thresholdType是图像的转换方式。有八种方式:THRESH_BINARYTHRESH_BINARY_INVTHRESH_TRUNCTHRESH_TOZEROTHRESH_TOZERO_INVTHRESH_MASKTHRESH_OTSU以及THRESH_TRIANGLE。这里只介绍涉及二值图像转换的两种方法,其中dst(x,y)为输出图像(x,y)

点的像素值,src(x,y)为输入图像(x,y)点的像素值,T(x,y)为(x,y)

  1. 点的阈值(由参数4获得),maxValue由参数3获得:

  2. int blockSize为正奇数,用法见参数4。
  3. double C用法见参数4,可以为正数、0、负数。

我们尝试将得到的灰度图像通过adaptiveThreshold 转换为二值图像:

 
1
adaptiveThreshold(gray1, binary1, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 15, -2);

发现我们要提取的水平线和垂直线旁边有很宽的白条,会影响到我们的提取效果,因此我们需要先对灰度图像做个取反操作,即~gray1

 
1
adaptiveThreshold(~gray1, binary1, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 15, -2);

再来看下效果:

~通过位运算对图像进行取反操作。例如对于灰度图像来说,像素值的类型是unsigned char,即八位无符号二进制数。假设像素值是2,其反码为0000 0010,按位取反得到~21111 1101,因为是无符号数,所以该二进制数对应的十进制数为253,即255-2。

bitwise_not也是通过位运算进行取反操作,效果等同于~

1.4.步骤四:定义结构元素

使用getStructuringElement定义我们所需的结构元素。

用于提取水平线的结构元素:

 
1
Mat hline = getStructuringElement(MORPH_RECT, Size(src.cols / 16, 1), Point(-1, -1));

用于提取垂直线的结构元素:

 
1
Mat vline = getStructuringElement(MORPH_RECT, Size(1, src.rows / 16), Point(-1, -1));

1.5.步骤五:执行开操作

然后我们通过执行开操作来提取水平线和垂直线。

提取水平线:

提取垂直线:

2.提取验证码

基于第1部分的内容,我们来处理验证码图片中的干扰项。例如要处理的验证码图片见下:

我们依然按照1.1~1.5这5个步骤来处理这张图片。但是我们需要稍作修改。

针对第四步,我们这次使用矩形的结构元素:

 
1
Mat kernel=getStructuringElement(MORPH_RECT,Size(3,3),Point(-1,-1));

使用矩形结构元素的好处在于可以帮助我们去除各种线段(不局限于水平线或者垂直线),并且也可以去除图片中的散点。

此外,对最终提取得到的图像做了取反操作,使其看起来更顺眼一点:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/526736.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

提速YOLOv7:用MobileNetV3更换骨干网络加速目标检测

目录 前言一、MobileNetV3的介绍1、MobileNetV3的原理和特点2、MobileNetV3的结构 二、YOLOv7的介绍1、YOLOv7的结构和流程2、YOLOv7的性能指标 三、MobileNetV3替换YOLOv7的骨干网络1、替换骨干网络2、修改neck部分3、微调模型 四、实验结果与分析1、数据集和实验设置2、实验结…

【Prompting】ChatGPT Prompt Engineering开发指南(3)

ChatGPT Prompt Engineering开发指南3 总结文字使用单词/句子/字符限制进行总结以运输和交付为重点进行总结以价格和价值为重点进行总结 尝试“extract”而不是“summarize”总结多个产品评论内容来源 本文承接上文:ChatGPT Prompt Engineering开发指南2&#xff0c…

RK3588平台开发系列讲解(进程篇)图解linux netlink

平台内核版本安卓版本RK3588Linux 5.10Android 12文章目录 一、netlink协议簇二、netlink初始化沉淀、分享、成长,让自己和他人都能有所收获!😄 📢 netlink 协议是一种进程间通信(Inter Process Communication,IPC)机制,为的用户空间和内核空间以及内核的某些部分之间…

解决FTD2000 麒麟系统下计算机属性中显示的内存比实际内存少

FTD2000 麒麟系统下计算机属性中显示的内存比实际内存少,首先确认问题点,判断是飞腾D2000的bios问题,还是麒麟系统问题 可以用如下方式做出判断 1、D2000 log打印进入shell 后 exit 在弹出来的界面中选 bios set 选项、进入bios 设置界面,如下图 可以看到 bios 下,Tota…

总结851

每周小结 英语背了3篇文章 高数一直刷关于一元积分的题目,一共150道左右,平均一天20道左右,强化课看到第2讲数列。 每日必复习(5分钟) 线性代数 向量组 学习内容: 暴力英语:继续背诵《The kin…

YOLOv5:解读yolo.py

YOLOv5:解读yolo.py 前言前提条件相关介绍yolo.pyparse_model()函数Detect类Model类 参考 前言 记录一下自己阅读yolo.py代码的一些重要点,方便自己查阅。特别感谢,在参考里,列举的博文链接,写得很好,对本人…

康耐视智能相机insight主从触发以及康耐视insight视觉系统之间数据特有交互方式

1、一个相机设置为主系统,指定自己的名称,下方可以指定发给从系统的数据,触发方式不要设置 成网络 2、另外一个相机触发方式设置成网络,然后下方指定主系统的名称 3、主系统每触发一次,就会带动从系统触发,同时指定的数据会发送到从系 统,从系统使用函数getstring获取…

【数据结构】图的创建和深度(DFS)广度(BFS)优先遍历

一、图 1.图的概念 图是由顶点的有穷非空集合和顶点之间边的集合组成,通过表示为G(V,E),其中,G标示一个图,V是图G中 顶点的集合,E是图G中 边的集合。 2.图的种类 图分为无向图和有向图 无向图:若顶点V…

用于OOD预测的稳定学习

当测试数据和训练数据共享相似的分布时,基于深度神经网络的方法取得了惊人的性能,但在其他情况下可能会失败。因此,消除训练和测试数据之间分布变化的影响对于构建有前景的深度模型至关重要。作者考虑了一个更具挑战性的情况。通过训练样本的…

大数据Doris(二十一):Bloom Filter索引以及Doris索引总结

文章目录 Bloom Filter索引以及Doris索引总结 一、Bloom Filter索引 1、BloomFilter索引原理 2、BloomFilter索引语法 3、注意事项 二、Doris索引总结 Bloom Filter索引以及Doris索引总结 一、Bloom Filter索引 1、BloomFilter索引原理 BloomFilter是由Bloom在1970年提…

移动机器人运动规划---基于图搜索的基础知识---广度优先遍历与深度优先遍历

移动机器人运动规划---基于图搜索的基础知识---广度优先遍历与深度优先遍历 广度优先搜索(BFS)深度优先搜索(DFS)BFS vs DFS 图搜索优化的方向就是: 按照什么规则去访问节点,按照什么规则弹出节点&#xff…

快速了解 TypeScript

目录 1、简介 2、安装TypeScript 3、编译代码 4、类型注解 5、接口 6、类 7、运行TypeScript Web应用 1、简介 TypeScript是JavaScript类型的超集,它可以编译成纯JavaScript。 TypeScript可以在任何浏览器、任何计算机和任何操作系统上运行,并且…

【哈士奇赠书活动 - 23期】-〖你好 ChatGPT〗

文章目录 ⭐️ 赠书 - 《你好 ChatGPT》⭐️ 内容简介⭐️ 作者简介⭐️ 精彩书评⭐️ 赠书活动 → 获奖名单 ⭐️ 赠书 - 《你好 ChatGPT》 ⭐️ 内容简介 人工智能(AI)时代已经来临,AIGC(人工智能生成内容)正在进一步…

【精选】各种节日祝福(C语言,可修改),Easyx图形库应用+源代码分享

博主:命运之光✨✨ 专栏:Easyx图形库应用📂 目录 ✨一、程序展示 范例一:❤新年祝福❤ 范例二:❤母亲节祝福❤ ✨二、项目环境 简单介绍一下easyx图形库应用 Easyx图形库 ✨三、运行效果展示(视频&am…

【C++起飞之路】初级——缺省参数、函数重载、引用

C:函数重载、引用 一、缺省参数🛫1.1 🚝什么是缺省参数1.2 🚝缺省参数的分类a. 全缺省参数b. 半缺省参数(部分缺省参数) 1.3 🚝注意事项 二、函数重载🛫2.1 🚝什么是函数…

时间复杂度:根号n一般来说大于log(n)

f ( x ) x − l o g 2 x f(x)\sqrt{x}-log_2 x f(x)x ​−log2​x 对这函数求导后,比较分母大小,可以得到结论 f ( x ) f(x) f(x)先减后增,分界点为 x 4 ( l n 2 ) 2 x \frac{4}{(ln2)^2} x(ln2)24​ f ( x ) f(x) f(x)的图像如下所示&a…

PPT技能之文字格式,转身的文字这样做

只要用PPT,一定需要设置文字格式。好的文字格式,给人惊艳的感觉,是一种愉悦的享受。 你的关注,是我最大的动力!你的转发,我的10W!茫茫人海有你的支持,给我无限动力。 1、字体。 按…

什么是Java中的阻塞队列?它有什么作用?

在Java中,阻塞队列是一种特殊的队列,它可以在队列为空或队列已满时阻塞添加或移除元素的操作。阻塞队列通常用于多线程编程中,可以帮助我们更加方便地进行线程通信和协作。在本文中,我将从面试的角度,详细讲解Java中的…

在线办公时代,如何选择合适的云办公软件?

文章目录 在线办公时代,如何选择合适的云办公软件?在线文档石墨文档腾讯文档飞书文档 远程控制ToDesk向日葵 会议协同腾讯会议ZOOM 总结 在线办公时代,如何选择合适的云办公软件? 随着数字经济的发展和疫情的影响,云办…

100天精通Python(可视化篇)——第87天:matplotlib绘制不同种类炫酷雷达图参数说明+代码实战(普通、堆叠、多个、矩阵、极坐标雷达图)

文章目录 专栏导读1. 雷达图1)介绍2)参数说明 2. 基本雷达图3. 堆叠雷达图4. 六边形战士5. 多个雷达图6. 雷达图矩阵7. 极坐标雷达图 专栏导读 🔥🔥本文已收录于《100天精通Python从入门到就业》:本专栏专门针对零基础…