opencv-python图像增强十一:文档阴影去除

news2024/12/26 11:22:28

文章目录

  • 一,简介
  • 二,方案简述
  • 三,算法实现流程:
    • 3.1 闭运算提取背景:
    • 3.2 背景减除获取文字
  • 四,整体代码:
  • 五,效果:


一,简介

图像阴影是光学现象的一种,当物体遮挡光源时,光源无法直接照射到被遮挡的区域,这导致该区域的亮度低于周围未被遮挡的区域。在数字图像中,阴影通常表现为亮度较低的区域,与周围亮度较高的区域形成明显的对比。
在本项目中,我们将介绍一种用于去除文档图像中阴影的方法。这种方法旨在识别并修正由于光源遮挡而产生的低亮度区域,从而提高图像的整体质量和后续处理的准确性。通过应用特定的图像处理技术,我们可以有效减轻阴影对图像内容的影响,使得文档图像中的文本和其他关键信息更加清晰可见。

二,方案简述

去除文档中的阴影,其核心思想在于将文字与阴影背景区分开来。这一过程只需从原始图像中减去背景部分,便能获得无阴影的清晰文字区域。具体算法流程如下:首先,读取原始灰度图像并进行缩放处理;其次,应用形态学闭运算以清除图像中的噪声和细小元素;随后,通过背景减除和取反步骤来提取前景文字;然后,对提取的前景图像进行归一化,以确保像素值的准确性;最终,展示原始图像以及经过处理的图像,以供对比观察。

三,算法实现流程:

3.1 闭运算提取背景:

通过图像闭运算来将文字区域填充,以此得到带有阴影的背景
实现代码:

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (N, N))
# 应用开运算,以去除图像中的噪声和细小对象
B = cv2.morphologyEx(I, cv2.MORPH_CLOSE, kernel)

3.2 背景减除获取文字

通过cv2.absdiff函数对图像与求得的背景进行绝对值相减,相减完成的效果为白底黑字,将图像反转后归一化映射为0-255的图像即可获取文字区域
实现代码:

    # 计算前景图像 O,即 I 和 B 的绝对差值
    O = cv2.absdiff(I, B)
    # 对前景图像进行取反操作
    O = cv2.bitwise_not(O)
    # 创建一个与 O 相同大小的全零数组,用于归一化处理
    norm_img = np.zeros_like(O)
    # 显示原始的前景图像 O
    cv2.imshow("O", O)
    # 对 O 进行归一化处理,使其像素值在 0 到 255 之间
    cv2.normalize(O, norm_img, 0, 255, cv2.NORM_MINMAX)

四,整体代码:

import cv2  # 导入OpenCV库
import numpy as np  # 导入NumPy库
# 定义背景减除函数
def background_subtraction(I, B):
    # 计算前景图像 O,即 I 和 B 的绝对差值
    O = cv2.absdiff(I, B)
    # 对前景图像进行取反操作
    O = cv2.bitwise_not(O)
    # 创建一个与 O 相同大小的全零数组,用于归一化处理
    norm_img = np.zeros_like(O)
    # 显示原始的前景图像 O
    cv2.imshow("O", O)
    # 对 O 进行归一化处理,使其像素值在 0 到 255 之间
    cv2.normalize(O, norm_img, 0, 255, cv2.NORM_MINMAX)
    # 返回归一化后的前景图像
    return norm_img
# 定义处理图像的函数
def deal_img(N, I):
    # 创建一个 N x N 的矩形结构元素
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (N, N))
    # 应用开运算,以去除图像中的噪声和细小对象
    B = cv2.morphologyEx(I, cv2.MORPH_CLOSE, kernel)
    # 进行背景减除操作
    normalised_img = background_subtraction(I, B)
    # 返回归一化后的图像
    return normalised_img
# 读取原始图像 P
P = cv2.imread(r'F:\traditional_vison\Test_image.jpg', 0)  # 读取灰度图像
P = cv2.resize(P, (0, 0), fx=0.3, fy=0.3)  # 将图像缩放到原始大小的 0.3 倍
O_P = deal_img(N=21, I=P).astype(np.uint8)  # 处理图像并将其转换为 uint8 类型
# 显示原始图像 P 和处理后的图像 O_P
cv2.imshow("ori", P)
cv2.imshow("op", O_P)
# 等待按键后关闭所有窗口
cv2.waitKey(0)

五,效果:

原始图像:
在这里插入图片描述
去除阴影后的图像:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2054833.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从文本到向量:Weaviate在RAG中的应用案例

探索向量数据库在RAG中的应用 在自然语言处理(NLP)的领域中,向量数据库如Weaviate正变得越来越流行,因为它们为文本数据的管理和检索提供了强大的支持。特别是,它们在实现Retrieval-Augmented Generation(R…

无人机适航证取证技术详解

随着无人机技术的飞速发展和广泛应用,无人机的安全性与适航性成为了全球航空领域关注的焦点。无人机适航证作为衡量无人机是否符合安全飞行标准的重要凭证,其取证过程涉及技术、法规、测试等多个方面。本文旨在深入解析无人机适航证取证技术,…

算法的学习笔记—顺时针打印矩阵(牛客JZ29)

😀前言 在算法的学习过程中,二维数组的操作是一个非常重要的内容,其中顺时针打印矩阵是一个经典的问题。这个问题不仅考察我们对矩阵的理解,还要求我们具备较强的逻辑思维能力。本文将详细解析如何通过Java代码来实现这一功能。 &…

SpringBoot响应式编程(3)R2DBC

一、概述 1.1简介 R2DBC基于Reactive Streams反应流规范,它是一个开放的规范,为驱动程序供应商和使用方提供接口(r2dbc-spi),与JDBC的阻塞特性不同,它提供了完全反应式的非阻塞API与关系型数据库交互。 …

c++进阶——继承的定义,复杂的菱形继承及菱形虚拟继承

目录 前言: 1.继承的概念及定义 1.1继承的概念 1.2 继承定义 1.2.2继承关系和访问限定符 1.2.3继承基类成员访问方式的变化 2.基类和派生类对象赋值转换 3.继承中的作用域 4.派生类的默认成员函数 5.继承与友元 6. 继承与静态成员 7.复杂的菱形继承及菱…

AIoT智能物联网平台定义

随着科技的飞速发展,我们正步入一个由智能设备和互联网络构成的新时代。AIoT,即人工智能物联网(Artificial Intelligence of Things),是这个时代的标志性产物。本文旨在探讨AIoT智能物联网平台的定义、核心组件、应用场…

wordpress站群搭建6外部库的引入和测试

wordpress站群搭建6wordpress外部库的引入和测试 本次目标我们主要讲解引入wordpress外部库并测试。 我们将一些外部库和工具包放入到pkg项目,方便其他项目引用。 1.安装go-wordpress库 进入到pkg项目 go get github.com/robbiet480/go-wordpress2.编写工具类 …

22 交换机双工模式

交换机双工模式 一、双工模式 (一)单工、半双工、全双 ​ 单工: ​ 只有一个信道,传输方向只能是单向的 ​ 半双工: ​ 只有一个信道,在同一时刻,只能是单向传输 ​ 全双工: …

【JavaEE】深入MyBatis:动态SQL操作与实战项目实现指南

目录 MyBatis的进阶操作动态SQL<if>标签<trim>标签<where>标签<set>标签<foreach>标签<include>标签 练习表白墙数据准备引⼊MyBatis 和 MySQL驱动依赖配置MySQL账号密码编写后端代码测试 图书管理系统数据库表设计引⼊MyBatis 和MySQL 驱…

阿里QuickBI实战

目录 引言数据采集、数据治理、数据分析举例资金在经济社会的流通性 概述数据分析的常见问题数据分析的痛点 QuickBI 产品架构图主功能链路数据建模与数据分析的关系使用场景1、搭建报表看板&#xff1a;仪表盘2、中国式报表工具&#xff1a;电子表格3、企业CXO驾驶舱&#xff…

网络工程3(子网通信,为什么要使用mac和ip)

文章目录 一. 子网如何通讯1. 子网内部通信2. 子网外部通信 二. 交换机和路由器的连接三. 为什么不只使用mac地址或ip地址进行网络通信1. 首先要明确的是&#xff0c;不管是只用mac或只用ip通信 四. 子网设备如何获得ip五. 不同网段的主机无法直接通信的原因 一. 子网如何通讯 …

GAMES101——作业7 路径追踪 (含提高:多线程,微平面理论)

任务 castRay(const Ray ray, int depth)in Scene.cpp: 在其中实现 Path Tracing 算法 可能用到的函数有&#xff1a; intersect(const Ray ray)in Scene.cpp: 求一条光线与场景的交点 sampleLight(Intersection pos, float pdf) in Scene.cpp: 在场景的所有光源上按面积…

用 CWE API 减轻软件产品中的安全风险

1. CWE REST API 推出的目的 8 月 8 号&#xff0c;CWE™ 计划推出了“CWE REST API”。 CWE™计划由美国网络安全与基础设施安全局(Cybersecurity & Infrastructure Security Agency(CISA))资助的国土安全系统工程与发展研究所(Homeland Security Systems Engineering a…

AutoSAR SecOC小小科普

目录 1.为什么要提SecOC 2.SecOC基本原理 2.1 参与到MAC计算的数据有哪些 2.2 新鲜度值如何管理 3.SecOC与各模块关联关系 1.为什么要提SecOC 在车载网络技术里&#xff0c;大家基本都是从CAN开始入门。在CAN DBC里&#xff0c;我们总能看到有些报文除了自带有效payload外…

AWS 消息队列服务 SQS

AWS 消息队列服务 SQS 引言什么是 SQSSQS 访问策略 Access Policy示例&#xff1a;如何为 DataLake Subscription 配置 SQS 引言 应用系统需要处理海量数据&#xff0c;数据发送方和数据消费方是通过什么方式来无缝集成消费数据的&#xff0c;AWS 提供 SQS 消息队列服务来解决…

42000 Star图标工具Mermaid!

Mermaid&#xff1a;用文本构建图表世界 - 精选真开源&#xff0c;释放新价值。 概览 Mermaid.js 是一个创新的开源工具&#xff0c;专为简化图表创建流程而设计。它通过一种简洁的文本描述语言&#xff0c;使得用户能够快速地生成流程图、序列图、甘特图等图表&#xff0c;而…

【威锋网-注册安全分析报告-无验证方式导致安全隐患】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 1. 暴力破解密码&#xff0c;造成用户信息泄露 2. 短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉 3. 带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造…

JavaEE过滤器的创建与使用过滤器的使用场景

过滤器 Filter也称之为过滤器&#xff0c;过滤器是javaEE规范肿定义的一种技术,可以让请求到达目标servlet之前,先进入到过滤器中,在过滤器中统一进行一些拦截处理,当处理完成后,可以继续向后执行,到达目标servlet,如果配置了多个过滤器,也可以进入下一个过滤器 创建过滤器 创…

一键更换Linux优质的软件源和docker源 —— 筑梦之路

一个非常牛逼的开源项目&#xff1a;https://github.com/SuperManito/LinuxMirrors.git LinuxMirrors 使换源更简单 - LinuxMirrors 支持的操作系统 系统名称适配版本Debian8.0 ~ 13Ubuntu14.04 ~ 24Kali Linux2.0 ~ 2024Linux Mint19.0 ~ 21 / LMDE 6DeepinallArmbianallP…

Redis7基础篇(一)

redis十大数据类型 目录 redis十大数据类型 redis键key 数据类型命令 redis字符串string 分布式锁 ​编辑 ​编辑​编辑应用场景 ​编辑​编辑 reids列表list 应用场景 redis哈希hash 应用场景 redis集合set 应用场景 redis有序集合zset&#xff08;sorted set集…