【Python_Opencv图像处理框架】图像基本操作

news2025/1/23 7:23:33

写在前面

很幸运能选择Python语言进行学习,这是有关Opencv的图像处理的第一篇文章,讲解了有关图像处理的一些基础操作,作为初学者,我尽己所能,但仍会存在疏漏的地方,希望各位看官不吝指正❤️


写在中间

1. 计算机眼中的图像

计算机眼中的图像由一个个像素组成, 每个像素点的值在0-255之间,代表像素点的亮度(0为最暗,255为最亮)。

  • 灰度图(黑白图)为单通道。

  • 彩色图为三通道。彩色图像包括三个颜色通道——B,G,R,分别表示蓝、绿、红。


2. 图像的表示

图像的高和宽分别代表图像在竖直和水平方向分别有多少个像素点。也等价于每个颜色通道矩阵的维度:

彩色图像为三维数组,分别为行数(高度),列数(宽度),颜色通道;

灰度图为二维数组,分别为行数(高度),列数(宽度)。


3. 基础操作

图像的读取

文件路径:不能包含中文字符

读取模式:

cv2.IMREAD_COLOR 彩色BGR模式,忽略透明度,可以用 1代替,默认编译模式。
cv2.IMREAD_GRAYSCALE 灰度模式,可以用 0 代替,将图像转换为灰度图像。
cv2.IMREAD_UNCHANGED 输出包含alpha通道的图像,可以用 -1 代替

补充说明:

Alpha通道是指图像中的透明度信息,它可以控制像素的透明度和不透明度。对于包含alpha通道的图像,在读取时需要使用IMREAD_UNCHANGED标志来保留这些透明度信息,以便后续处理和操作。如果不使用该标志,则读取的图像将被默认处理成不包含alpha通道的普通图像。

代码示例:

#包的配置
import cv2
import matplotlib.pyplot as plt
import numpy as np


img=cv2.imread(自行复制图片路径到这里) # 注意不要使用双层引号
print(img)               #打印像素
print(img.shape)         #(高,宽,通道)

第一个print会打印出来图像矩阵,由于显示太多就不展示了,大家自己尝试看看效果;

第二个print会打印出图像的高、宽和通道数,彩色图像的通道数是3,灰度图的通道数为1


图像的显示

cv2.imshow("窗口名", 要显示的图片)

窗口名,通常是字符串类型

cv2.imshow("img",img)
cv2.waitKey(0)      #等待键盘输入,输入任意键返回
cv2.destroyAllWindows()    #关闭窗口

硬核知识:

  • waitKey()内数值若为0,则表示输入任意键后退出,若为大于0的数字,则以毫秒为单位倒计时退出。

  • 新手上路,有时会碰到图片太大显示不全的问题,这时在三行代码的前面加上cv2.namedWindow('img', cv2.WINDOW_KEEPRATIO)就能解决了

  • 这是由于上述代码默认的窗口属性为cv2.WINDOW_AUTOSIZE(按照图片大小自动调整窗口大小),则当图片尺寸小于屏幕大小时,按图片尺寸设置窗口大小,显示一个完整的图片。当图片尺寸大于屏幕大小时,窗口依旧按照图片尺寸设置,则我们的屏幕不能显示整个窗口,从而产生图片显示不全的问题


4. 截取部分图像数据(ROI)

image=img[ : , : ]

冒号前后是像素区域

截取步骤就这一行代码就能实现,例如:image=img[0:200,100:200]
再加上面的图片读取,图片显示,就能完整的看到效果了

img=cv2.imread("自行复制图像路径")
image=img[0:200,100:200]
cv2.imshow("image",image)
cv2.waitKey(0)      #等待键盘输入,输入任意键返回
cv2.destroyAllWindows()    #关闭窗口

5. 视频的读取

对于视频的处理,其实和对图像的处理是相同的,原理就是利用循环将视频拆分成一帧一帧的图像,对每一帧图像进行处理

对视频的处理主要包括如下步骤:

  1. cv2.VideoCapture() 读取摄像头画面或者视频文件,本文章使用视频文件来演示
  2. 检查是否打开成功,返回一个布尔值和一帧图像的矩阵数组
  3. 对每一帧图像进行处理
#视频格式
vc=cv2.VideoCapture("自行复制视频路径")

#检查是否打开成功
if vc.isOpened():
    open, frame = vc.read()
else:
    open = False

#逐帧处理
while open:
    ret, frame = vc.read()
    if frame is None:
        break
    if ret == True:
        #灰度处理
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)  #转换为灰度图
        cv2.imshow('result',gray)     # 将灰度图输出
        if cv2.waitKey(100) & 0xFF == 27: #处理完后每一帧的等待时间
            break
vc.release()
cv2.destroyAllWindows()

6. 边界填充

边界填充常见的有6种方法

BORDER_REPLICATE:复制法,也就是复制最边缘像素。 BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba BORDER_WRAP:外包装法abcdefgh|abcdefgh|abcdefg BORDER_CONSTANT:常量法,常数值填充,需要在设置一个value值,以显示填充的颜色。

  • 下面是一张示例图像,经过程序处理后得到的六张图像

在这里插入图片描述
在这里插入图片描述
代码示例:

img = cv2.imread("自行复制图像链接")

img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # 将BGR图片转换为RGB图片
top_size, bottom_size, left_size, right_size = (50, 50, 50, 50)  # 定义图片尺寸

replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_CONSTANT, value=0)
plt.imshow(img)  # 原图显示
plt.show()

plt.subplot(2, 3, 1), plt.imshow(img, 'gray'), plt.title('original')
plt.subplot(2, 3, 2), plt.imshow(replicate, 'gray'), plt.title('replicate')
plt.subplot(2, 3, 3), plt.imshow(reflect, 'gray'), plt.title('reflect')
plt.subplot(2, 3, 4), plt.imshow(reflect101, 'gray'), plt.title('reflect')
plt.subplot(2, 3, 5), plt.imshow(wrap, 'gray'), plt.title('wrap')
plt.subplot(2, 3, 6), plt.imshow(constant, 'gray'), plt.title('constant')

plt.show()
cv2.waitKey(0)
cv2.destroyAllWindows()

7. 图像的加法

图像的加法

**前提:**两张图像拥有相同的大小和类型,在处理时应该将两幅图像相同位置的像素的灰度值(灰度图)或彩色像素各通道值(彩色图像)分别相加。通常情况下,在灰度图像中,像素用 8 个比特位(一个字节)来表示,像素值的范围是[0,255]。两个像素值在进行加法运算时,求得的和很可能超过 255,此时就将这个数%256取余。

使用价值

往小处讲:

图像的加法可以实现两张图像的融合,同时保留原图像的信息。在灰度图像中,加法会使图像变亮;而在彩色图像中,加法会使图像颜色更鲜艳。加法也可用于实现图像的平均化和均衡化。

向大处说:

  1. 图像增强:利用两个图像的加法,可以增强图像的亮度、清晰度和对比度等方面,使得图像更加鲜明、清晰。

  2. 图像融合:将两个不同的图像进行加法运算,可以实现图像的融合。例如在医学图像的处理中,将 MRI 和 CT 两个不同的图像进行加法融合,可以更清晰地显示出人体器官的位置和结构信息。

  3. 图像合成:利用图像加法可以将图像元素进行合成,生成新的图像。例如,将两个不同的图像进行叠加,可以生成动态图像或者创意图像。

  4. 噪声消除:将两个相同的图像进行加法运算,可以消除其中的噪声。由于噪声是随机变化的,将两个相同的图像进行加法运算可以消除噪声的影响,提高图像的质量。

代码示例:

import cv2
# 读取两张灰度图像
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)
# 将两张图像相同位置的像素灰度值相加
result = cv2.add(img1, img2)
# 显示结果图像
cv2.imshow('Result Image', result)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像的融合

cv2.addWeighted(图片, 0.5, 图片, 0.4, 0)

解释:第一个参数是输入的第一张图像,第二个参数是第一张图像的权重值;第三个参数是输入的第二张图像,第四个参数是第二张图像的权重值;第五个参数是一个可选的缩放常数,可以用于调整输出图像的亮度。

img_1 = cv2.imread(自行复制图像路径)
img_2 = cv2.imread(自行复制图像路径)

# 打印出图片像素尺寸
print(img_1.shape)
print(img_2.shape)

# 统一图片尺寸
res_1 = cv2.resize(img_1, (1700, 1200))  # 图像重置函数
res_2 = cv2.resize(img_2, (1700, 1200))

# 图片融合
res = cv2.addWeighted(res_1, 0.4, res_2, 0.8, 0)
res = cv2.cvtColor(res, cv2.COLOR_BGR2RGB)  # 将BGR图片转换为RGB图片

plt.imshow(res)
plt.show()
cv2.waitKey(0)
cv2.destroyAllWindows()

这是将两张图片融合后的效果示例
在这里插入图片描述


写在最后

👍🏻 点赞,你的认可是我创作的动力!
⭐ 收藏,你的青睐是我努力的方向!
✏️ 评论,你的意见是我进步的财富!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/446824.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker容器---介绍、安装

Docker基本管理 一、Docker概述1、IT架构2、什么是docker3、Docker特点4、Docker与KVM区别 二、Docker核心概念1、镜像 容器 仓库2、虚拟架构有哪些 三、Docker使用场景1、Docker在内核中支持的2种重要技术2、应用场景 四、Docker安装1、YUM安装docker2、设置阿里云镜像源3、查…

Java多线程初阶(一)(图片+源码+超详细)

线程的概念参照以往的这篇文章🐻 目录 1.创建线程 1.1 继承Thread类 1.2 实现Runnable接口 eg:常用的简写方式 2.Thread类中的常用API 3. start方法和run方法 4. 继承Thread类启动新线程的逻辑 5. 实现Runnable接口启动新线程的逻辑 6. 线程相关…

Linux基础—日志分析

Linux基础—日志分析 一、日志的功能1.日志消息的级别2.设备字段说明 二、日志文件的分类1.内核及系统日志2.用户日志3.程序日志 三、日志文件1.日志文件查看2.主要日志文件介绍3.日志管理策略 一、日志的功能 用于记录系统、程序运行中发生的各种事件 通过阅读日志&#xff0c…

图像描述算法排位赛:SceneXplain与MiniGPT-4谁将夺得桂冠?

如果你对 AI 前沿感兴趣,本场「图像描述算法排位赛」绝对是你不能错过的!在这场较量中,SceneXplain 和 MiniGPT-4 将会比试,谁将摘得这场比赛的桂冠? 📎 直接上手体验:scenex.jina.ai 背景介绍 …

手机存储数据恢复软件哪个好用?试了10款,我只认准这一款!

案例:手机存储数据恢复软件哪个好用? 【有没有好介绍的苹果数据恢复软件?可以恢复好几年数据的那种软件?求推荐!】 手机中的数据是用户平时使用手机时不可避免的内容,这些数据包括照片、视频、音乐、文件等…

Baumer工业相机堡盟工业相机如何通过BGAPISDK的软触发实现两相机同步采集(C++)

Baumer工业相机堡盟工业相机如何通过BGAPISDK的软触发实现两相机的同步采集(C) Baumer工业相机Baumer工业相机的高速同步采集的技术背景Baumer工业相机通过BGAPI SDK在回调函数里同步保存图像工业相机在回调函数BufferEvent保存工业相机使用软触发进行同…

【观察】华为:新一代楼宇网络,使能绿建智慧化

“碳达峰”、“碳中和”目标是我国生态文明建设和高质量可持续发展的重要战略安排,将推动全社会加速向绿色低碳转型。作为全球既有建筑和每年新建建筑量最大的国家,大力发展绿色建筑对中国全方位迈向低碳社会、实现高质量发展具有重要意义。 《“十四五”…

使用FirmAE 对zyxel路由器固件仿真实践 | 信息安全

一、FirmAE简介 FirmAE 是一个执行仿真和漏洞分析的全自动框架。FirmAE 使用五种仲裁技术显著提高仿真成功率(从Firmadyne的 16.28% 提高到 79.36%)。 FirmAE的整体架构为如上图所示。与Firmadyne类似,FirmAE在预先构建的自定义Linux内核和库…

Codeforces Round 816 (Div. 2)(C. Monoblock)

传送门 题意: 定义一个数组,定义它 相等连续段的个数 如1,2,2,1,相等连续段有[1],[2,2],[1],共3个 如2,2,2,1,相等连续段有[2,2,2],[1],共2个 给定一个数组a,定义g(l,r)为,子数组中…

fisco bcos 2.0+ 版本浏览器搭建

Fisco Bcos当前已经发布了3版本,在3版本中,Fisco摒弃了原有的区块链浏览器,而是提供了具有更为丰富功能的图形化区块链管理工具WeBase,后续也会提供对于WeBase的搭建部署教程。 文章目录 一、准备条件二、下载浏览器安装脚本1. 下…

ChatGPT4 的体验 一站式 AI工具箱 -—Poe(使用教程)

最近由于人工智能聊天机器人的爆火(ChatGPT),因此各种各样的AI助手流行与网络,各种各样的都有,不论是什么样的其实都是为了我们更方便的解决问题,今天介绍一款AI工具箱——Poe将多种AI集成与一个界面,大家可以一次感受…

Mac系统brew报错“The GitHub credentials in the macOS keychain may be invalid”解决

报错信息如下: $ brew search nginx Warning: Error searching on GitHub: GitHub API Error: Requires authentication The GitHub credentials in the macOS keychain may be invalid. Clear them with: printf "protocolhttps\nhostgithub.com\n" | …

Python双向链表的操作

目录 一、双向链表 双向链表示例图 二、双向链表的操作 1、判断链表是否为空 2,链表长度 3,遍历整个链表 4,在链表头部添加元素 5、链表尾部添加元素 6,在指定位置插入元素 7,修改指定位置的元素 8&#xff0…

百度ai智能写作工具-百度ai自动写文章

百度AI智能写作工具:让创作更快捷、高效! 在当今竞争激烈的文化创意市场中,创作一篇高质量的文章需要投入大量时间和精力。然而,有了百度AI智能写作工具,创作变得更快捷、高效了。 百度AI智能写作工具采用最先进的人…

JVM之垃圾回收器概述

目录 垃圾收集器分类 按线程数分 按照工作模式分 ​编辑 按碎片处理方式分 按工作的内存区间分 评估GC的性能指标 吞吐量 暂停时间 吞吐量 vs 暂停时间 垃圾回收器概述 垃圾收集器没有在规范中进行过多的规定,可以由不同的厂商、不同版本的JVM来实现。 由…

一起学 WebGL:感受三维世界之视图矩阵

大家好,我是前端西瓜哥。之前绘制的图形都是在 XY 轴所在的平面上,这次我们来加入一点深度信息 z,带你走入三维的世界。 视图矩阵 对于一个立方体来说,我们从它的正前方看,不管距离它多远,也只能看到一个…

微服务下网关聚合Swagger文档、starter统一配置Swagger

一、starter实现统一配置微服务文档 把Swagger配置中的公共部分抽取出来Swagger与SpringBoot整合中,可能会由于版本问题出现各种问题 1、制作starter 参考: 【SpringBoot】自定义启动器 Starter【保姆级教程】用starter实现Oauth2中资源服务的统一配置用…

中级软件设计师备考---数据库系统1

目录 数据库模式数据库的设计过程E-R模型关系代数与元组演算 数据库模式 三级模式、两级映射 定义: 三级模式:外模式、概念模式和内模式;两级映射:外模式-概念模式映射、概念模式-内模式映射 外模式是用户看到的数据库的部分 概…

Linux的常见指令 -掌握

前言 为什么要学命令行? windows/苹果图形界面,是商业化的产物,也就是使用必须简单小白,才能有人用,so what?严格意义上讲,我们必须要学一下Linux命令行。因为企业后端有大量的服务器&#xff…

Web3.0:重新定义互联网的未来

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! Web3.0:重新定义互联网的未来 Web3.0是指下一代互联网,也称为“分布式互联网”。相比于Web1.0和Web2.0,Web3.0具有更强的去中心化、…