python图像处理实战(二)—图像几何变换

news2025/1/14 1:17:56

🚀写在前面🚀

🖊个人主页:https://blog.csdn.net/m0_52051577?type=blog 

🎁欢迎各位大佬支持点赞收藏,三连必回!!

🔈本人新开系列专栏—python图像处理

❀愿每一个骤雨初晴之时,所有的蜻蜓振翅和雨后惊雷,都归你。

前言

      图像几何变换就是在不改变图像像素值的前提下,对图像进行像素变换的处理。通常几何变换可以用来解决由成像的角度、透视位置不合预期等问题。比如拍摄的斜着的路牌,如果我们在只能对现有的照片进行处理的情况下又想要从侧面看到路牌上的字体,那么此时就要用到几何变换。

      几何变换作为图像归一化的核心工作之一,对图像的预处理起到了重要作用。 

目录

一、所需函数及基础变换的插值方法

1.所需函数

2.常见插值方法

3.最近邻插值

4.最近邻和双线性插值比较

二、图像操作

1.裁剪图像 (放大缩小)

         2.平移变换 

         3.错切变换 

         4.镜像变换

4.1方式一

4.2方式二

          5.旋转变换 

5.1方式一

5.2方式二

5.3设置不同缩放因子时的旋转效果

 6.放大缩小

 7.透视变换


 注:本文涉及到的图片资源可在博客积分资源中获取,相关链接:https://download.csdn.net/download/m0_52051577/87844285?spm=1001.2014.3001.5503 

一、所需函数及基础变换的插值方法

1.所需函数

cv.resize(src, dsize,dst=None,fx=None, fy=None, interpolation=None)

功能:用来放大及缩小图像的函数。

参数:[输入图像,修改尺寸,输出图像,x方向缩放系数,Y 方向缩放系数,插值方式]


M = np.array([[...]], dtype=np.float32)
cv.warpAffine(img, M, dsize)

功能:对图像进行平移变换。

参数:M表示构造的变换矩阵,warpAffine()函数中img表示变换的图像,M表示变换矩阵,dsize设置修改尺寸。


cv.flip(img,bool)

功能:对图像进行镜像变换。

参数:其中img表示变换的图像,flip()函数中bool为布尔值,可选0或1,0表示垂直镜像;1表示水平镜像;-1表示水平垂直同时进行。


M = cv.getRotationMatrix2D(center, angle, scale)

功能:对图像进行旋转变换(角度可定义)

参数:

getRotationMatrix2D()函数中center 表示旋转图像所要围绕的中心点。

angle 表示旋转的角度. 在OpenCV中正角度是逆时针的。

scale 表示缩放因子,可选的。


img_rotate = cv.rotate(img, cv.ROTATE_90_CLOCKWISE)

功能:对图像进行旋转变换(90°)

参数:rotate()旋转函数,将图像旋转90°。


M = cv.getPerspectiveTransform(src, dst)

功能:求得图像透视变换的变换矩阵。

参数:cv2.getPerspectiveTransform()函数根据图像中不共线的 4 个点在变换前后的对应位置求得 (3x3) 变换矩阵。


img = cv.warpPerspective(img, M, dsize)

功能:对图像进行透视变换。

参数:cv2.warpPerspective 使用该 (3x3) 变换矩阵即可求出变换后的图像。标量进行加法运算。 


2.常见插值方法

在做图像处理时,经常会碰到小数像素坐标的取值问题,这就需要一种插值算法来对坐标进行插值。常见的四种插值方法如下:

最近邻插值: interpolation = cv.INTER_NEAREST

放大图片:interpolation = cv.INTER_CUBIC(速度慢)

                  interpolation = cv.INTER_LINEAR  线性插值(速度快)

缩小图片:interpolation = cv.INTER_AREA


3.最近邻插值

将原本10X10的图像放大成15X15,放大1.5倍。

比如要计算新图像在(10,11)处的灰度值,则对应原图像(10/1.5,11/1.5)= (6.7,7.3)处的灰度值,四舍五入取整,选取原图像(7,7)处的灰度值即可。如下图:


4.最近邻和双线性插值比较

##### 最近邻和双线性插值比较
import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt

def show(img):
    plt.imshow(cv.cvtColor(img, cv.COLOR_BGR2RGB), cmap='gray', vmin=0, vmax=255)
    plt.show()

img = cv.imread('pic/rabbit50x33.jpg')
img_resize1 = cv.resize(img, (330, 500), interpolation=cv.INTER_NEAREST)
img_resize2 = cv.resize(img, (330, 500), interpolation=cv.INTER_LINEAR)

show(img)
show(np.hstack([img_resize1, img_resize2]))

 

最左图为模糊处理后的图像,中间图为最近邻处理的效果图,最右图为双插值处理的效果图,可见同样图片尺寸下,双插值处理效果更清晰。


二、图像操作

首先,定义导入图片的函数。

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
def show(img):
    if img.ndim == 2:
        plt.imshow(img, cmap='gray', vmin=0, vmax=255)
    else:
        img = cv.cvtColor(img, cv.COLOR_BGR2RGB)
        plt.imshow(img)
    plt.show()

1.裁剪图像 (放大缩小)

img = cv.imread('pic/rabbit500x333.jpg')
show(img)
img.shape  #查看图像维度

 如图,原图的维度为(500,333,3),下面将图像裁剪。

# 裁剪
rabbit = img[150:450, 50:300, :]
show(rabbit)

 

如图,裁剪后的维度中,150:450表示纵轴上裁剪的长度,50:300表示横轴上裁剪的长度。 


 2.平移变换 

平移变换的原理为,在原有像素点的基础上指定x方向与y方向的偏移量▲x与▲y,将原有的像素坐标(x0,y0)进行处理,平移后的坐标为(x,y);并将方程写成原向量与偏移向量相加的形式。同时原向量还可写成[[1,0],[0,1]]向量组与[x0,y0]相乘的形式,随后再偏移向量填补,写成3阶矩阵3维向量相乘的形式,从而实现平移变换

# 平移
transM = np.array([
    [1, 0, 20],
    [0, 1, 100]
], dtype=np.float32)

img_trans = cv.warpAffine(img, transM, dsize=(333, 500))
show(img_trans)

 

如图,首先构造平移矩阵transM, 分别指定x与y方向上的平移量,用图像中每个像素点对应的矩阵点乘平移矩阵transM,从而实现图像的平移变换。其中dsize是设置平移图像的尺寸。


3.错切变换 

错切变换实现原理:令x=x0+y0tanθ,y=y0。按上图公式进行变换,y0tanθ为x在水平方向上的错切量,纵轴位置不变,从而实现水平方向的错切变换。

# 错切
shearM = np.array([
    [1, 0.3, 0],
    [0, 1,   0]
], dtype=np.float32)

img_shear = cv.warpAffine(img, shearM, dsize=(400, 500))

show(img_shear)

 

如图,错切变换后的图像是由矩阵错切变换公式得来的,公式中tanα表示横坐标错切比例,横坐标错切量dx=原像素点纵坐标y0×错切所占比例tanα。同理,tanβ表示纵坐标错切比例,纵坐标错切量dy=原像素点纵坐标x0×错切所占比例tanβ。以这样的方式得到的图像即为错切变换图像。 


4.镜像变换

 镜像变换原理:本质是将水平或竖直方向的坐标对称过去。

4.1方式一

# 镜像1
mirrorM = np.array([
    [-1, 0, 333],
    [0,  1, 0]
], dtype=np.float32)

img_mirr = cv.warpAffine(img, mirrorM, dsize=img.shape[:2][::-1])
show(img_mirr)

 

如图,mirrorM中,x方向向量的首位元素为-1,表示将原图横向翻转,纵轴不变。 

 4.2方式二

# 镜像2
img_mirh = cv.flip(img, 1)
img_mirv = cv.flip(img, 0)
img_mirb = cv.flip(img, -1)
show(np.hstack([img, img_mirh, img_mirv, img_mirb]))

 

如图,采用flip()函数进行镜像翻转,其中1表示水平翻转,0表示竖直翻转,-1表示水平竖直同时进行。


5.旋转变换 

 旋转变换原理:首先定义旋转矩阵,再将原图像对应向量×矩阵中每个行向量分量。

 

旋转矩阵推导过程如上图,定义旋转半径r,旋转角α和β,其中(x0,y0)根据三角公式可以用r和α表示出来。

那么同理,要想将(x0,y0)变换到新坐标(x,y),同样用r和旋转角来表示,此时的旋转角为α-β,表示出新坐标(x,y)后,再用rcosαrsinα替换掉x0,y0。并将方程组写成矩阵相乘的形式,即为旋转矩阵。

5.1方式一

# 旋转1
img_rotate = cv.rotate(img, cv.ROTATE_90_CLOCKWISE)
show(img_rotate)

采用rotate()函数将图像顺时针旋转90°。

5.2方式二

# 旋转2
rotateM = cv.getRotationMatrix2D((80, 100), 45, 1)
img_rotate = cv.warpAffine(img, rotateM, dsize=(500, 500))
show(img_rotate)

 

采用getRotationMatrix2D()函数,定义旋转图像所要围绕的中心点(80,100),定义旋转的角度为45°,定义缩放因子为1。进行旋转变换,并调整尺寸为(500,500)。

5.3设置不同缩放因子时的旋转效果

# 旋转scale
rotateM1 = cv.getRotationMatrix2D((80, 100), 45, 0.8)
rotateM2 = cv.getRotationMatrix2D((80, 100), 45, 1)
rotateM3 = cv.getRotationMatrix2D((80, 100), 45, 1.2)

img_rotate1 = cv.warpAffine(img, rotateM1, dsize=(700, 300))
img_rotate2 = cv.warpAffine(img, rotateM2, dsize=(700, 300))
img_rotate3 = cv.warpAffine(img, rotateM3, dsize=(700, 300))

show(np.hstack([img_rotate1, img_rotate2, img_rotate3]))

 

如图,缩放因子越大,图像显示越大。 


 6.放大缩小

# 放大、缩小
img_resize = cv.resize(img, (300, 200))
show(img_resize)

 

采用 resize()函数对尺寸进行重新定义,设置尺寸为(300,200)。


 7.透视变换

透视变换原理:选取图像中四点的坐标(一般四点呈现平行四边形,根据图像位置来判定选取),再另外选择四点坐标(一般为矩形,根据自己想要呈现的效果来选取),分为两种矩阵srcdst,其中src为变换前选取的坐标矩阵,dst为想要变换的坐标矩阵。并采用getPerspectiveTransform()函数构造计算后的变换矩阵。并用warpPerspective()函数进行透视变换。如今,透视变换主要用于车道检测和图片矫正。

import cv2 as cv
img = cv.imread('pic/parthenon500x750.jpg')
show(img)
src = np.array([
    [210, 50],
    [610, 270],
    [650, 480],
    [150, 450]
], dtype=np.float32)

dst = np.array([
    [150, 50],
    [650, 50],
    [650, 480],
    [150, 480]
], dtype=np.float32)

M = cv.getPerspectiveTransform(src, dst)

img2 = cv.warpPerspective(img, M, dsize=(750, 500))
show(img2)

 构造的变换矩阵M为:

array([[ 2.71437487e-01,  1.50299394e-01,  5.07376979e+01],
       [-6.40928318e-01,  1.08051969e+00,  1.18987142e+02],
       [-1.23293942e-03,  5.45617563e-04,  1.00000000e+00]])

 

 如图,左边为原图,右边为透视变换后的效果。

🚗 创作不易,期待大佬们的三连支持!🚗

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/659135.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python接口自动化测试实战

目录 前言: 1.接口定义: 2.基本流程 3.需求分析 4.用例设计 5.脚本开发 5.3结果校验 6.结果分析 前言: Python是一款在自动化测试领域应用广泛的编程语言。通过使用Python的测试框架(如unittest和pytest)&…

【第一次】21级计科计算机组成原理课外练习

【第一次】21级计科计算机组成原理课外练习 一、判断题二、单选题三、多选题四、主观题 一、判断题 1-1 国防科技大学成功研制的“银河-II”通用并行巨型机的峰值速度超过同为国防科技大学研制的“天河一号”超级计算机。 错误 1-2 目前高端光刻机技术被荷兰ASML公司垄断&…

简要介绍 | 行人重识别 Person Re-identification

注1:本文系“简要介绍”系列之一,仅从概念上对行人重识别进行非常简要的介绍,不适合用于深入和详细的了解。 注2:“简要介绍"系列的所有创作均使用了AIGC工具辅助” 探索行人重识别技术:原理、挑战与未来展望 行人…

数字IC前端学习笔记:仲裁轮询(二)

相关文章 数字IC前端学习笔记:LSFR(线性反馈移位寄存器) 数字IC前端学习笔记:跨时钟域信号同步 数字IC前端学习笔记:信号同步和边沿检测 数字IC前端学习笔记:锁存器Latch的综合 数字IC前端学习笔记&am…

【代码阅读软件】VSCode最新版本 下载、安装、配置

目录 一、概述二、安装 VSCode 详细步骤三、基础配置3.1 安装中文插件3.2 安装其他插件 一、概述 VSCode 全称是 Visual Studio Code,是一款免费且开源的现代化代码编辑器,几乎支持所有主流开发语言的语法高亮、智能代码补全、代码片段提示、自定义快捷键…

(2023,网络修剪)探索 few-shot 图像生成中的不相容知识迁移

Exploring Incompatible Knowledge Transfer in Few-shot Image Generation 公众号:EDPJ 目录 0. 摘要 1. 简介 2. 相关工作 3. 基础 4. FSIG 中不兼容的知识转移 4.1 调查不相容的知识 4.2 实验设置 4.3 结果和分析 5. 建议的方法 5.1 通过网络修剪进…

SpringCloud02:Eureka

什么是Eureka? 基于Restful的注册中心 Eureka基本的架构 Springcloud 封装了Netflix公司开发的Eureka模块来实现服务注册与发现 (对比Zookeeper).Eureka采用了C-S的架构设计,EurekaServer作为服务注册功能的服务器,他是服务注册中心.而系统…

React从入门到实战 -组件的三大核心属性(1)state

State state是组件对象最重要的属性,值是对象(可以包含多个Key-value的组合)组件被称为状态机,通过更新组件的state来更新对应的页面显示(重新渲染组件) class MyComponent extends React.Component {rend…

023.【回溯算法】

1. 回溯算法 回溯算法也叫试探法,它是一种系统地搜索问题而求解的方法。回溯算法可以找出所有解的一般性,同时可以避免不正确的数值。一旦发现不正确的数值,就不再继续下一层而是返回到上一层,以节省时间。简单来说,回…

OpenVino 2023.0学习使用(1)-简介

模型制备 每一个深度学习工作流程都是从获取模型开始的。您可以选择准备一个自定义的网络,使用现成的解决方案并根据您的需求进行调整,甚至可以从在线数据库下载并运行预先训练的网络,例如TensorFlow Hub,Hugging Face&#xff0…

C++入门:类和对象(中)

目录 前言: 一:类的6个默认成员函数 二:构造函数(第一个成员) (1)概念 (2)特性 (3)特性的解析 ⭐特性4 ⭐特性5 ⭐特性6 ⭐特性7 三:初始化列表 (1)引入 (2)概念 (3)注意 四:析构函数(第二个成员) …

2023年软件测试的高薪机会在哪?

没入行或已经入行测试的小伙伴们,快看过来。来看看你们的高薪机会在哪里! 我们先来看几个高薪招聘需求! 高薪招聘需求1 要求看起来不是很高,应届生和在校生都可以,而且薪资达到了12K,14薪。 但是&#xff0…

roop 一张图片就能生成换脸视频的开源项目

roop的github地址:https://github.com/s0md3v/roop 安装python(pip如果需要也安装) 记住到 2023-6-18 这天 一定要是python3的10版本,11版本会有包不兼容,我就这个问题耗费了一天。 我使用的是:python3.1…

图的单源最短路算法:Bellman-Ford

Bell-Ford算法思想 对一个点的松弛操作,就是找到经过这个点的另外一条路径(多走一条边),使得花费的代价更小。 如果一个图没有负权环,从一点到另外一点的最短路径,最多经过所有的V个顶点,有V-1…

微信代加什么意思

微信代加什么意思,信息流加粉推广怎么做,信息流怎么做加粉推广?信息流微信加粉#信息流代运营#信息流推广#加粉引流推广#抖音引流推广#信息流加粉链路#抖音#百收助推 近期有客户问信息流微信加粉怎么做? 嗯,首先说一下…

开箱即用的shell脚本(一)

目录 一、通过位置变量创建 Linux 系统账户及密码 二、初始化脚本 三、nginx启动脚本 四、每周 5 使用 tar 命令备份/var/log 下的所有日志文件 五、实时监控本机内存和硬盘剩余空间,剩余内存小于 500M、根分区剩余空间小于 1000M时,发送报警邮件给 …

C语言之动态内存分配(1)

目录 本章重点 为什么存在动态内存分配 动态内存函数的介绍 malloc free calloc realloc 常见的动态内存错误 几个经典的笔试题 柔性数组 动态内存管理—自己维护自己的内存空间的大小 首先我们申请一个变量,再申请一个数组 这是我们目前知道的向内存申请…

【小沐学Python】Python实现Web服务器(Flask,gevent )

文章目录 1、简介1.1 功能列表1.2 支持平台1.3 安装 2、gevent入门示例2.1 文件IO2.2 MySQL2.3 redis2.4 time2.5 requests2.6 socket2.7 并发抓取文字2.8 并发抓取图片2.9 生产者 - 消费者 3、gevent其他示例3.1 StreamServer3.2 WSGI server3.3 flask3.4 websocket3.5 udp 结…

LeetCode 1254. 统计封闭岛屿的数目

【LetMeFly】1254.统计封闭岛屿的数目 力扣题目链接:https://leetcode.cn/problems/number-of-closed-islands/ 二维矩阵 grid 由 0 (土地)和 1 (水)组成。岛是由最大的4个方向连通的 0 组成的群,封闭岛是…

Spark-核心常见面试题集锦(RDD、shuffle类型、数据倾斜优化、小文件问题、性能调优、streaming流程、checkpoint机制)

1 Spark的任务执行流程 第一种standalone模式 整体:driver中有sparkcontext,RDD DAG和DAGScheduler和taskscheduler,master是资源管理,worker中executor,executor中有多个task 构建一个application环境,d…