python图像处理实战(三)—图像几何变换

news2025/1/12 0:02:34

🚀写在前面🚀

🖊个人主页:https://blog.csdn.net/m0_52051577?type=blog 

🎁欢迎各位大佬支持点赞收藏,三连必回!!

🔈本人新开系列专栏—python图像处理

❀愿每一个骤雨初晴之时,所有的蜻蜓振翅和雨后惊雷,都归你。

前言

      图像几何变换就是在不改变图像像素值的前提下,对图像进行像素变换的处理。通常几何变换可以用来解决由成像的角度、透视位置不合预期等问题。比如拍摄的斜着的路牌,如果我们在只能对现有的照片进行处理的情况下又想要从侧面看到路牌上的字体,那么此时就要用到几何变换。

      几何变换作为图像归一化的核心工作之一,对图像的预处理起到了重要作用。 

目录

一、所需函数及基础变换的插值方法

1.所需函数

2.常见插值方法

3.最近邻插值

4.最近邻和双线性插值比较

二、图像操作

1.裁剪图像 (放大缩小)

         2.平移变换 

         3.错切变换 

         4.镜像变换

4.1方式一

4.2方式二

          5.旋转变换 

5.1方式一

5.2方式二

5.3设置不同缩放因子时的旋转效果

 6.放大缩小

 7.透视变换


 注:本文涉及到的图片资源可在博客积分资源中获取,相关链接:https://download.csdn.net/download/m0_52051577/87844285?spm=1001.2014.3001.5503 

一、所需函数及基础变换的插值方法

1.所需函数

cv.resize(src, dsize,dst=None,fx=None, fy=None, interpolation=None)

功能:用来放大及缩小图像的函数。

参数:[输入图像,修改尺寸,输出图像,x方向缩放系数,Y 方向缩放系数,插值方式]


M = np.array([[...]], dtype=np.float32)
cv.warpAffine(img, M, dsize)

功能:对图像进行平移变换。

参数:M表示构造的变换矩阵,warpAffine()函数中img表示变换的图像,M表示变换矩阵,dsize设置修改尺寸。


cv.flip(img,bool)

功能:对图像进行镜像变换。

参数:其中img表示变换的图像,flip()函数中bool为布尔值,可选0或1,0表示垂直镜像;1表示水平镜像;-1表示水平垂直同时进行。


M = cv.getRotationMatrix2D(center, angle, scale)

功能:对图像进行旋转变换(角度可定义)

参数:

getRotationMatrix2D()函数中center 表示旋转图像所要围绕的中心点。

angle 表示旋转的角度. 在OpenCV中正角度是逆时针的。

scale 表示缩放因子,可选的。


img_rotate = cv.rotate(img, cv.ROTATE_90_CLOCKWISE)

功能:对图像进行旋转变换(90°)

参数:rotate()旋转函数,将图像旋转90°。


M = cv.getPerspectiveTransform(src, dst)

功能:求得图像透视变换的变换矩阵。

参数:cv2.getPerspectiveTransform()函数根据图像中不共线的 4 个点在变换前后的对应位置求得 (3x3) 变换矩阵。


img = cv.warpPerspective(img, M, dsize)

功能:对图像进行透视变换。

参数:cv2.warpPerspective 使用该 (3x3) 变换矩阵即可求出变换后的图像。标量进行加法运算。 


2.常见插值方法

在做图像处理时,经常会碰到小数像素坐标的取值问题,这就需要一种插值算法来对坐标进行插值。常见的四种插值方法如下:

最近邻插值: interpolation = cv.INTER_NEAREST

放大图片:interpolation = cv.INTER_CUBIC(速度慢)

                  interpolation = cv.INTER_LINEAR  线性插值(速度快)

缩小图片:interpolation = cv.INTER_AREA


3.最近邻插值

将原本10X10的图像放大成15X15,放大1.5倍。

比如要计算新图像在(10,11)处的灰度值,则对应原图像(10/1.5,11/1.5)= (6.7,7.3)处的灰度值,四舍五入取整,选取原图像(7,7)处的灰度值即可。如下图:


4.最近邻和双线性插值比较

##### 最近邻和双线性插值比较
import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt

def show(img):
    plt.imshow(cv.cvtColor(img, cv.COLOR_BGR2RGB), cmap='gray', vmin=0, vmax=255)
    plt.show()

img = cv.imread('pic/rabbit50x33.jpg')
img_resize1 = cv.resize(img, (330, 500), interpolation=cv.INTER_NEAREST)
img_resize2 = cv.resize(img, (330, 500), interpolation=cv.INTER_LINEAR)

show(img)
show(np.hstack([img_resize1, img_resize2]))

 

最左图为模糊处理后的图像,中间图为最近邻处理的效果图,最右图为双插值处理的效果图,可见同样图片尺寸下,双插值处理效果更清晰。


二、图像操作

首先,定义导入图片的函数。

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
def show(img):
    if img.ndim == 2:
        plt.imshow(img, cmap='gray', vmin=0, vmax=255)
    else:
        img = cv.cvtColor(img, cv.COLOR_BGR2RGB)
        plt.imshow(img)
    plt.show()

1.裁剪图像 (放大缩小)

img = cv.imread('pic/rabbit500x333.jpg')
show(img)
img.shape  #查看图像维度

 如图,原图的维度为(500,333,3),下面将图像裁剪。

# 裁剪
rabbit = img[150:450, 50:300, :]
show(rabbit)

 

如图,裁剪后的维度中,150:450表示纵轴上裁剪的长度,50:300表示横轴上裁剪的长度。 


 2.平移变换 

平移变换的原理为,在原有像素点的基础上指定x方向与y方向的偏移量▲x与▲y,将原有的像素坐标(x0,y0)进行处理,平移后的坐标为(x,y);并将方程写成原向量与偏移向量相加的形式。同时原向量还可写成[[1,0],[0,1]]向量组与[x0,y0]相乘的形式,随后再偏移向量填补,写成3阶矩阵3维向量相乘的形式,从而实现平移变换

# 平移
transM = np.array([
    [1, 0, 20],
    [0, 1, 100]
], dtype=np.float32)

img_trans = cv.warpAffine(img, transM, dsize=(333, 500))
show(img_trans)

 

如图,首先构造平移矩阵transM, 分别指定x与y方向上的平移量,用图像中每个像素点对应的矩阵点乘平移矩阵transM,从而实现图像的平移变换。其中dsize是设置平移图像的尺寸。


3.错切变换 

错切变换实现原理:令x=x0+y0tanθ,y=y0。按上图公式进行变换,y0tanθ为x在水平方向上的错切量,纵轴位置不变,从而实现水平方向的错切变换。

# 错切
shearM = np.array([
    [1, 0.3, 0],
    [0, 1,   0]
], dtype=np.float32)

img_shear = cv.warpAffine(img, shearM, dsize=(400, 500))

show(img_shear)

 

如图,错切变换后的图像是由矩阵错切变换公式得来的,公式中tanα表示横坐标错切比例,横坐标错切量dx=原像素点纵坐标y0×错切所占比例tanα。同理,tanβ表示纵坐标错切比例,纵坐标错切量dy=原像素点纵坐标x0×错切所占比例tanβ。以这样的方式得到的图像即为错切变换图像。 


4.镜像变换

 镜像变换原理:本质是将水平或竖直方向的坐标对称过去。

4.1方式一

# 镜像1
mirrorM = np.array([
    [-1, 0, 333],
    [0,  1, 0]
], dtype=np.float32)

img_mirr = cv.warpAffine(img, mirrorM, dsize=img.shape[:2][::-1])
show(img_mirr)

 

如图,mirrorM中,x方向向量的首位元素为-1,表示将原图横向翻转,纵轴不变。 

 4.2方式二

# 镜像2
img_mirh = cv.flip(img, 1)
img_mirv = cv.flip(img, 0)
img_mirb = cv.flip(img, -1)
show(np.hstack([img, img_mirh, img_mirv, img_mirb]))

 

如图,采用flip()函数进行镜像翻转,其中1表示水平翻转,0表示竖直翻转,-1表示水平竖直同时进行。


5.旋转变换 

 旋转变换原理:首先定义旋转矩阵,再将原图像对应向量×矩阵中每个行向量分量。

 

旋转矩阵推导过程如上图,定义旋转半径r,旋转角α和β,其中(x0,y0)根据三角公式可以用r和α表示出来。

那么同理,要想将(x0,y0)变换到新坐标(x,y),同样用r和旋转角来表示,此时的旋转角为α-β,表示出新坐标(x,y)后,再用rcosαrsinα替换掉x0,y0。并将方程组写成矩阵相乘的形式,即为旋转矩阵。

5.1方式一

# 旋转1
img_rotate = cv.rotate(img, cv.ROTATE_90_CLOCKWISE)
show(img_rotate)

采用rotate()函数将图像顺时针旋转90°。

5.2方式二

# 旋转2
rotateM = cv.getRotationMatrix2D((80, 100), 45, 1)
img_rotate = cv.warpAffine(img, rotateM, dsize=(500, 500))
show(img_rotate)

 

采用getRotationMatrix2D()函数,定义旋转图像所要围绕的中心点(80,100),定义旋转的角度为45°,定义缩放因子为1。进行旋转变换,并调整尺寸为(500,500)。

5.3设置不同缩放因子时的旋转效果

# 旋转scale
rotateM1 = cv.getRotationMatrix2D((80, 100), 45, 0.8)
rotateM2 = cv.getRotationMatrix2D((80, 100), 45, 1)
rotateM3 = cv.getRotationMatrix2D((80, 100), 45, 1.2)

img_rotate1 = cv.warpAffine(img, rotateM1, dsize=(700, 300))
img_rotate2 = cv.warpAffine(img, rotateM2, dsize=(700, 300))
img_rotate3 = cv.warpAffine(img, rotateM3, dsize=(700, 300))

show(np.hstack([img_rotate1, img_rotate2, img_rotate3]))

 

如图,缩放因子越大,图像显示越大。 


 6.放大缩小

# 放大、缩小
img_resize = cv.resize(img, (300, 200))
show(img_resize)

 

采用 resize()函数对尺寸进行重新定义,设置尺寸为(300,200)。


 7.透视变换

透视变换原理:选取图像中四点的坐标(一般四点呈现平行四边形,根据图像位置来判定选取),再另外选择四点坐标(一般为矩形,根据自己想要呈现的效果来选取),分为两种矩阵srcdst,其中src为变换前选取的坐标矩阵,dst为想要变换的坐标矩阵。并采用getPerspectiveTransform()函数构造计算后的变换矩阵。并用warpPerspective()函数进行透视变换。如今,透视变换主要用于车道检测和图片矫正。

import cv2 as cv
img = cv.imread('pic/parthenon500x750.jpg')
show(img)
src = np.array([
    [210, 50],
    [610, 270],
    [650, 480],
    [150, 450]
], dtype=np.float32)

dst = np.array([
    [150, 50],
    [650, 50],
    [650, 480],
    [150, 480]
], dtype=np.float32)

M = cv.getPerspectiveTransform(src, dst)

img2 = cv.warpPerspective(img, M, dsize=(750, 500))
show(img2)

 构造的变换矩阵M为:

array([[ 2.71437487e-01,  1.50299394e-01,  5.07376979e+01],
       [-6.40928318e-01,  1.08051969e+00,  1.18987142e+02],
       [-1.23293942e-03,  5.45617563e-04,  1.00000000e+00]])

 

 如图,左边为原图,右边为透视变换后的效果。

🚗 创作不易,期待大佬们的三连支持!🚗

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/691740.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue实例知识点分享

文章目录 导文下面是创建 Vue 实例的基本步骤 常用的 Vue 实例方法和属性总结 导文 Vue的实例是用来创建 Vue 应用程序的对象。通过实例化 Vue 构造函数,我们可以创建一个具有响应式数据、计算属性、方法和生命周期钩子等特性的 Vue 实例。 下面是创建 Vue 实例的基…

springDatajpa动态sql根据时间范围将数据导出为excel并使用vue的按钮去触发

用到的技术点&#xff1a; 1.springDatajpa 2.EasyExcel 3.数据库 4.vue 前端实现&#xff1a; 1.创建按钮&#xff08;点击此按钮弹出填写导出条件的弹出框&#xff09; <el-button type"primary" round click"dialogVisible true"><svg-icon …

Java如何实现分库分表

一、为啥要分库分表 在大型互联网系统中&#xff0c;大部分都会选择mysql作为业务数据存储。一般来说&#xff0c;mysql单表行数超过500万行或者单表容量超过2GB&#xff0c;查询效率就会随着数据量的增长而下降。这个时候&#xff0c;就需要对表进行拆分。 那么应该怎么拆分…

vite项目中处理各种静态资源的引入方式介绍

一、引用图片资源 在vite创建的vue3项目中&#xff0c;引用图片资源有以下两种方式&#xff1a; 直接在模板中使用路径引用&#xff1a;在模板中使用标签&#xff0c;通过src属性引用图片。例如&#xff1a; <template><div><img src"./assets/logo.png…

NetApp FAS 存储管理软件,海量非结构化数据存储

NetApp FAS 存储管理软件&#xff0c;海量非结构化数据存储 在 NetApp ONTAP 数据管理软件的支持下&#xff0c;帮助您构建简单、安全且值得信赖的存储基础架构。NetApp FAS 存储阵列可让客户同时兼顾性能和容量。 NetApp FAS 系统经过优化&#xff0c;易于部署和操作&#x…

记录ip段解析成ip

无脑记录者记录使用方法 1.源代码链接 https://github.com/codeexpress/cidr2ip 2.提前准备的内容 go开发语言&#xff0c;链接里面的main.go 3.使用方法 直接新增文件cidrs.txt cidrs.txt文件里面加入需要解析的ip段即可

【实战】 JWT、用户认证与异步请求(上) —— React17+React Hook+TS4 最佳实践,仿 Jira 企业级项目(四)

文章目录 一、项目起航&#xff1a;项目初始化与配置二、React 与 Hook 应用&#xff1a;实现项目列表三、TS 应用&#xff1a;JS神助攻 - 强类型四、JWT、用户认证与异步请求1.login2.middleware of json-server3.jira-dev-tool&#xff08;imooc-jira-tool&#xff09;安装问…

机器学习——自然语言处理(一)

1 分词 1.1 设计原则 切分粒度大&#xff1b;非字典词少、单字字典词少&#xff1b;总体次数少。 1.2 基于词典匹配的分词 1.3 基于语法和规则的分词 目前处在试验阶段 1.4 基于统计的分词 1.5 技术难点 1.5.1 歧义识别 交集型歧义&#xff1a;AB | C or A | BC 组合型…

Jmeter操作数据库运行提示“Cannot load JDBC driver class ‘com.mysql.jdbc.Driver‘”的有效解决

如图所示&#xff0c;在jmeter中运行sql时报错提示“Cannot load JDBC driver class com.mysql.jdbc.Driver” 原因分析&#xff1a;这是因为没有mysql驱动&#xff0c;需要下载对应的jar包 一、下载地址&#xff1a;MySQL :: Download Connector/J 根据需求选择下载&#xf…

数字化转型:智慧物业行业落地与应用的突围之路!

导语 | 红杉中国在《2021 年企业数字化年度指南》中指出&#xff0c;96% 的受访企业已经开展了数字化实践&#xff0c;而其中超过 6 成的受访者都表示期望在未来进一步增加数字化的投入。技术因素或将成为未来两到三年影响企业发展最为重要的外部力量。当前地产与物业行业进入不…

当前最强的免费AI画图、AI绘图工具-2

Midjourney比较贵&#xff0c;而且无法访问&#xff0c;Stable Diffusion部署起来很麻烦。网上有哪些可以直接在网页端或者下载的app可以实现AI画图的工具。我们整理了45个相关工具&#xff0c;这是系列2&#xff0c;收录到 当前最强的免费AI画图、AI绘图工具-2https://www.web…

【C++】-- 高并发内存池

高并发内存池 项目介绍池化技术内存池 定长内存池的实现整体框架threadcachethreadcache整体设计threadcache哈希桶映射对齐规则TLS无锁访问 centralcachecentralcache整体设计centralcache结构设计centralcache的实现 pagecachepagecache整体设计pagecache中获取Span 回收内存…

【C/C++练习】经典的快慢指针问题---移除元素

&#x1f4d6;题目描述 题目出处&#xff1a;移除元素 &#x1f516;示例 &#x1f4d6;题解 对于本题我将按照由易到难的顺序为大家分享三种解题思路&#xff0c;并逐一分析它们的优劣&#xff0c;以及注意事项。 &#x1f516;思路一&#xff1a;暴力求解 我想暴力求解应该…

零-云尚办公项目学习

对于云尚办公项目的学习 1、这是尚硅谷推出的新的OA项目 云尚办公系统是一套自动办公系统&#xff0c;系统主要包含&#xff1a;管理端和员工端 管理端包含:权限管理、审批管理、公众号菜单管理 员工端:采用微信公众号操作&#xff0c;包含&#xff1a;办公审批、微信授权登…

数字通信中的编码(学习笔记)

编码种类 RZ(Return Zero Code)编码 也称为归零码&#xff0c;就是在 一个周期内&#xff0c;用二进制传输数据位&#xff0c;在数据脉冲结束后&#xff0c;需要维持一段时间的低电平。 RZ编码又分为两种&#xff1a; 单极性归零码 低电平表示0&#xff0c;正电平表示1&…

【Java用法】windows10系统下修改jar中的文件并重新打包成jar文件然后运行

windows10系统下修改jar中的文件并重新打包成jar文件然后运行 一、背景描述二、操作步骤2.1 解压jar包2.2 修改配置文件2.3 重新打成jar包2.4 确认是否修改成功2.5 运行程序 一、背景描述 测试环境&#xff08;Linux&#xff09;的代码&#xff08;jar包&#xff09;拉取到本地…

AI数字人:语音驱动面部模型及超分辨率重建Wav2Lip-HD

1 Wav2Lip-HD项目介绍 数字人打造中语音驱动人脸和超分辨率重建两种必备的模型&#xff0c;它们被用于实现数字人的语音和图像方面的功能。通过Wav2Lip-HD项目可以快速使用这两种模型&#xff0c;完成高清数字人形象的打造。 项目代码地址&#xff1a;github地址 1.1…

可再生能源与能源存储技术的结合和互补

在全球对可再生能源的需求日益增长的背景下&#xff0c;如何将可再生能源与能源存储技术相结合&#xff0c;实现能源的高效利用和持续供应成为了一个重要的议题。本文将探讨可再生能源与能源存储技术的结合与互补关系&#xff0c;分析其对能源领域的影响以及未来发展的前景。 …

CSS常用样式

文章目录 字体样式文本样式颜色和背景样式对齐方式下划线、上划线、删除线设置行高 列表样式背景样式背景颜色背景图片背景重复背景大小 鼠标样式伪类样式设置透明度 字体样式 所有样式都写在<style>标签内&#xff0c;里面加选择器 <!DOCTYPE html> <html>…

别小看可拖拽式表单设计器,降本增效就靠它啦!

在经济快速发展的当下&#xff0c;办公已然进入流程化发展阶段。不少企业希望实现降本增效的办公效果&#xff0c;大家不妨可以了解下可拖拽式表单设计器。通过简单的拖拉拽就能实现应用组建&#xff0c;创建属于自己的快速开发框架平台&#xff0c;不仅省下培养专业程序人工的…