python图像处理的图像几何变换

news2025/1/23 10:45:42

一.图像几何变换

图像几何变换不改变图像的像素值,在图像平面上进行像素变换。适当的几何变换可以最大程度地消除由于成像角度、透视关系乃至镜头自身原因所造成的几何失真所产生的负面影响。几何变换常常作为图像处理应用的预处理步骤,是图像归一化的核心工作之一[1]。

一个几何变换需要两部分运算:

  • 空间变换:包括平移、缩放、旋转和正平行投影等,需要用它来表示输出图像与输入图像之间的像素映射关系。
  • 灰度插值算法:按照这种变换关系进行计算,输出图像的像素可能被映射到输入图像的非整数坐标上[2]。

图像几何变换在变换过程中会建立一种原图像像素与变换后图像像素之间的映射关系,通过这种关系,能够从一方的像素计算出另一方的像素的坐标位置。通常将图像坐标映射到输出的过程称作向前映射,反之,将输出图像映射到输入的过程称作向后映射。向后映射在实践中使用较多,原因是能够避免使用向前映射中出现映射不完全和映射重叠的问题。

图6-1展示了图像放大的示例,右边图中只有(0,0)、(0,2)、(2,0)、(2,2)四个坐标根据映射关系在原图像中找到了相对应的像素,其余的12个坐标没有有效值[3]。

在这里插入图片描述

对于数字图像而言,像素的坐标是离散型非负整数,但是在进行变换的过程中有可能产生浮点坐标值。这在图像处理中是一个无效的坐标。为了解决这个问题需要用到插值算法。常见算法如下:

  • 最近邻插值
  • 双线性插值
  • 双立方插值
    图像变换是建立在矩阵运算基础上,通过矩阵运算可以很快找到对应关系。在这篇文章中,我们将介绍常见的图像几何变换,包括图形平移、图像缩放、图像旋转、图像镜像、图像仿射、图像透视等。

二.图像平移

图像平移是将图像中的所有像素点按照给定的平移量进行水平或垂直方向上的移动。假设原始像素的位置坐标为(x0,y0),经过平移量(△x,△y)后,坐标变为(x1, y1),如图6-2所示[3-5]。

在这里插入图片描述

用数学式子表示为公式(6-1)。

在这里插入图片描述

用矩阵表示如公式(6-2)所示:

在这里插入图片描述

式子中,矩阵称为平移变换矩阵或因子,△x和△y称为平移量。图像平移首先定义平移矩阵M,再调用warpAffine()函数实现平移,核心函数如下:

  • M = np.float32([[1, 0, x], [0, 1, y]])
    – M表示平移矩阵,其中x表示水平平移量,y表示垂直平移量
  • shifted = cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])
    – src表示原始图像
    – M表示平移矩阵
    – dsize表示变换后的输出图像的尺寸大小
    – dst为输出图像,其大小为dsize,类型与src相同
    – flag表示插值方法的组合和可选值
    – borderValue表示像素外推法,当borderMode = BORDER_TRANSPARENT时,表示目标图像中的像素不会修改源图像中的“异常值”。
    – borderValue用于边界不变的情况,默认情况下为0

下面代码是图像平移的一个简单案例,它定义了图像平移矩阵M,然后调用warpAffine()函数将原始图像垂直向下平移了50个像素,水平向右平移了100个像素。

# -*- coding:utf-8 -*-
# By:Eastmount
import cv2
import numpy as np

#读取图片
src = cv2.imread('scenery.png')

#图像平移矩阵
M = np.float32([[1, 0, 100], [0, 1, 50]])

#获取原始图像列数和行数
rows, cols = src.shape[:2]

#图像平移
result = cv2.warpAffine(src, M, (cols, rows)) 

#显示图像
cv2.imshow("original", src)
cv2.imshow("result", result)

#等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果如图6-3所示:

在这里插入图片描述

下面一个案例是将图像分别向下、向上、向右、向左平移,再调用matplotlib绘图库依次绘制的过程。

# -*- coding:utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np
import matplotlib.pyplot as plt
 
#读取图片
img = cv2.imread('scenery.png')
image = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)

#图像平移
#垂直方向 向下平移100
M = np.float32([[1, 0, 0], [0, 1, 100]])
img1 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))

#垂直方向 向上平移100
M = np.float32([[1, 0, 0], [0, 1, -100]])
img2 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))

#水平方向 向右平移100
M = np.float32([[1, 0, 100], [0, 1, 0]])
img3 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))

#水平方向 向左平移100
M = np.float32([[1, 0, -100], [0, 1, 0]])
img4 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))

#循环显示图形
titles = [ 'Image1', 'Image2', 'Image3', 'Image4']  
images = [img1, img2, img3, img4]  
for i in range(4):  
   plt.subplot(2,2,i+1), plt.imshow(images[i], 'gray')  
   plt.title(titles[i])  
   plt.xticks([]),plt.yticks([])  
plt.show()

输出结果如图6-4所示,它从四个方向都进行了平移,并且调用subplot()函数将四个子图绘制在一起。

在这里插入图片描述


三.图像缩放

图像缩放(image scaling)是指对数字图像的大小进行调整的过程。在Python中,图像缩放主要调用resize()函数实现,函数原型如下:

  • result = cv2.resize(src, dsize[, result[. fx[, fy[, interpolation]]]])
    – src表示原始图像
    – dsize表示图像缩放的大小
    – result表示图像结果
    – fx表示图像x轴方向缩放大小的倍数
    – fy表示图像y轴方向缩放大小的倍数
    – interpolation表示变换方法。CV_INTER_NN表示最近邻插值;CV_INTER_LINEAR表示双线性插值(缺省使用);CV_INTER_AREA表示使用像素关系重采样,当图像缩小时,该方法可以避免波纹出现,当图像放大时,类似于CV_INTER_NN;CV_INTER_CUBIC表示立方插值

常见的图像缩放两种方式如下所示,第一种方式是将原图像设置为(160, 160)像素大小,第二种方式是将原始图像缩小为0.5倍。

  • result = cv2.resize(src, (160,160))
  • result = cv2.resize(src, None, fx=0.5, fy=0.5)

设(x1, y1)是缩放后的坐标,(x0, y0)是缩放前的坐标,sx、sy为缩放因子,则图像缩放的计算公式(6-3)所示:

在这里插入图片描述

下面是Python实现图像缩放的代码,它将所读取的风景图像进行缩小。

# -*- coding:utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
 
#读取图片
src = cv2.imread('scenery.png')

#图像缩放
result = cv2.resize(src, (200,100))
print(result.shape)

#显示图像
cv2.imshow("original", src)
cv2.imshow("result", result)

#等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果如图6-5所示,图像缩小为(100, 200, 3)像素。注意,代码中调用函数 cv2.resize(src, (200,100)) 设置新图像大小dsize的列数为200,行数为100。

在这里插入图片描述

下面讲解另一种图像缩放变换的方法,通过原始图像像素乘以缩放系数进行图像变换,代码如下:

# -*- coding:utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
 
#读取图片
src = cv2.imread('scenery.png')
rows, cols = src.shape[:2]
print(rows, cols)

#图像缩放 dsize(列,行)
result = cv2.resize(src, (int(cols*0.6), int(rows*1.2)))

#显示图像
cv2.imshow("src", src)
cv2.imshow("result", result)
cv2.waitKey(0)
cv2.destroyAllWindows()

获取图片“scenery.png”的元素像素值,其rows值为384,cols值为512,接着进行宽度缩小0.6倍、高度放大1.2倍的处理,运行前后对比效果如图6-6所示。

在这里插入图片描述

最后讲解调用(fx,fy)参数设置缩放倍数的方法,对原始图像进行放大或缩小操作。下面代码是fx和fy方向缩小至原始图像0.3倍的操作。

# -*- coding:utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
 
#读取图片
src = cv2.imread('scenery.png')
rows, cols = src.shape[:2]
print(rows, cols)

#图像缩放
result = cv2.resize(src, None, fx=0.3, fy=0.3)

#显示图像
cv2.imshow("src", src)
cv2.imshow("result", result)

#等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

输出的结果如图6-7所示,这是按比例0.3×0.3缩小的。

在这里插入图片描述


四.图像旋转

图像旋转是指图像以某一点为中心旋转一定的角度,形成一幅新的图像的过程。图像旋转变换会有一个旋转中心,这个旋转中心一般为图像的中心,旋转之后图像的大小一般会发生改变。图6-8表示原始图像的坐标(x0, y0)旋转至(x1, y1)的过程。

在这里插入图片描述

旋转公式如(6-4)所示,其中(m,n)是旋转中心,a是旋转的角度,(left,top)是旋转后图像的左上角坐标。

在这里插入图片描述

图像旋转变换主要调用getRotationMatrix2D()函数和warpAffine()函数实现,绕图像的中心旋转,函数原型如下:

  • M = cv2.getRotationMatrix2D(center, angle, scale)
    – center表示旋转中心点,通常设置为(cols/2, rows/2)
    – angle表示旋转角度,正值表示逆时针旋转,坐标原点被定为左上角
    – scale表示比例因子

  • rotated = cv2.warpAffine(src, M, (cols, rows))
    – src表示原始图像
    – M表示旋转参数,即getRotationMatrix2D()函数定义的结果
    – (cols, rows)表示原始图像的宽度和高度

实现代码如下所示:

# -*- coding:utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
 
#读取图片
src = cv2.imread('scenery.png')

#源图像的高、宽 以及通道数
rows, cols, channel = src.shape

#绕图像的中心旋转
#函数参数:旋转中心 旋转度数 scale
M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1)

#函数参数:原始图像 旋转参数 元素图像宽高
rotated = cv2.warpAffine(src, M, (cols, rows))  

#显示图像
cv2.imshow("src", src)
cv2.imshow("rotated", rotated)

#等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

显示效果如图6-9所示,绕图像中心点逆时针旋转30度。

在这里插入图片描述


五.总结

本章主要讲解Python和OpenCV的图像几何变换,详细介绍了图像平移、图像缩放和图像旋转,这些知识点也是我们PC端或手机端图像处理应用常见的算法,读者可以尝试结合这些应用完成一套图像处理软件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2113388.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电力设计院10大排行榜!这个大院屠榜!

今天晚上阅读了中国电力规划设计协会《2022年度电力勘测设计行业统计分析报告》,这本报告是依据协会会员企业统计报表数据进行编制分析的。报告共收集了167家勘测设计企业上报的数据信息,统计的企业数量较2021 年166家企业增加1 家。 按业务板块划分为&…

【全网最全】2024年数学建模国赛A题30页完整建模文档+17页成品论文+保奖matla代码+可视化图表等(后续会更新)

您的点赞收藏是我继续更新的最大动力! 一定要点击如下的卡片,那是获取资料的入口! 【全网最全】2024年数学建模国赛A题30页完整建模文档17页成品论文保奖matla代码可视化图表等(后续会更新)「首先来看看目前已有的资…

14份网络安全意识培训ppt

14份网络安全意识培训ppthttp://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247485750&idx1&sn5abd05087334dcf68b1f76aa73011c41&chksmc0e4706af793f97c1bac979ad6a40c54c442a24b5f191162848bf2b06443a5968697ca45ecee#rd 网络安全周就要来了,…

用Boot写mybatis的增删改查

一、总览 项目结构: 图一 1、JavaBean文件 2、数据库操作 3、Java测试 4、SpringBoot启动类 5、SpringBoot数据库配置 二、配置数据库 在项目资源包中新建名为application.yml的文件,如图一。 建好文件我们就要开始写…

鸿蒙自动化发布测试版本app

创建API客户端 API客户端是AppGallery Connect用于管理用户访问AppGallery Connect API的身份凭据,您可以给不同角色创建不同的API客户端,使不同角色可以访问对应权限的AppGallery Connect API。在访问某个API前,必须创建有权访问该API的API…

上门预约家政服务小程序,为什么要开发小程序?

随着信息科技的发展,互联网家政的模式逐渐走入大众的生活中,为大众在快节奏生活下提供一个便捷、高效的家政服务体验,帮助大众解决家政的问题。同时在家政市场快速发展的当下,为家政企业带来新的商业机遇,为市场注入新…

图形验证码从设计到实现

验证码的使用场景 图形验证码在我们的日常使用中是非常常见的,比如一些App、小程序、PC网站等。涉及到的业务也比较广泛、例如用户登录流程、注册流程、找回密码。下面我们来大致梳理下上述流程: 登录流程 用户首先在登录界面输入手机号然后通过图形验…

Unity3D在2D游戏中获取触屏物体的方法

我们的需求是: 假如屏幕中一个棋盘,每个棋子是button构成的,我们希望手指或者鼠标在哪里,就显示那个位置的button信息。 网上有很多获取触屏物体信息的信息的方法如下面代码所示: Camera cam Camera.main; // pre-de…

P11019 「LAOI-6」[太阳]] 请使用最新版手机 QQ 体验新功能

English statement. You must submit your code at the Chinese version of the statement. 题目描述 你的 QQ 收到了一条新消息!但是你很生气,因为你看不到别人在手机 QQ 上发送的超级表情。 消息形如一个字符串 S,包含且仅包含一个超级表…

注册安全分析报告:熊猫频道

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…

LTE PSS主同步信号搜索 MATLAB实现

本期带来PSS相关检测说明和MATLAB实现,本期只讲相关方面的,所以MATLAB实现也是相关的部分,频偏估计方面的待下期开讲。 LTE 4G PSS搜索分为TDD搜索和FDD搜索,但是对于 TDD 和 FDD 而言,PSS同步信号的结构是完全一样的&…

探索Python的数学魔法:Numpy库的神秘力量

文章目录 探索Python的数学魔法:Numpy库的神秘力量背景:为什么选择Numpy?Numpy是什么?如何安装Numpy?五个简单的库函数使用方法场景应用常见Bug及解决方案总结 探索Python的数学魔法:Numpy库的神秘力量 背景…

springnboot +uniapp汽车租赁系统

springnboot uniapp汽车租赁系统 手机移动端:主页,租赁汽车展示,汽车租赁,我的租赁记录,还车记录,注册登录,修改个人资料 PC端管理后台:公告管理,用户管理,…

PMBOK® 第六版 项目进度管理知识领域

目录 读后感—PMBOK第六版 目录 提到“进度”,大家都能直观理解其含义。有统计指出,现在项目的延迟交付比例越来越高,并且这一趋势持续上升。造成项目延期的原因是多方面的,常见的原因之一是在项目初期,由于时间充裕&…

Java:方法的使用

一.什么是方法: 在 Java SE 中,方法是类中包含的功能块,它定义了一组执行某些操作的指令。方法用于封装可重复的代码逻辑,并使代码更简洁、易读和易维护。(类似于 C 语言中的 "函数") 二.方法的…

JavaFX基本控件-Button

JavaFX基本控件-Button 常用属性textpaddingalignmenttextAlignmentwidthheighttooltipborderwrapTextellipsisStringunderlinegraphicgraphicTextGapdisable 实现方式Java实现fxml实现 常用属性 text 设置文本内容 button.setText("测试按钮");padding 内边距 butt…

css 个人喜欢的样式 速查笔记

起因&#xff0c; 目的: 记录自己喜欢的&#xff0c; 觉得比较好看的 css. 下次用的时候&#xff0c;直接复制&#xff0c;很方便。 1 设置英语字体: Noto html <link rel"preconnect" href"https://fonts.googleapis.com"> <link rel"p…

[情商-12]:人际交流中倾听的三大层次,十二个小层次, 低情商摆样子;研发人员关注:逻辑层;高情商人关注:情绪、情感、需求、动机

目录 前言&#xff1a; 一、基础层次 二、进阶层次 三、高级层次 总结 前言&#xff1a; 倾听是一个复杂而多维的过程&#xff0c;它不仅仅是耳朵在工作&#xff0c;更是心灵和思维的深度参与。根据不同的理论和观察角度&#xff0c;倾听可以划分为不同的层次。以下是对倾…

AI文献综述神器,有这一款就够了!

我是娜姐 迪娜学姐 &#xff0c;一个SCI医学期刊编辑&#xff0c;探索用AI工具提效论文写作和发表。 当前的AI辅助文献综述的工具有很多&#xff0c;如果说功能最强大的&#xff0c;娜姐无疑要推SciSpace了。 SciSpace利用强大的AI算法&#xff0c;理解并建立研究论文之间的联…

一篇带你速通差分算法(C/C++)

个人主页&#xff1a;摆烂小白敲代码 创作领域&#xff1a;算法、C/C 持续更新算法领域的文章&#xff0c;让博主在您的算法之路上祝您一臂之力 欢迎各位大佬莅临我的博客&#xff0c;您的关注、点赞、收藏、评论是我持续创作最大的动力 差分算法是一种在计算机科学中常用的算法…