opencv-22 图像几何变换01-缩放-cv2.resize()(图像增强,图像变形,图像拼接)

news2024/12/21 20:25:49

什么是几何变换?

几何变换是计算机图形学中的一种图像处理技术,用于对图像进行空间上的变换,而不改变图像的内容。这些变换可以通过对图像中的像素位置进行调整来实现。

常见的几何变换包括:

平移(Translation):将图像在水平和/或垂直方向上进行平移,即将图像的每个像素沿着指定的距离进行移动。

缩放(Scaling):通过增大或减小图像的尺寸,使图像变得更大或更小。在缩放过程中,图像中的每个像素的位置会相应地调整。

旋转(Rotation):将图像绕着一个特定的旋转中心进行旋转,使得图像的内容按照指定的角度进行旋转。

翻转(Flip):将图像在水平和/或垂直方向上进行翻转,即将图像的像素按照指定的方向进行镜像反转。

剪切(Shearing):在某个方向上,将图像的一部分像素按照一定的比例进行平移,使得图像在该方向上发生错切效果。

几何变换的应用场景

几何变换在计算机图形学和计算机视觉领域有广泛的应用场景。以下是一些常见的几何变换的应用场景:

图像配准(Image Registration):在医学影像、遥感图像等领域,需要将多幅图像进行对齐,使得它们在空间上对应的位置一致。几何变换可以用于实现图像的平移、旋转和缩放,从而实现图像的配准。

图像增强(Image Enhancement):在图像增强中,几何变换可以用于调整图像的尺寸和位置,使得图像在显示或处理时更合适。比如将图像缩放到指定大小,或者对图像进行裁剪。

视觉效果和动画:在计算机游戏、动画制作等领域,几何变换可以用于实现图像或物体的平移、旋转和缩放,从而创建出各种视觉效果和动画。

图像变形(Image Warping):图像变形是指将图像的某些区域按照一定的规则进行变形,从而实现特定的效果,如人脸变形、风格化效果等。

2D到3D的转换:在计算机辅助设计(CAD)和虚拟现实(VR)中,几何变换可以用于将2D图像转换成3D模型或场景。

视角变换(Viewpoint Transformation):在计算机视觉中,几何变换可以用于将图像从不同视角进行观察,从而对图像进行重建、分析或识别。

图像拼接(Image Stitching):将多幅图像拼接成一幅全景图时,需要进行图像的平移、旋转和缩放等几何变换,以使得不同图像之间能够无缝地对齐。

总的来说,几何变换在图像处理和计算机图形学中起着至关重要的作用,它们能够改变图像的位置和形状,从而实现图像的对齐、增强、变形和合成等多种功能。

以下对几个常用的图像变换操作进行单独分析

缩放

在 OpenCV 中,使用函数 cv2.resize()实现对图像的缩放,该函数的具体形式为:

dst = cv2.resize( src, dsize[, fx[, fy[, interpolation]]] )

式中:
 dst 代表输出的目标图像,该图像的类型与 src 相同,其大小为 dsize(当该值非零时),
或者可以通过 src.size()、fx、fy 计算得到。
 src 代表需要缩放的原始图像。
 dsize 代表输出图像大小。
 fx 代表水平方向的缩放比例。
 fy 代表垂直方向的缩放比例。
 interpolation 代表插值方式,具体如表 5-1 所示。

在这里插入图片描述
在这里插入图片描述

在 cv2.resize()函数中,目标图像的大小可以通过“参数 dsize”或者“参数 fx 和 fy”二者之一来指定,具体介绍如下。

 情况 1:通过参数 dsize 指定
如果指定参数 dsize 的值,则无论是否指定了参数 fx 和 fy 的值,都由参数 dsize 来决定目
标图像的大小。
此时需要注意的是,dsize 内第 1 个参数对应缩放后图像的宽度(width,即列数 cols,与参数 fx 相关),第 2 个参数对应缩放后图像的高度(height,即行数 rows,与参数 fy 相关)。
指定参数 dsize 的值时,x 方向的缩放大小(参数 fx)为:

(double)dsize.width/src.cols

同时,y 方向的缩放大小(参数 fy)为:

(double)dsize.height/src.rows

情况 2:通过参数 fx 和 fy 指定

如果参数 dsize 的值是 None,那么目标图像的大小通过参数 fx 和 fy 来决定。此时,目标图像的大小为:

dsize=Size(round(fx*src.cols),round(fy*src.rows))

插值是指在对图像进行几何处理时,给无法直接通过映射得到值的像素点赋值。

例如,将图像放大为原来的 2 倍,必然会多出一些无法被直接映射值的像素点,对于这些像素点,插值方式决定了如何确定它们的值。

除此以外,还会存在一些非整数的映射值,例如,反向映射可能会把目标图像中的像素点值映射到原始图像中的非整数值对应的位置上,当然原始图像内是不可能存在这样的非整数位置的,即目标图像上的该像素点不能对应到原始图像的某个具体位置上,此时也要对这些像素点进行插值处理,以完成映射。

函数 cv2.resize()能实现对原始图像的缩放功能,需要注意的是,开始运算前,操作前的目标图像 dst 自身的大小、类型与最终得到的目标图像 dst 是没有任何关系的。
目标图像 dst 的最终大小和类型是通过 src、dsize、fx、fy 指定的。如果想让原始图像调整为和目标图像一样大,
则必须通过上述属性指定。

当缩小图像时,使用区域插值方式(INTER_AREA)能够得到最好的效果;
当放大图像时,使用三次样条插值(INTER_CUBIC)方式和双线性插值(INTER_LINEAR)方式都能够取得较好的效果。
三次样条插值方式速度较慢,双线性插值方式速度相对较快且效果并不逊色。

实验:使用函数 cv2.resize()对一个数组进行简单缩放

import cv2
import numpy as np
img=np.ones([2,4,3],dtype=np.uint8)
#获取图像的尺寸
size=img.shape[:2]
print("size=\n",size)
#缩放图像
rst=cv2.resize(img,size)

print("img.shape=\n",img.shape)
print("img=\n",img)
print("rst.shape=\n",rst.shape)
print("rst=\n",rst)

在本例中,我们期望通过函数 cv2.resize()对原始图像进行缩放。为了方便观察,将目标图像设置为与原始图像等大小
运行结果:

size=
 (2, 4)
img.shape=
 (2, 4, 3)
img=
 [[[1 1 1]
  [1 1 1]
  [1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]
  [1 1 1]
  [1 1 1]]]
rst.shape=
 (4, 2, 3)
rst=
 [[[1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]]]

通过程序我们观察到,我们的目的没有达到,目标图像的大小与原始图像的大小并不一致。
原始图像的大小是 2 行 4 列,目标图像的大小是 4 行 2 列:

 目标图像的行数是原始图像的列数。
 目标图像的列数是原始图像的行数。

通过以上例题我们进一步确认:函数 cv2.resize()内 dsize 参数与图像 shape 属性在行、列的顺序上是不一致的,或者说,
 在 shape 属性中,第 1 个值对应的是行数,第 2 个值对应的是列数。
 在 dsize 参数中,第 1 个值对应的是列数,第 2 个值对应的是行数。
我们通常使用等大小的图像进行测试,在这种情况下,可能无法发现 cv2.resize()函数内 dsize 参数的具体使用方式。
在使用 cv2.resize()函数时,要额外注意参数 dsize 的属性顺序问题

实验2:使用函数 cv2.resize()完成一个简单的图像缩放

import cv2
img=cv2.imread("lena.png")
print(img.shape)
rows,cols=img.shape[:2]
#重置图像大小
size=(int(cols*0.9),int(rows*0.5))
rst=cv2.resize(img,size)
print("img.shape=",img.shape)
print("rst.shape=",rst.shape)

cv2.imshow("img",img)
cv2.imshow("rst",rst)

cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果:

(512, 512, 3)
img.shape= (512, 512, 3)
rst.shape= (256, 460, 3)

在这里插入图片描述
从程序可以看出:
 列数变为原来的 0.9 倍
 行数变为原来的 0.5 倍

实验3:控制函数 cv2.resize()的 fx 参数、fy 参数,完成图像缩放

import cv2
img=cv2.imread("lena.png")
print(img.shape)
rows,cols=img.shape[:2]
#重置图像大小
size=(int(cols*0.9),int(rows*0.5))

#rst=cv2.resize(img,size)

rst=cv2.resize(img,None,fx=2,fy=0.5)


print("img.shape=",img.shape)
print("rst.shape=",rst.shape)

cv2.imshow("img",img)
cv2.imshow("rst",rst)

cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果:

(512, 512, 3)
img.shape= (512, 512, 3)
rst.shape= (256, 1024, 3)

在这里插入图片描述

从程序可以看出:
 fx 进行的是水平方向的缩放,将列数变为原来的 2 倍,得到 512×2=1024。
 fy 进行的是垂直方向的缩放,将行数变为原来的 0.5 倍,得到 512×0.5=256。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/788513.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣热门100题之无重复字符的连续子串【中等】

题目描述 给定一个字符串 s ,请你找出其中不含有重复字符的 最长子串 的长度。 示例 1: 输入: s “abcabcbb” 输出: 3 解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。 示例 2: 输入: s “bbbbb” 输出: 1 解释: 因为无重复字符的最长子…

Java8实战-总结6

Java8实战-总结6 通过行为参数化传递代码对付啰嗦匿名类第五次尝试:使用匿名类第六次尝试:使用Lambda表达式第七次尝试:将List类型抽象化 真实的例子用Comparator来排序 通过行为参数化传递代码 对付啰嗦 人们不愿意用那些很麻烦的功能或概…

个微API,微信机器人开发

简要描述: 退出群聊 请求URL: http://域名地址/quitChatRoom 请求方式: POST 请求头Headers: Content-Type:application/jsonAuthorization:login接口返回 参数: 参数名必选类型说明wI…

Redis实战案例24-关注推送

1. Feed流实现方案 拉模式主要缺点,延迟问题,极端情况某个用户关注了成千上万的up主,每位up主又发布了十几条博客,此时拉模式的延迟就会很高; 推模式缺点也很明显,内存消耗太大,假设up主是千万级…

【idea工具】idea工具,build的时候提示:程序包 com.xxx.xx不存在的错误

idea工具,build的时候提示:程序包 com.xxx.xx不存在的错误,如下图,折腾了好一会, 做了如下操作还是不行,idea工具编译的时候,还是提示 程序包不存在。 a. idea中,重新导入项目,也还…

基于DNN深度学习网络的OFDM+QPSK信号检测算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 ............................................................................. Transmitt…

区块链实验室(11) - PBFT耗时与流量特征

以前面仿真程序为例,分析PBFT的耗时与流量特征。实验如下,100个节点构成1个无标度网络,节点最小度为5,最大度为38. 从每个节点发起1次交易共识。统计每次交易的耗时以及流量。本文所述的流量见前述仿真程序的说明:区块链实验室(3)…

页面设计—FlexContainer弹性容器组件详解

一、组件介绍 Flex 是 Flexible Box 的缩写,意为"弹性布局",用来为盒状模型提供最大的灵活性。任何一个容器都可以指定为 Flex 布局,可以与栅格布局结合使用。 二、样式介绍 三、如何使用 (1)找到FlexCo…

实用!SD人物表情提示词合辑;秒变大神的Python速查表;开源LLM微调训练指南;LLM开发必修课 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 太实用了!Stable Diffusion 的24个表情提示词 Pensive 沉思 Smiling 微笑 Disgusted 厌恶 Laughing 大笑 Shocked 震惊 Fr…

【数据分析专栏之Python篇】全网最细Anaconda安装与配置

文章目录 [toc] 前言一、 Anaconda是什么1.1 简介1.2 特点1.3 Anaconda、conda、pip、virtualenv的区别 二、为什么使用Anaconda三、安装步骤3.1 下载安装3.2 配置conda源 四、结语五、附录六、参考 前言 大家好!本篇给大家介绍 Anaconda 安装及配置。 一、 Anaco…

【分享】揭秘BlueWillow::AI绘画工具的平替新选择

哈喽,木易巷上线啦! 今天我要给大家介绍一个全新的AI绘画工具——BlueWillow。如果你正在寻找一款能够替代Midjourney的工具,那么BlueWillow绝对值得一试! 官网链接和邀请链接都在最后哦! 首先,BlueWillo…

< 今日小技巧:Axios封装,接口请求增加防抖功能 >

文章目录 👉 前言👉 一、核心代码 : 防抖函数👉 二、Axios封装中的配置👉 三、实现原理👉 结论👉 补充优化: 解决多个接口请求,拦截掉了需要的请求> 防抖函数> 引用…

c 学习笔记(自用)---GCC编译器

1.GCC编译器的使用 1) 一个c文件预处理和编译的过程 可以用以上命令去逐步调试下,看看预处理的过程 2)命令举例与解释 #源文件较少的情况下 gcc -o test main.c sub.c #分别将 main.c 和sub.c文件进行预处理、编译、汇编, #…

push_back 和 emplace_back 的区别

文章目录 1、vector::push_back1.1 void push_back(T&& x) ; (C11)参数返回值类型大小 和 容量移动左值用户自定义类型使用 push_back 1.2 void push_back(const T &x);参数返回值类型 1.3 如果 vector 的 size 超过当前capacity,push_back 会使迭代器、…

一分钟学一个 Linux 命令 - rm

前言 大家好,我是 god23bin,欢迎回到咱们的《一分钟学一个 Linux 命令》系列,今天我要讲的是一个比较危险的命令,rm 命令,没错,你可以没听过 rm 命令,但是删库跑路你不可能没听过吧&#xff1f…

RISCV -3 RV32I/RV64I基本整型指令集

RISCV -3 RV32I/RV64I基本整型指令集 1 RV32I Base Integer Instruction Set1.1 Programmers’ Model for Base Integer ISA1.2 Base Instruction Formats1.3 Immediate Encoding Variants1.4 Integer Computational Instructions1.4.1 Integer Register-Immediate Instruction…

25-30天每日强训选择题改错解析

int i5; int s(i)(i)(i–)(–i); s( )//s 的值是什么? A 28 B 25 C 21 D 26 E 24 F 23 正确答案: E 5775 24 或者 --在后先不变化数值 -- 在前先变化再运算 以下哪项不属于java类加载过程? A 生成java.lang.Class对象 B int类型对象成…

【Vue】day04-组件通信

day04 一、学习目标 1.组件的三大组成部分(结构/样式/逻辑) scoped解决样式冲突/data是一个函数 2.组件通信 组件通信语法 父传子 子传父 非父子通信(扩展) 3.综合案例:小黑记事本(组件版&#xf…

Windows下达梦数据库图形化安装、初始化数据库及连接

文章目录 前言一、达梦数据库安装1、下载安装包2、解压3、安装 二、初始化数据库三、连接数据库1、客户端工具2、输入连接信息3、成功连接 总结 前言 本节将介绍达梦数据库的图形化界面安装的细节,本节以Win11系统及DM8为基础进行讲解,虽然是图形化安装…

5. Bean 的作用域和生命周期

目录 1. Bean 被修改的案例 2. 作用域定义 2.1 Bean 的 6 种作用域 singleton prototype request session application(了解) websocket (了解) 单例作用域(singleton)VS 全局作用域(…