从零开始学cv-5: 图像的仿射变换

news2025/1/10 10:44:12

文章目录

  • 一,简介:
  • 二,图像仿射变换详解
    • 2.1,图像平移:
    • 2.2 ,图像旋转:
    • 2.3,仿射变换:


一,简介:

仿射变换(Affine Transformation 或 Affine Map)是一种将二维坐标(x, y)映射到另一组二维坐标(u, v)的线性变换。在这种变换中,坐标点的相对位置和属性保持不变,即变换是保持直线平行性和直线交点不变的。仿射变换主要包括以下几种基本操作:平移、旋转、镜像、缩放、翻转和错切。

二,图像仿射变换详解

具体来说,仿射变换的过程可以描述为以下几种情况:

● 平移:将图像沿某个方向移动一定距离。
● 旋转:围绕某个点将图像旋转一定角度。
● 镜像:以某条线为轴,将图像进行对称翻转。
● 缩放:按照一定比例增大或缩小图像。
● 翻转:将图像沿水平或垂直方向进行翻转。
● 错切:沿某一方向倾斜图像,使得图像的一侧发生平移,而另一侧保持不动。

以下图所示,可以直观地展示这些仿射变换的效果。需要注意的是,虽然仿射变换是线性的,但它包括了非线性成分(如错切),因为它可以表示为线性变换的组合,并附加一个平移项。
在这里插入图片描述
在opencv_python中,实现放射变换的函数为:
cv2.warpAffine(img,M,size,flags,borderMode,borderValue)
函数说明:可以通过构建不同的M矩阵以及设置不同的参数来实现不同的仿射变换效果.

参数说明:
img:输入图像,可以是灰度图像或彩色图像。
M:一个 2×3 的变换矩阵,用于定义仿射变换。
size:输出图像的大小,格式为 (width, height)。
flags:插值方法标志,用于确定如何计算输出图像的像素值。常见的插值方法包括:
cv2.INTER_NEAREST:最近邻插值。
cv2.INTER_LINEAR:双线性插值(默认值)。
cv2.INTER_AREA:使用像素区域关系进行重采样。
cv2.INTER_CUBIC:双三次插值。
cv2.INTER_LANCZOS4:Lanczos 插值。
borderMode:边界模式,用于处理边界外的像素。默认值为 cv2.BORDER_CONSTANT。其他选项包括:
cv2.BORDER_REPLICATE:复制边界像素。
cv2.BORDER_REFLECT:反射边界像素。
cv2.BORDER_REFLECT101:反射边界像素,不包括边缘。
cv2.BORDER_WRAP:包裹模式。
borderValue:当 borderMode 为 cv2.BORDER_CONSTANT 时,用于填充边界外的像素的值。默认值为 (0, 0, 0),对于灰度图像是单一值,对于彩色图像是三个值。
borderValue - 边界填充值; 默认情况下,它为0
其中:M作为仿射变换矩阵,一般反映平移或旋转的关系,为InputArray类型的2×3的变换放射变换的构建可以遵循下图
在这里插入图片描述
简而言之,cv2.warpAffine 函数通过指定的变换矩阵 M 对输入图像 img 进行仿射变换,生成指定大小 size 的新图像,并使用指定的插值方法和边界模式来处理变换过程中的像素计算和边界问题。

2.1,图像平移:

将图像中所有的点按照指定的平移量水平或者垂直移动。根据上图中可知,要想实现图像平移操作,需要设置移动的距离X,Y
在这里插入图片描述
代码实现:

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵H
# 在x轴方向移动多少距离,在y轴方向移动多少距离
H = np.float32([[1, 0, 100], [0, 1, 100]])
rows, cols = img.shape[:2]
# 注意这里rows和cols需要反置,即先列后行
res = cv2.warpAffine(img, H, (cols*2, rows*2))  # 输出dsize必须大于原图,不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果:
原图:
在这里插入图片描述
效果图:
在这里插入图片描述
图像从原始位置像右下方移动了100个像素

2.2 ,图像旋转:

以图像的中心为原点,旋转一定的角度,也就是将图像上的所有像素都旋转一个相同的角度。旋转后图像的大小一般会改变,即可以把转出显示区域的图像截去,或者扩大图像范围来显示图像的所有部分。图像旋转的仿射矩阵m的构建如下所示:
在这里插入图片描述
此仿射矩阵的构建需要确定旋转角度的正弦和余弦值,相对平移而言稍显麻烦,所以opencv提供了一个简单的获取仿射矩阵的方法cv2.getRotationMatrix2D(center, angle, scale)
参数说明:

center:旋转的中心点坐标,格式为 (centerX, centerY)。
angle:旋转角度,正值表示逆时针旋转,负值表示顺时针旋转,单位为度。
scale:图像缩放比例,如果 scale 为 1,则图像大小保持不变;如果 scale 大于 1,图像放大;如果 scale 小于 1,图像缩小。
返回值:返回一个 2×3 的变换矩阵,可以传递给 cv2.warpAffine 函数来对图像进行旋转

代码:

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵H

rows, cols = img.shape[:2]
M = cv2.getRotationMatrix2D((cols/2, rows/2), 45, 1)  # 旋转中心为图像中点,角度为四十五度,逆时针旋转炳保持原大小
# 注意这里rows和cols需要反置,即先列后行
res = cv2.warpAffine(img, M, (cols*2, rows*2))  # 输出dsize必须大于原图,不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果:
在这里插入图片描述

2.3,仿射变换:

仿射变换是线性变换,除了简单的进行单独使用,还可以将其中的几种结合在一起实现新的仿射变换,但若执行的操作很多,相应要构造的仿射矩阵也会更复杂,所以OpenCV提供了一个求仿射变换矩阵的函数:cv2.getAffineTransform( src, dst ):
cv2.getAffineTransform 用于计算从一个三角形到另一个三角形的仿射变换矩阵。这个矩阵可以用来进行图像的仿射变换,如平移、旋转、缩放和剪切。cv2.getAffineTransform( src, dst ):
函数说明:

通过找原图像中三个点的坐标和变换图像的相应三个点坐标,创建一个2X3的矩阵。最后这个矩阵会被传给函数cv2.warpAffine()
功能:计算从一个二维三角形到另一个二维三角形的仿射变换矩阵。
参数:
src:源三角形三个顶点的坐标,格式为浮点数数组
dst:目标三角形三个顶点的坐标,格式与 src 相同。
返回值:返回一个
2×3 的仿射变换矩阵,可以传递给 cv2.warpAffine 函数来对图像进行变换。
简而言之,cv2.getAffineTransform 通过三个对应点的坐标来计算仿射变换矩阵。这三个点可以是任意位置,但通常它们被选为图像中的关键特征点,以确保变换后的图像与目标位置对齐。下面贴一张图片加深理解:
在这里插入图片描述
将左图三个点空间拉伸到右图三个点位置

代码:

import cv2
import numpy as np

img = cv2.imread(r'D:\pythonProject\13.jpg')
rows, cols, ch = img.shape

pts1 = np.float32([[0, 0], [200, 50], [50, 200]])
pts2 = np.float32([[10, 100], [200, 50], [100, 250]])
M = cv2.getAffineTransform(pts1, pts2)
dst = cv2.warpAffine(img, M, (cols, rows))

cv2.imshow("dst", dst)
cv2.waitKey(0)

效果:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2051750.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Lumina学术引擎免费问世,性能超谷歌学术5倍

Lumina介绍 Lumina是一款完全免费的AI学术搜索引擎,借助强大的数据库和高效的匹配速度。利用超过 15 种模型从超过 100 万篇期刊文章中找出最相关的来源,从而构建答案。搜索结果相关性平均比谷歌学术高出5倍,支持超1亿研究对象搜索&#xff…

8.18日学习打卡---Spring Cloud Alibaba(五)

8.18日学习打卡 目录: 8.18日学习打卡 RocketMQ什么是RocketMQ生产者和消费者技术架构 RocketMQ安装与配置环境搭建与测试RocketMQ管理命令 RocketMQ发送消息普通消息顺序消息之全局消息顺序消息之局部消息消费者消费消息延迟消息延迟消息代码实现单向消息批量消息过…

【HarmonyOS】云开发-用户自动认证

背景 华为云服务提供了统一认证的云服务,支持手机、邮箱等自定义登录服务,并且提供了免费使用的额度,这样子方便中小企业或者项目快速的开发工作。下面是支持的认证方式: 操作步骤 1.AGC(AppGallery Connect)创建项目 在AGC界…

C++ | Leetcode C++题解之第342题4的幂

题目: 题解: class Solution { public:bool isPowerOfFour(int n) {return n > 0 && (n & (n - 1)) 0 && n % 3 1;} };

zabbix监控进程、日志、主从状态和主从延迟

zabbix监控进程、日志、主从状态和主从延迟 监控进程1、下载服务2、编写脚本3、编写zabbix_agentd.conf4、新建监控项配置触发器5、查看邮件 监控日志1、上传log.py的2、编写zabbix_agentd.conf3、新建监控项配置触发器 监控数据库主从状态1、编写/etc/hosts(master…

IOS 09 R.swift框架和使用方法

R.swift框架主要是实现通过类字段访问字符串,图片,等资源;类似Android那边通过R类访问,好处是有提示,如果缺少资源,直接就是编译错误;OC类似的功能叫R.objc。 添加依赖 添加依赖 #将资源&…

第八周:机器学习笔记

第八周机器学习笔记 摘要Abstract机器学习1. 鱼和熊掌和可兼得的机器学习1.1 Deep network v.s. Fat network 2. 为什么用来验证集结果还是不好? Pytorch学习1. 卷积层代码实战2. 最大池化层代码实战3. 非线性激活层代码实战 总结 摘要 本周学习对李宏毅机器学习视…

AI学习记录 - Word2Vec 超详细解析

创作不易,点个赞 我们有一堆文本,词汇拆分 sentences ["jack like dog", "jack like cat", "jack like animal","dog cat animal", "banana apple cat dog like", "dog fish milk like"…

URP平面阴影合批处理 shadow

闲谈 相信大家在日常工作中发现了一个问题 , urp下虽然可以做到3个Pass 去写我们想要的效果,但是,不能合批(不能合批,那不是我们CPU要干冒烟~!) 好家伙,熊猫老师的偏方来了 &#x…

【数值方法-Python实现】Crout分解+追赶法实现

涉及Crout分解、追赶法的线性方程组求解方法的Python实现。 原文链接:https://www.cnblogs.com/aksoam/p/18366119 Codes def CroutLU(A:np.ndarray)->Tuple[np.ndarray,np.ndarray]:"""Crout LU分解算法,ALUinput:A: (n,n) np.ndarray,方阵out…

DrissionPage自动化获取城市数据内容

一、获取页面内容 二、最终结果 上海市 约收录140个指标 查看98075次 人均GDP 153299元 公交车 17899辆 户籍人口 1469.3万人 三、代码 from DrissionPage._pages.chromium_page import ChromiumPage import time page ChromiumPage() page.get(https://www.swguancha.com/…

【Delphi】中多显示器操作基本知识点

提要: 目前随着计算机的发展,4K显示器已经逐步在普及,笔记本的显示器分辨率也都已经超过2K,多显示器更是普及速度很快。本文介绍下Delphi中操作多显示器的基本知识点(Windows系统),这些知识点在…

UniFab 是一款由人工智慧驅動的視訊增強器+ crack

UniFab 是一款功能强大的视频处理工具,包括 10 个基于 AI 的功能。使用 UniFab,您可以提高视频和音频质量、将视频转换为不同的格式、根据自己的喜好编辑视频等等。以下是适用于 Windows 的 UniFab 程序的简要说明: 视频转换器。UniFab 支持 1000 多种视频格式的转换,包括 …

构建自己的图数据集

代码: import warnings warnings.filterwarnings("ignore") import torch from torch_geometric.data import Datax torch.tensor([[2,1],[5,6],[3,7],[12,0]],dtypetorch.float) y torch.tensor([0,1,0,1],dtypetorch.float)#定义边 edge_index torc…

⌈ 传知代码 ⌋ DETR[端到端目标检测]

💛前情提要💛 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间,对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取 以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦&#x…

Leetcode3232. 判断是否可以赢得数字游戏

Every day a Leetcode 题目来源:3232. 判断是否可以赢得数字游戏 解法1:3232. 判断是否可以赢得数字游戏 用一个 sum1 统计个位数的和,sum2 统计十位数的和。 只要 sum1 和 sum2 不相等,Alice 拿大的就能赢得这场游戏。 代码…

【论文阅读】HuatuoGPT-II, One-stage Training for Medical Adaption of LLMs

总体概要 本文深入探讨了一款专为医疗领域设计的大规模语言模型——HuatuoGPT-II的创新、性能与应用。HuatuoGPT-II采用统一的单阶段训练流程,将传统的继续预训练和监督微调整合,有效解决了医疗数据的异质性问题,包括语言、体裁和格式差异&a…

【STM32单片机_(HAL库)】3-2-1【中断EXTI】【电动车报警器项目】继电器定时开闭

1.硬件 STM32单片机最小系统继电器模块 2.软件 继电器模块alarm驱动文件添加GPIO常用函数main.c程序 #include "sys.h" #include "delay.h" #include "led.h" #include "alarm.h"int main(void) {HAL_Init(); …

硬件面试经典 100 题(71~90 题)

71、请问下图电路的作用是什么? 该电路实现 IIC 信号的电平转换(3.3V 和 5V 电平转换),并且是双向通信的。 上下两路是一样的,只分析 SDA 一路: 1) 从左到右通信(SDA2 为输入状态&…

同一台电脑同时连接使用Gitee(码云)和Github

1、添加对应的密钥 ssh-keygen -t rsa -C "your_emailexample.com" -f ~/.ssh/github_id-rsa //生成github秘钥 ssh-keygen -t rsa -C "your_emailexample.com" -f ~/.ssh/gitee_id-rsa //生成码云秘钥 2、在 ~/.ssh 文件里会生成对应的文件 文件夹里会…