opencv基础篇 ——(九)图像几何变换

news2024/11/16 9:50:28

        图像几何变换是通过对图像的几何结构进行变换来改变图像的形状、大小、方向或者透视关系。常见的图像几何变换包括缩放、旋转、平移、仿射变换和透视变换等。下面对这些几何变换进行简要介绍:

  1. 矩阵的转置(transpose ): 对于图像来说,它可以将图像的行和列进行交换。转置后图像的高度和宽度也将互换。

  2. 镜像变换(flip):它可以沿水平、垂直或两个方向同时对图像进行翻转。

  3. 缩放(Resize): 缩放是改变图像尺寸大小的一种变换操作。可以按比例缩小或放大图像。在 OpenCV 中,可以使用 cv::resize 函数实现图像的缩放操作。

  4. 旋转(Rotation): 旋转是围绕图像的中心点或指定点进行角度旋转的操作。可以实现任意角度的旋转。在 OpenCV 中,可以使用 cv::getRotationMatrix2Dcv::warpAffine 函数实现图像的旋转操作。

  5. 平移(Translation): 平移是沿着图像的水平和垂直方向移动图像的操作。可以将图像向左、向右、向上或向下平移。在 OpenCV 中,可以使用仿射变换矩阵来实现图像的平移操作。

  6. 仿射变换(Affine Transformation): 仿射变换是包括平移、旋转、缩放和剪切等操作的一种线性变换。可以通过变换矩阵来描述。在 OpenCV 中,可以使用 cv::getAffineTransform 函数和 cv::warpAffine 函数实现仿射变换。

  7. 透视变换(Perspective Transformation): 透视变换是用于处理图像的透视失真的变换操作。常用于校正摄像头捕捉的斜视图像。在 OpenCV 中,可以使用 cv::getPerspectiveTransform 函数和 cv::warpPerspective 函数实现透视变换。

        这些几何变换技术在图像处理和计算机视觉中具有广泛的应用,可以用于图像校正、对象检测、图像配准等任务。在实际应用中,常常需要结合多种几何变换来实现复杂的图像处理效果。

矩阵的转置(transpose

        图像的转置就是将图像像素的x坐标和y坐标互换。这样将改变图像的高度和宽度,转置后图像的高度和宽度也将互换。

        函数原型:

void cv::transpose(InputArray src, OutputArray dst)

        函数可描述为: 

                dst(i,j)=src(j,i)

镜像变换(flip)

        它可以沿水平、垂直或两个方向同时对图像进行翻转。

函数原型:

void cv::flip(InputArray src, OutputArray dst, int flipCode)
  • flipCode:指定翻转操作的方式。
    • 当 flipCode > 0 时,沿着 x 轴翻转(水平翻转)。
    • 当 flipCode = 0 时,沿着 y 轴翻转(垂直翻转)。
    • 当 flipCode < 0 时,同时沿着 x 轴和 y 轴翻转(水平和垂直同时翻转)。       

函数可描述为: 

可以配合transpose 实现简单的旋转,如下面代码实现90、180、270度的旋转:

    if (degree == 90) 
    {
        cv::transpose(src, desc);
        cv::flip(desc, desc, 1);
    } 
	else if (degree == 180) 
	{
        cv::flip(src, desc, -1);
    } 
	else if (degree == 270) 
	{
        cv::transpose(src, desc);
        cv::flip(desc, desc, 0);
    }

缩放(Resize)

        cv::resize 用于调整图像大小的函数,它可以将输入图像按指定的缩放因子或目标尺寸进行放大或缩小,生成一个新的尺寸不同的输出图像。该函数在图像处理、计算机视觉以及需要调整图像分辨率的各类应用中广泛使用。

函数原型

cv::resize(
    InputArray src,
    OutputArray dst,
    Size dsize,
    double fx = 0,
    double fy = 0,
    int interpolation = INTER_LINEAR
);
  • int interpolation (默认为 INTER_LINEAR): 插值方法,用于决定如何计算新像素位置的值。可选值包括:

    • INTER_NEAREST: 最近邻插值(快速,但可能会出现锯齿)。
    • INTER_LINEAR: 双线性插值(平滑,适用于大部分情况)。
    • INTER_AREA: 使用像素区域关系进行重采样(保持图像面积,适合缩小图像)。
    • INTER_CUBIC: 三次样条插值(较慢,但更平滑)。
    • INTER_LANCZOS4: 兰索斯插值(最慢,最高质量,尤其适用于大幅图像缩放)。

使用示例

cv::Mat inputImage; // 假设已经加载了输入图像

cv::Mat resizedImage;
cv::resize(inputImage, resizedImage, cv::Size(640, 480)); // 指定目标尺寸为 640x480

// 或者按比例缩放
cv::resize(inputImage, resizedImage, {}, 0.5, 0.5); // 缩小至原图一半大小

// 现在 resizedImage 存储了调整大小后的图像

旋转(Rotation)

        根据指定的旋转中心、旋转角度和可选的缩放因子通过getRotationMatrix2D 函数生成一个2x3的旋转变换矩阵,该矩阵可以与 cv::warpAffine() 函数结合使用,实现图像的旋转操作。

使用示例

cv::Mat inputImage; // 假设已经加载了输入图像
cv::Point2f center(inputImage.cols / 2.0f, inputImage.rows / 2.0f); // 设置旋转中心为图像中心

double angle = 45.0 * CV_PI / 180.0; // 转换为弧度,逆时针旋转45度
double scale = 1.0; // 不进行缩放

cv::Mat rotMat = cv::getRotationMatrix2D(center, angle, scale);

// 接下来可以使用 rotMat 与 cv::warpAffine() 函数配合,实现图像的实际旋转操作
cv::Mat rotatedImage;
cv::warpAffine(inputImage, rotatedImage, rotMat, inputImage.size());

平移(Translation)

        图像平移是一种常见的图像处理操作,它将图像中的所有像素沿着指定的方向移动一定的距离。在 OpenCV 中,可以通过仿射变换来实现图像的平移。

下面是一个简单的步骤来实现图像的平移:

  1. 定义平移矩阵:首先,需要定义一个平移矩阵,它是一个 2x3 的矩阵,用于指定平移的距离。对于二维图像,平移矩阵的形式如下:

 1, 0, dx

 0, 1, dy

     2.应用仿射变换:接下来,使用 cv::warpAffine 函数来应用定义的平移矩阵,实现图像的平移。

使用示例

#include <opencv2/opencv.hpp>

int main() {
    // 读取图像
    cv::Mat image = cv::imread("image.jpg");

    // 定义平移矩阵
    cv::Mat M = (cv::Mat_<double>(2,3) << 1, 0, 100, 0, 1, 50); // 在 x 方向上平移 100 像素,在 y 方向上平移 50 像素

    // 应用仿射变换
    cv::Mat translatedImage;
    cv::warpAffine(image, translatedImage, M, image.size());

    // 显示原始图像和平移后的图像
    cv::imshow("Original Image", image);
    cv::imshow("Translated Image", translatedImage);
    cv::waitKey(0);

    return 0;
}

仿射变换(Affine Transformation)

        仿射变换是一种特殊的平面几何变换,包括平移、旋转、缩放和剪切(shear),但不包括透视效应。该函数根据提供的三对对应点生成一个2x3的仿射变换矩阵,该矩阵可以与 cv::warpAffine() 函数结合使用,实现图像的仿射变换。

仿射变换步骤:

  1. 计算仿射变换矩阵: 根据给定的源图像中三个点 src 与目标图像中对应三个点 dst,计算出一个2x3的仿射变换矩阵。该矩阵描述了从源图像到目标图像的线性变换关系,可以应用于整个图像,使得图像中所有点都按照仿射变换规则进行映射。

  2. 返回结果: 返回计算得到的仿射变换矩阵,类型为 cv::Mat,大小为 2x3,元素类型通常为 CV_64F(双精度浮点数)。

使用示例

cv::Point2f srcPts[3] = { /* 三个源图像对应点坐标 */ };
cv::Point2f dstPts[3] = { /* 三个目标图像对应点坐标 */ };

cv::Mat affineTransform = cv::getAffineTransform(srcPts, dstPts);

// 接下来可以使用 affineTransform 与 cv::warpAffine() 函数配合,实现图像的实际仿射变换操作
cv::Mat transformedImage;
cv::warpAffine(inputImage, transformedImage, affineTransform, inputImage.size());

透视变换(Perspective Transformation)

        透视变换是一种复杂的二维几何变换,能够模拟真实世界中物体因距离差异而产生的远小近大的透视效果,常用于图像的校正、拼接、虚拟现实(VR)、增强现实(AR)等应用。

透视变换步骤:

  1. 计算透视变换矩阵: 根据给定的源四边形顶点 src 和目标四边形顶点 dst,使用最小二乘法计算出一个3x3的透视变换矩阵。该矩阵描述了从源四边形到目标四边形的线性变换关系,可以应用于整个图像,使得图像中所有点都按照透视变换规则进行映射。

  2. 返回结果: 返回计算得到的透视变换矩阵,类型为 cv::Mat,大小为 3x3,元素类型通常为 CV_64F(双精度浮点数)。

使用示例

cv::Point2f srcPts[4] = { /* 四个源图像顶点坐标 */ };
cv::Point2f dstPts[4] = { /* 四个目标图像顶点坐标 */ };

cv::Mat perspTransf = cv::getPerspectiveTransform(srcPts, dstPts);

// 接下来可以使用 perspTransf 与 cv::warpPerspective() 函数配合,实现图像的实际透视变换操作
cv::Mat transformedImage;
cv::warpPerspective(inputImage, transformedImage, perspTransf, inputImage.size());

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1630576.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

吴恩达2022机器学习专项课程(一) 7.1 逻辑回归的成本函数第三周课后实验:Lab4逻辑回归的损失函数

问题预览/关键词 上节课回顾逻辑回归模型使用线性回归模型的平方误差成本函数单个训练样本的损失损失函数&#xff0c;成本函数&#xff0c;代价函数的区别线性回归损失函数和逻辑回归损失函数的区别逻辑回归模型的成本函数是什么&#xff1f;逻辑回归模型的损失函数实验逻辑回…

STL——List常用接口模拟实现及其使用

认识list list的介绍 list是可以在常数范围内在任意位置进行插入和删除的序列式容器&#xff0c;并且该容器可以前后双向迭代。 list的底层是双向链表结构&#xff0c;双向链表中每个元素存储在互不相关的独立节点中&#xff0c;在节点中通过指针指向其前一个元素和后一个元素…

linux tcpdump的交叉编译以及使用

一、源码下载 官网&#xff1a;点击跳转 二、编译 1、解压 tar -xf libpcap-1.10.4.tar.xz tar -xf tcpdump-4.99.4.tar.xz 2、配置及编译 //libpcap&#xff1a; ./configure --hostarm-linux --targetarm-linux CCarm-linux-gcc --with-pcaplinux --prefix$PWD/build//t…

对象与JSON字符串互转

1、JSON字符串转化成JSON对象 JSONObject jsonobject JSON.parseObject(str); 或者 JSONObject jsonobject JSONObject.parseObject(str); 功能上是一样的&#xff0c;都是将JSON字符串&#xff08;str&#xff09;转换成JSON对象 jsonobject 。注意str一定得是以键值对存在…

STM32之HAL开发——电容按键

电容按键原理 电容器 (简称为电容) 就是可以容纳电荷的器件&#xff0c;两个金属块中间隔一层绝缘体就可以构成一个最简单的电容。如图 32_1 (俯视图)&#xff0c;有两个金属片&#xff0c;之间有一个绝缘介质&#xff0c;这样就构成了一个电容。这样一个电容在电路板上非常容…

二维数组求最大值(C语言)

一、N-S流程图&#xff1b; 二、运行结果&#xff1b; 三、源代码&#xff1b; # define _CRT_SECURE_NO_WARNINGS # include <stdio.h>int main() {//初始化变量值&#xff1b;int i, j, max 0, row 0, colum 0;int arr[3][4] { {1, 2, 3}, {4, 5, 16}, {7, 8, 9} …

线上办理离婚快速离婚,无需双方见面异地可办

现在离婚有两种方式 一种是协议离婚&#xff0c;双方都同意的情况下&#xff0c;可以去民政局协议离婚&#xff0c;有30天冷静期&#xff0c;冷静期过后需要双方再次去民政局办理离婚手续。 另一种是诉讼离婚&#xff0c;一方不同意离婚&#xff0c;可以选择诉讼离婚。可以全…

Vue 3 路由机制详解与实践

一、路由的理解 路由是指导用户界面导航的一种机制。它通过映射 URL 到应用程序的不同视图组件来实现页面间的切换和导航。 二、路由基本切换效果 路由基本切换效果指的是当用户在应用程序中进行页面导航时&#xff0c;通过路由可以实现页面的切换&#xff0c;从而展示不同的…

ICMP详解

3 ICMP ICMP&#xff08;Internet Control Message Protocol&#xff0c;因特网控制报文协议&#xff09;是一个差错报告机制&#xff0c;是TCP/IP协议簇中的一个重要子协议&#xff0c;通常被IP层或更高层协议&#xff08;TCP或UDP&#xff09;使用&#xff0c;属于网络层协议…

CTF(web方向)--md5的“===”和“==”的绕过

一、PHP弱类型说明 1.简介 php是一种弱类型语言&#xff0c;对数据的类型要求并不严格&#xff0c;可以让数据类型互相转换。 在php中有两种比较符号: 一种是 &#xff0c;另外一种是 &#xff0c;都是用来比较两个数值是否相等的操作符&#xff0c;但他们也是有区别的: &a…

Linux 小技巧1

目录 一. 统计文件的总行数二. 获取从第二行开始的内容三. 合并两个文件为一个文件四. 统计指定列唯一值的数量五. 列出文件的绝对路径六. 获取除了空白行和注释之外的部分 一. 统计文件的总行数 ⏹非压缩文件 统计当前文件夹下csv文件的行数 wc -l ./*.csv统计指定文件夹下…

想要应聘前端工程师——学习路线指南

前端工程师学习路线 按照前端岗位需求,以优先学习工作更需要,面试更常考的内容为原则,由浅入深,层层铺垫,与时俱进,可以较容易地总结出前端学习路线图: HTML / CSS / JavaScript 基础学习 《Web 入门》 MDN 权威入门指南,HTML / CSS / JavaScript 快速上手 《CSS 世界…

面试中算法(链表)

链表相关的题 有一个单向链表&#xff0c;链表中有可能出现“环”&#xff0c;如图所示&#xff0c;如何用程序来判断该链表是否为有环链表呢? 对于这道题&#xff0c;有一个很巧妙的方法&#xff0c;这个方法利用了两个指针。 首先创建两个指针pi和p2(在Python里就是两个对象…

【问题分析】TaskDisplayArea被隐藏导致的黑屏以及无焦点窗口问题【Android 14】

1 问题描述 用户操作出的偶现的黑屏以及无焦点窗口问题。 直接原因是&#xff0c;TaskDisplayArea被添加了eLayerHidden标志位&#xff0c;导致所有App的窗口不可见&#xff0c;从而出现黑屏和无焦点窗口问题&#xff0c;相关log为&#xff1a; 这个log是MTK添加的&#xff0…

目标检测——YOLOv8算法解读

作者&#xff1a;Ultralytics公司 代码&#xff1a;https://github.com/ultralytics/ultralytics YOLO系列算法解读&#xff1a; YOLOv1通俗易懂版解读、SSD算法解读、YOLOv2算法解读、YOLOv3算法解读、YOLOv4算法解读、YOLOv5算法解读、YOLOR算法解读、YOLOX算法解读、YOLOv6算…

7. Django 模型与数据库

第7章 模型与数据库 Django对各种数据库提供了很好的支持, 包括PostgreSQL, MySQL, SQLite和Oracle, 而且为这些数据库提供了统一的API方法, 这些API统称为ORM框架. 通过使用Django内置的ORM框架可以实现数据库连接和读写操作. 本章以SQLite数据库为例, 分别讲述Django的模型…

统一威胁情报如何赋能SOC应对复杂威胁?

安全运营中心&#xff08;SOC&#xff09;是组织网络安全战略的核心组成部分&#xff0c;扮演着至关重要的角色。其负责实时监控整个IT基础设施&#xff0c;以检测、响应和预防各类网络安全威胁。网络安全威胁日益复杂且多变的数字化时代&#xff0c;攻击平面泛化、基础设施复杂…

10天精通Python爬虫:详细路线速成,开启兼职副业新篇章!

爬虫&#xff0c;即网络爬虫&#xff0c;是一种自动化程序&#xff0c;用于从互联网上抓取数据。在现代信息社会&#xff0c;爬虫技术广泛应用于数据分析、搜索引擎优化、竞品分析等领域。学习爬虫不仅可以提高数据处理能力&#xff0c;还可以为未来的职业发展打下坚实基础。 …

java基础之java容器-Collection,Map

java容器 java容器分类一. Collection1. List①. ArrayList② . LinkedList③ . Vector 2. Queue队列①. LinkedList②. PriorityQueue 3. Set集合①. HashSet②. TreeSet 二. Map1. HashMap2.TreeMap3. Hashtable java容器分类 java容器分为两大类&#xff0c;分别是Collecti…

修复所有 bug 并不能解决所有问题

原文&#xff1a;jeffpsherman - 2024.04.08 在软件领域&#xff0c;如同在制造业&#xff0c;有些问题是由于 bug 或“特殊原因”引发的&#xff0c;而有些则是“常见原因”&#xff0c;这是由于系统设计和实现的性质所导致的。修复 bug 就是移除特殊原因&#xff0c;消除 bu…