opencv-图像几何处理

news2024/9/22 23:38:11

缩放

缩放只是调整图像的大小。为此,opencv提供了一个cv2.resize()函数,可以手动指定图像大小,也可以指定缩放因子。你可以使用任意一种方法调整图像的大小:

import cv2
from matplotlib import pyplot as plt

logo = cv2.imread('logo.png')
logo_mini = cv2.resize(logo, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_CUBIC)
# 或者这样
# height, width = logo.shape[:2]
# logo_mini = cv2.resize(logo, (int(0.5 * height), int(0.5 * width)), interpolation=cv2.INTER_CUBIC)

plt.subplot(121),plt.imshow(logo, 'gray'),plt.title('logo')
plt.subplot(122),plt.imshow(logo_mini, 'gray'),plt.title('logo_mini')
plt.show()

效果如下:

2r1tVP.png

请看logo_mini的宽高与原图缩小了一半!resize(src, dsize, dst=None, fx=None, fy=None, interpolation=None)参数详解如下:

  • src: 输入图像
  • dsize: 修改后的图片宽高
  • dst: 输出图像
  • fx: 比例因子(宽度),0.5表示宽度缩放成原来的一半
  • fy: 比例因子(高度),0.5表示高度缩放成原来的一半
  • interpolation: 插值法

平移

平移是物体位置的移动。如果您知道 (x, y) 方向的偏移,让它成为(tx, ty),M你可以按如下方式创建变换矩阵:

M = [[1, 0, tx], [0, 1, ty]]

你可以把它变成一个np类型的Numpy数组。np.float32()传递到cv2.warpAffine()函数,请看下面栗子:

import cv2
import numpy as np
from matplotlib import pyplot as plt

logo = cv2.imread('logo.png')
rows, cols = logo.shape[:2]
# 水平向右平移50个像素,垂直向下平移100个像素
M = np.float32([[1, 0, 50], [0, 1, 100]])
dst = cv2.warpAffine(logo, M, (cols, rows))
plt.subplot(121),plt.imshow(logo, 'gray'),plt.title('logo')
plt.subplot(122),plt.imshow(dst, 'gray'),plt.title('dst')
plt.show()

效果如下:

2r1orR.png

从效果图可以看到,图片水平向右移动了50个像素,垂直向下移动了100个像素。warpAffine(src, M, dsize, dst=None, flags=None, borderMode=None, borderValue=None)参数详解如下:

  • src: 输入图像
  • M: 2X3的变换矩阵
  • dsize: 指定图像输出尺寸
  • dst: 输出图像
  • flags: 插值算法标识符

旋转

旋转跟平移一样,同样是通过cv2.warpAffine()函数来实现的。在上面我们知道这个函数接收一个变换矩阵,为了得到这个变换矩阵,OpenCV 提供了一个函数cv2.getRotationMatrix2D()。下面我们来实现,将logo图像以中心点为圆心,逆时针旋转90度,代码如下:

import cv2
import numpy as np
from matplotlib import pyplot as plt

logo = cv2.imread('logo.png')
rows, cols = logo.shape[:2]
M = cv2.getRotationMatrix2D((int(cols / 2), int(rows / 2)), 90, 1)
dst = cv2.warpAffine(logo, M, (cols, rows))
plt.subplot(121),plt.imshow(logo, 'gray'),plt.title('logo')
plt.subplot(122),plt.imshow(dst, 'gray'),plt.title('dst')
plt.show()

效果如下:

2ruLef.png

从效果图可以看到,图片围绕中心点逆时针旋转了90度。getRotationMatrix2D(center, angle, scale)参数详解如下:

  • center: 旋转的中心点
  • angle: 旋转角度,正数为逆时针,负数为顺时针
  • scale: 缩放因子

仿射变换

在仿射变换中,原始图像中的所有平行线在输出图像中仍将平行。为了找到变换矩阵,我们需要输入图像中的三个点及其在输出图像中的对应位置。我们可以使用cv2.getAffineTransform()函数将创建一个2*3矩阵,该矩阵将传递给cv2.warpAffine()函数,使用如下:

import cv2
import numpy as np
from matplotlib import pyplot as plt

qipan = cv2.imread('qipan.png')
# 在棋盘中描三个点
cv2.circle(qipan, (103, 103), 5, (255, 0, 0), -1)
cv2.circle(qipan, (103, 196), 5, (255, 0, 0), -1)
cv2.circle(qipan, (196, 103), 5, (255, 0, 0), -1)
rows, cols = qipan.shape[:2]
pts1 = np.float32([[103, 103], [103, 196], [196, 103]])
pts2 = np.float32([[30, 120],[200, 50],[80, 220]])
M = cv2.getAffineTransform(pts1, pts2)
dst = cv2.warpAffine(qipan, M, (rows, cols))
plt.subplot(121),plt.imshow(qipan, 'gray'),plt.title('qipan')
plt.subplot(122),plt.imshow(dst, 'gray'),plt.title('dst')
plt.show()

效果如下:

26daaF.png

从效果图可以看到,原始图像中的所有平行线在输出图像中仍然平行。getAffineTransform(src, dst)参数详解如下:

  • src: 输入图像的三个点坐标
  • dst: 输出图像的三个点坐标

透视变换

对于透视变换,你需要一个3*3变换矩阵,即使在变换之后,直线仍将保持笔直。要找到这个变换矩阵,你需要输入图像上的4个点和输出图像上对应的点。我们可以通过函数cv2.getPerspectiveTransform()找到变换矩阵,然后再将这个变换矩阵应用到cv2.warpPerspective()函数当中,使用如下:

import cv2
import numpy as np
from matplotlib import pyplot as plt

qipan = cv2.imread('qipan-1.png')
pst1 = [[88, 30], [812, 30], [37, 848], [900, 832]]
pst2 = [[0, 0], [500, 0], [0, 500], [500, 500]]
# 在原图上绘制4个点
cv2.circle(qipan, pst1[0], 5, (255, 0, 0), -1)
cv2.circle(qipan, pst1[1], 5, (255, 0, 0), -1)
cv2.circle(qipan, pst1[2], 5, (255, 0, 0), -1)
cv2.circle(qipan, pst1[3], 5, (255, 0, 0), -1)
# 获取变换矩阵
M = cv2.getPerspectiveTransform(np.float32(pst1), np.float32(pst2))
# 透视变换
dst = cv2.warpPerspective(qipan, M, (500, 500))
# 在输出图像中再绘制4个点
cv2.circle(dst, pst2[0], 5, (255, 0, 0), -1)
cv2.circle(dst, pst2[1], 5, (255, 0, 0), -1)
cv2.circle(dst, pst2[2], 5, (255, 0, 0), -1)
cv2.circle(dst, pst2[3], 5, (255, 0, 0), -1)
plt.subplot(121),plt.imshow(qipan, 'gray'),plt.title('qipan')
plt.subplot(122),plt.imshow(dst, 'gray'),plt.title('dst')
plt.show()

效果如下:

REiP00.png

从效果可以看出,即使在变换之后,直线仍将保持笔直!cv2.getPerspectiveTransform(src, dst, solveMethod=None)参数详解如下:

  • src: 源图像中四边形顶点的坐标
  • dst: 目标图像中相应四边形顶点的坐标

cv2.warpPerspective(src, M, dsize, dst=None, flags=None, borderMode=None, borderValue=None)参数详解如下:

  • src: 输入图像
  • M: 3X3的变换矩阵
  • dsize: 指定图像输出尺寸
  • dst: 输出图像
  • flags: 插值算法标识符

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/401013.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

害我走了8年弯路,接口测试和性能测试的区别原来是这几点,终于点通了......

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 性能测试和接口测试…

Allegro如何知道组合操作命令的拼写

Allegro如何知道组合操作命令的拼写 前面介绍了如何知道单个操作命令的拼写,但如果是复合命令,就无法直观的通过命令来了解,如下图 Snap Pick to -Segment这个命令拼写是什么 如何知道,具体操作如下 点击File点击Script 出现Scripting窗口

itextpdf生成报文总结

1.使用itextpdfgradle引入依赖compile ("com.itextpdf:itextpdf:5.5.13") compile ("com.itextpdf:itext-asian:5.2.0") compile ("com.itextpdf.tool:xmlworker:5.5.13")参考:https://www.cnblogs.com/ssslinppp/p/4976922.htmlhttp…

Linux性能补丁升级,避免不必要的跨核Wake-Up

导读一个由英特尔发起的、旨在改进Linux内核公平调度程序代码的补丁系列,也看到了来自AMD工程师和其他利益相关者的测试/反馈,并继续进行改进。这个补丁系列的重点是避免在不必要的情况下发生过多的跨核唤醒(Cross-CPU Wake-up)。这样一来,这…

Unity合批处理

一.静态合批标记为Batching Static的物体(标记后物体运行不能移动、旋转、缩放)在使用相同材质球的条件下在项目打包的时候unity会自动将这些物体合并到一个大Mesh*缺点打包后体积增大运行时内存占用增大二.动态批处理不超过300个顶点不超过900个属性不包…

手机通讯录--课后程序(Python程序开发案例教程-黑马程序员编著-第5章-课后作业)

实例2:手机通讯录 通讯录是记录了联系人姓名和联系方式的名录,手机通讯录是最常见的通讯录之一,人们可以在通讯录中通过姓名查看相关联系人的联系方式、邮箱、地址等信息,也可以在其中新增联系人,或修改、删除联系人信…

MySQL高级—约束与关系

🍎道阻且长,行则将至。🍓 目录 一、约束 1.约束的基本概念 2.分类 二、关系 1.一对多 2.多对多 3.一对一 三、多表查询 1.多查 2.连接查询 3.子查询 一、约束 1.约束的基本概念 数据库的表示用来存储数据的,为了保证…

PID控制算法详解

1. 前言 PID 即 Proportional(比例),Integral(积分),Differential(微分)的英文缩写。顾名思义,PID 控制算法是结合比例,积分和微分三种环节于一体的自动控制…

cs231n计算机视觉课程-(数据驱动方法)

姿态、环境、遮挡这些问题算法都因该是robust 课程中提到具体写一个识别猫咪的算法是不稳定的,容易出错的。 所以提出了Data-Driven Approach的方法 一个是训练函数, 这函数接受图片和标签,然后输出标签 另一个则是预测函数,输…

团队管理的七个要点

要掌握团队管理的要点和做好团队管理工作,不是一件容易的事,但也远非想象中那么难。首先,我个人比较推荐所有团队管理者都能阅读下《经理人参阅:团队管理》(注意该书仅可其官网获得)这本佳作。相信会为你带…

vue ssr的hydration问题

我的网站百家饭OpenAPI平台是vuepress写的,前段时间我还写了个专栏讲了vuepress2.0教学。 最开始我们的网站是类似公司网站的情况,以介绍为主,后来又加了一个openapi编辑器,编辑器主要在一个页面里面,vuepress还勉强可…

【Springboot系列】Springboot接管所有Controller,magic-api源码阅读

系列文章地址:Spring Boot学习大纲,可以留言自己想了解的技术点 最近在项目中使用了一个第三方的包 magic-api,节省了很多的时间,整体来说就是只用写sql就好了,不用写service,controller那些,全…

Flink从入门到精通系列(二)

3、Flink 部署 Flink 是一个非常灵活的处理框架,它支持多种不同的部署场景,还可以和不同的资源管 理平台方便地集成。 3.1、快速启动一个 Flink 集群 3.1.1、环境配置 Flink 是一个分布式的流处理框架,所以实际应用一般都需要搭建集群环境…

IO与NIO区别

一、概念 NIO即New IO,这个库是在JDK1.4中才引入的。NIO和IO有相同的作用和目的,但实现方式不同,NIO主要用到的是块,所以NIO的效率要比IO高很多。在Java API中提供了两套NIO,一套是针对标准输入输出NIO,另一套就是网络编程NIO。 二、NIO和IO的主要区别 下表总结了Java I…

GM8773C 是一款 1:2 DSI 桥接芯片,可实现 4 路进 8 路出转换器功能、视频分离器功能。

GM8773C 是一款 1:2 DSI 桥接芯片,可实现 4 路进 8 路出转换器功能、视频分离器功能。芯片内集成了一个 4 路单一链路的 MIPI DSI 接收器和 8 路双链路 MIPI DSI 发送器。 接 收 器 每 路 可 以 支 持 到 2.0Gbps/lane , 可 以 最 高 支 持 到…

平面设计软件Corel CDR2023又开始放大招啦,CorelDRAW Graphics Suite 2023有哪些新增功能?

CorelDRAW 2023中文版即将于2023年3月14日,在苏州举行线上直播的2023新品发布会,本次发布会主题为“设计新生力,矢量新未来”。 发布会邀请思杰马克丁公司领导、Corel 中国区总经理分享思杰与 Corel 的合作模式及在 CorelDRAW 产品上推动历程…

JavaEE简单示例——Bean管理

简单介绍: 在这一章节我们会比较详细的介绍我们在之前的测试类中以及Bean管理XML配置文件中所使用到的类和方法,以及XML中配置的属性所代表的详细含义。以及之前我们反复提到但是一直没有详细的讲解的一个东西:容器。我们可以大致的有一个概…

react+antdpro+ts实现企业级项目四:注册页面实现及useEmotionCss的介绍

创建文件路径并注册register路由 在pages/User下创建Register文件夹并创建index.tsx文件 然后在config/routes创建register注册路由。注册完后,当在登陆页面点击注册按钮时就可以跳转到此注册页面而不会报404了。 export default [{path: /user,layout: false,rou…

PaddleOCR关键信息抽取(KIE)的训练(SER训练和RE训练)错误汇总

1.SER训练报错: SystemError: (Fatal) Blocking queue is killed because the data reader raises an exception 1.1.问题描述 在执行训练任务的时候报错 单卡训练 python3 tools/train.py -c train_data/my_data/ser_vi_layoutxlm_xfund_zh.yml错误信息如下: T…

初识C++需要了解的一些东西(1)

目录🥇命名空间🏅存在原因🏵命名空间定义🎧命名空间的3种使用方式🏆C输入和输出🌝缺省参数🌜缺省参数概念⭐️缺省参数分类☀️函数重载🔥引用🌚引用概念🌓引…