OpenCV 的模板匹配

news2025/1/14 0:43:32

OpenCV中的模板匹配

模板匹配(Template Matching)是计算机视觉中的一种技术,用于在大图像中找到与小图像(模板)相匹配的部分。OpenCV提供了多种模板匹配的方法,主要包括基于相关性和基于平方差的匹配方法。

1. 基本原理

模板匹配的基本原理是通过滑动模板图像(template)在源图像(source)上,计算每个位置的匹配得分,从而找到最匹配的位置。

2. 函数接口

在OpenCV中,模板匹配主要通过cv2.matchTemplate()函数来实现。其基本用法如下:

result = cv2.matchTemplate(image, template, method)
  • image: 源图像(在其中搜索匹配区域)。
  • template: 模板图像(需要匹配的图像部分)。
  • method: 匹配方法,常用的方法有:
    • cv2.TM_SQDIFF: 平方差匹配。
    • cv2.TM_SQDIFF_NORMED: 归一化平方差匹配。
    • cv2.TM_CCORR: 相关匹配。
    • cv2.TM_CCORR_NORMED: 归一化相关匹配。
    • cv2.TM_CCOEFF: 相关系数匹配。
    • cv2.TM_CCOEFF_NORMED: 归一化相关系数匹配。
3. 方法选择

不同的方法适用于不同的应用场景:

  • cv2.TM_SQDIFFcv2.TM_SQDIFF_NORMED: 适用于模板和图像之间的匹配误差较小时。
  • cv2.TM_CCORRcv2.TM_CCORR_NORMED: 适用于图像亮度变化不大的场景。
  • cv2.TM_CCOEFFcv2.TM_CCOEFF_NORMED: 适用于图像中存在线性亮度变化的情况。
4. 性能优化

模板匹配的计算复杂度较高,对于大图像和模板,计算时间可能较长。可以通过以下方法进行优化:

  • 调整模板图像的大小。
  • 使用多尺度匹配(Multi-Scale Matching),即在不同尺度下进行匹配。
  • 使用图像金字塔(Image Pyramid)技术减少计算量。

通过合理选择匹配方法和优化策略,可以有效提高模板匹配的效率和准确性。

以下是详细介绍模板匹配的相关内容:

基本步骤
  1. 读取图像和模板:
    使用 cv2.imread 函数读取原始图像和模板图像。

  2. 转换为灰度图像:
    使用 cv2.cvtColor 将图像转换为灰度图像。模板匹配通常在灰度图像上进行,以减少计算复杂度。

  3. 执行模板匹配:
    使用 cv2.matchTemplate 函数在原图像中搜索模板图像,并返回匹配结果。

  4. 设置阈值并找到匹配位置:
    使用 numpy 函数找到匹配结果中大于或等于阈值的位置。

  5. 绘制矩形框标记匹配区域:
    使用 cv2.rectangle 函数在原图像中绘制矩形框标记匹配区域。

  6. 显示结果:
    使用 matplotlib 或 OpenCV 显示结果图像。

详细代码示例
import cv2
import numpy as np
from matplotlib import pyplot as plt


# Load the images
original_img = cv2.imread('images/test.png')
template_img = cv2.imread('images/test_target.jpg')

# Convert to grayscale
original_gray = cv2.cvtColor(original_img, cv2.COLOR_BGR2GRAY)
template_gray = cv2.cvtColor(template_img, cv2.COLOR_BGR2GRAY)

# Perform template matching
result = cv2.matchTemplate(original_gray, template_gray, cv2.TM_CCOEFF_NORMED)

# Define threshold and find locations above the threshold
threshold = 0.8
loc = np.where(result >= threshold)

# Draw rectangles around detected matches
for pt in zip(*loc[::-1]):
    cv2.rectangle(original_img, pt, (pt[0] + template_gray.shape[1], pt[1] + template_gray.shape[0]), (0, 0, 255), 2)

# Display the result
plt.figure(figsize=(10, 10))
plt.imshow(cv2.cvtColor(original_img, cv2.COLOR_BGR2RGB))
plt.title('Detected Matches')
plt.axis('off')
plt.show()

运行结果如下:
在这里插入图片描述

下面是详细的中文解释:

import cv2
import numpy as np
from matplotlib import pyplot as plt

导入库

  • cv2:OpenCV库的Python接口,用于图像处理和计算机视觉。
  • numpy:数值计算库,用于处理多维数组。
  • pyplot:matplotlib库的一个子库,用于绘图和数据可视化。
# Load the images
original_img = cv2.imread('images/test.png')
template_img = cv2.imread('images/test_target.jpg')

加载图像

  • 使用 cv2.imread 函数读取图像文件,将原始图像保存到 original_img 变量中,将模板图像保存到 template_img 变量中。
  • 需要根据实际文件路径替换 ‘images/test.png’ 和 ‘images/test_target.jpg’。
# Convert to grayscale
original_gray = cv2.cvtColor(original_img, cv2.COLOR_BGR2GRAY)
template_gray = cv2.cvtColor(template_img, cv2.COLOR_BGR2GRAY)

转换为灰度图

  • 使用 cv2.cvtColor 函数将原始图像和模板图像从 BGR 色彩空间转换为灰度图,以简化后续的计算。
# Perform template matching
result = cv2.matchTemplate(original_gray, template_gray, cv2.TM_CCOEFF_NORMED)

执行模板匹配

  • 使用 cv2.matchTemplate 函数在灰度原图中搜索模板图像。
  • cv2.TM_CCOEFF_NORMED 是一种匹配方法,表示归一化的相关系数匹配。
# Define threshold and find locations above the threshold
threshold = 0.8
loc = np.where(result >= threshold)

定义阈值并找到匹配位置

  • 设置匹配结果的阈值 threshold 为 0.8,表示只有相关系数大于或等于 0.8 的位置才被认为是匹配的。
  • 使用 np.where 函数找到匹配结果矩阵中所有大于或等于阈值的位置,返回这些位置的坐标。
# Draw rectangles around detected matches
for pt in zip(*loc[::-1]):
    cv2.rectangle(original_img, pt, (pt[0] + template_gray.shape[1], pt[1] + template_gray.shape[0]), (0, 0, 255), 2)

绘制矩形框

  • 遍历所有检测到的匹配位置,并在原图上绘制矩形框。
  • zip(*loc[::-1]) 将匹配位置的坐标转换为 (x, y) 对,以便在图像上绘制矩形框。
  • cv2.rectangle 函数用于绘制矩形框:
    • 第一个参数是图像。
    • 第二个参数是矩形的左上角坐标。
    • 第三个参数是矩形的右下角坐标。
    • 第四个参数是矩形框的颜色,这里是红色 (0, 0, 255)
    • 第五个参数是矩形框的粗细,这里设置为 2。
# Display the result
plt.figure(figsize=(10, 10))
plt.imshow(cv2.cvtColor(original_img, cv2.COLOR_BGR2RGB))
plt.title('Detected Matches')
plt.axis('off')
plt.show()

显示结果

  • 使用 matplotlib 库显示带有矩形框的原图。
  • plt.figure 设置显示窗口的大小,这里是 10x10 英寸。
  • plt.imshow 显示图像,并将图像从 BGR 色彩空间转换为 RGB,以便正确显示颜色。
  • plt.title 设置图像的标题,这里是 ‘Detected Matches’。
  • plt.axis('off') 隐藏坐标轴,以便更好地显示图像。
  • plt.show 显示图像。

运行上述代码后,你会看到原始图像中标记出所有匹配模板的位置,每个匹配位置都会用红色矩形框标记出来。

模板匹配方法

OpenCV 提供了几种不同的模板匹配方法,可以通过 cv2.matchTemplate 函数的第三个参数指定:

  1. cv2.TM_SQDIFF: 平方差匹配法,计算平方差。数值越小越匹配。
  2. cv2.TM_SQDIFF_NORMED: 归一化平方差匹配法。
  3. cv2.TM_CCORR: 相关系数匹配法,计算相关系数。数值越大越匹配。
  4. cv2.TM_CCORR_NORMED: 归一化相关系数匹配法。
  5. cv2.TM_CCOEFF: 相关匹配法,计算相关值。数值越大越匹配。
  6. cv2.TM_CCOEFF_NORMED: 归一化相关匹配法。
示例中的关键函数
  • cv2.imread(filename, flags): 读取图像。
  • cv2.cvtColor(src, code): 转换颜色空间。
  • cv2.matchTemplate(image, templ, method): 执行模板匹配。
  • np.where(condition): 返回满足条件的数组索引。
  • cv2.rectangle(img, pt1, pt2, color, thickness): 绘制矩形框。
注意事项
  • 模板匹配是一个计算密集型任务,对于较大的图像和模板,计算时间会显著增加。
  • 匹配结果受图像噪声、旋转、缩放等因素的影响,因此在实际应用中,可能需要预处理图像或结合其他方法(如特征匹配)来提高准确性。
实际应用

模板匹配广泛应用于图像识别、物体检测等领域,例如:

  • 在游戏中检测特定图案或标志。
  • 在工业视觉系统中检测缺陷或零部件位置。
  • 在医学图像中检测特定器官或病变。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1817109.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【RPC项目-1】0612

写在前面,主要是作学习回顾笔记,以备后续面试 LogEvent 组成: 日志级别(level)日期时间(精确到ms)进程号pid,线程号threadid文件名file_name、行号line自定义msg 输出格式如:[level]\t[%y-%…

dvadmin 调试问题

链接:django-vue3-admin: django-vue3-admin 是一套全部开源的快速开发平台,毫无保留给个人免费使用、团体授权使用。 django-vue3-admin 基于RBAC模型的权限控制的一整套基础开发平台,权限粒度达到列级别,前后端分离,…

vb.net小demo(计算器、文件处理等/C#也可看)

Demo1:使用窗体控件实现一个简易版计算器 Public Class Form1Private Sub Button_1_Click(sender As Object, e As EventArgs) Handles Button_1.ClickCalSubBox.Text Button_1.TextEnd SubPrivate Sub Button_2_Click(sender As Object, e As EventArgs) Handles …

HBase数据存储

1、数据模型 Namespace(表命名空间):表命名空间不是强制的,当想把多个表分到一个组去统一管理的时候才会用到表命名空间。Table(表):一个表由一个或者多个列族组成。数据属性,都在列…

javaWeb项目-ssm+vue个人博客网站管理系统功能介绍

本项目源码:java-基于ssmvue的个人博客网站的设计与实现源码说明文档资料资源-CSDN文库 项目关键技术 开发工具:IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架:ssm、Springboot 前端:Vue、ElementUI 关键技术&#xff1a…

第 5 章:面向生产的 Spring Boot

在 4.1.2 节中,我们介绍了 Spring Boot 的四大核心组成部分,第 4 章主要介绍了其中的起步依赖与自动配置,本章将重点介绍 Spring Boot Actuator,包括如何通过 Actuator 提供的各种端点(endpoint)了解系统的…

DDD领域应用理论实践分析回顾

目录 一、DDD的重要性 (一)拥抱互联网黑话(抓痛点、谈愿景、搞方法论) (二)DDD真的重要吗? 二、领域驱动设计DDD在B端营销系统的实践 (一)设计落地步骤 &#xff0…

小程序无法调用服务端问题排查

1、问题描述 突然有一天线上的小程序不能登录,经查小程序无法调用。经查无法小程序页面无法调用后台服务。 2、排查过程 由于无法登录小程序发布服务器,无法测试小程序前端服务器到服务端网络,并且小程序无法看到日志。所以就得从服务端和网…

使用CSS、JavaScript、jQuery三种方式实现手风琴效果

手风琴效果有不少,王者荣耀官网(源网址 https://pvp.qq.com/raiders/ )有一处周免英雄,使用的就是手风琴效果,如图所示。 我试着用css、js、jQuery三种方式实现了这种效果,最终效果差不多,美中不…

IDEA创建简单web(servlet)项目(server为tomcat)

引言 鉴于网上很少有关于IDEA开发servlet项目的教程(24版idea,并且servlet技术十分复古,很少有人用到,能够理解,该文章旨在为在校的学生提供一个参考,项目技术简单)本人在此总结从头开始到项目…

MATLAB算法实战应用案例精讲-【数模应用】有序Logit(Logistic)分析

目录 算法原理 logit回归分析步骤 二元logit分析 多分类logit分析 有序logit分析 总结 SPSS 1、问题与数据 2、对数据结构的分析 3、SPSS分析方法 SPSSAU 有序Logit回归案例 1、背景 2、理论 3、操作 4、SPSSAU输出结果 5、文字分析 6、剖析 疑难解惑 提示…

Joplin Typora 粘贴图片 | 当使用Typora作为Joplin编辑器时,如何粘贴图片并上传到Joplin服务器,替换链接

一、背景 当我们使用Joplin时,上传图片时会自动上传到Joplin服务器并替换链接 但是Joplin的编辑器不好用,我更习惯用Typora来编辑, 然而Typora中上传的图片只能在本地,无法上传到Joplin服务器,在其他客户端也看不到图片…

迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!

中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入,利用多模态大语言模型的多模态理解和常识推理能力,进行从场景理解到横向和纵向…

若依RuoYi-Vue分离版—免登录直接访问

若依RuoYi-Vue分离版—免登录直接访问 如何不登录直接访问前端:后端:方法1:在SecurityConfig.java中设置httpSecurity配置匿名访问方法2:在对应的方法或类上面使用Anonymous注解。 如何不登录直接访问 官网有说明:如何不登录直接…

pyechart 创建柱形图

Pyecharts 是一个基于 Python 的开源数据可视化库,用于创建各种交互式的图表和可视化效果。它是在 Echarts 的基础上进行封装和优化,Echarts 是一个流行的 JavaScript 数据可视化库pyecharts 中文网站 : https://pyecharts.org/# pyecharts 模块 还支持…

day35| 860.柠檬水找零 406.根据身高重建队列 452. 用最少数量的箭引爆气球

文章目录 前言860.柠檬水找零思路方法一 406.根据身高重建队列思路方法一 452. 用最少数量的箭引爆气球思路方法一 总结 前言 860.柠檬水找零 思路 很简单,贪心只有一个,如果20优先用105找零,因为5更加万能一些 方法一 class Solution(ob…

RabbitMQ实践——配置Prometheus和Grafana报表

大纲 启用rabbitmq_prometheus插件安装启动Prometheus创建用户下载并解压修改配置启动 安装启动grafana安装启动配置数据源 在《RabbitMQ实践——在Ubuntu上安装并启用管理后台》中我们已经安装成功RabbitMQ及其管理后台。在此基础上,我们将打通它和Prometheus、Gra…

26.0 Http协议

1. http协议简介 HTTP(Hypertext Transfer Protocol, 超文本传输协议): 是万维网(WWW: World Wide Web)中用于在服务器与客户端(通常是本地浏览器)之间传输超文本的协议.作为一个应用层的协议, HTTP以其简洁, 高效的特点, 在分布式超媒体信息系统中扮演着核心角色. 自1990年提…

Python图像处理——基于Pytorch框架ResNet152特征提取的MNIST手写数字识别

1. 数据集介绍 MNIST手写数字数据集: http://yann.lecun.com/exdb/mnist/ MNIST 数据集一共有 7 万张图片,其中 6 万张是训练集, 1 万张是测试集。每张图片是 28 28 的 0−9 的手写数字图片组成。每个图片是黑底白字的形式,黑底…

【全开源】餐饮点餐小程序源码(ThinkPHP+FastAdmin+Uniapp)

🍽️餐饮点餐小程序:让美食触手可及 一款基于ThinkPHPFastAdminUniapp开发的点餐小程序,支持单人点餐,还满足多人协同点餐(高级授权),支持多门店管理,并提供先吃后付和先付后吃两种支付方式。​ &#x1…