数字图像处理【10】直方图反向投影与模板匹配

news2024/11/23 16:34:32

本篇简单描述直方图在图像处理中典型的应用场景,属于是比较老旧的应用技术,但不妨拿出来再学习,温故而知新,为新知识做一个铺垫。

直方图反向投影(Back Projection)

还记得之前学习过的图像直方图的计算/均衡化的知识吗,反向投影是在这基础上展开,需要回顾的同学可以看看这里的文章。

首先说说直方图反向投影的概念:

  • 反向投影就是利用源图像的直方图模型中的分布情况/概率值,在源目标图像位置进行一个投影,通常用HSV色彩空间的H通道的直方图模型进行投影。

Note:注意这里是用HSV色彩空间,与之前介绍的HSI颜色模型有点区别。这里简单概括一下:其实它两本质是同一套理论。为什么一个叫色彩空间,一个颜色模型,最本质的区别是V和I不同,V指的是value,V=max(R,G,B),HSV只有下半个圆锥,中轴线是灰度,HSV中纯白的那一点的位置对应在HSI中是中轴中值灰度的位置。如果说HSV的饱和度是对纯白而言的,HSI的饱和度是对纯中值灰度而言的。由于两种模型中的I和V的不同导致了H和S的不同。在HSV色彩空间里,H的取值范围是[0~180],S和V是[0~255]【PS:Windows电脑自带的画图软件中的调色板是HSI模型的】

为了加深理解,举个应用例子,给大家说明白什么是直方图反向投影:

(1) 例如一4x4图像的灰度如下 :
 Image= 0    1    2    3
              4    5    6    7
              8    9   10   11
              8    9   14   15

(2) 定义该直方图的灰度区间为[0,3),[4,7),[8,11),[12,16)
 则其直方图:Histogram = 4    4    6    2
 归一化后为:Histogram = 0.25    0.25    0.375    0.125

(3) 直方图反向投影后,位置(0,0)上的像素值为0,对应的bin为[0,3),所以反向直方图在该位置上的值这个bin的值4。
 Image_BackProjection=
                      4    4    4    4
                      4    4    4    4
                      6    6    6    6
                      6    6    2    2

我们看到,实际上是原图像的256个灰度值被置为很少的几个值了,具体有几个值,那要看把0~255的灰度等级划分为多少个区间(HSV空间的H,那就是将0~180划分区间)在反向投影的特征矩阵中,具体位置的值就是它对应的原图像中的点所在区间的灰度直方图值。所以我们可以看出,一个区间点越多,在反向投影矩阵中就越亮。

从这个过程也可以看出,我们是先求出原图像的直方图,再由直方图得到反向投影得出特征矩阵,由直方图到投影矩阵实际上就是一个反向的过程,所以叫反向投影。

直方图反向投影-opencv-4.5.5 C工程实现

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

void Hist_And_BackProjection(int, void*);
Mat src, hsv, hue;
string titleStr = "test backProjection ";
int hist_bins = 12;
int main()
{
    //读取测试图片
    src = imread("F:\\other\\learncv\\ic_launcher.png");
    namedWindow(titleStr + "src", WINDOW_KEEPRATIO);
    imshow(titleStr + "src", src);
    //rgb转hsv
    cvtColor(src, hsv, COLOR_BGR2HSV);

    hue.create(hsv.size(), hsv.depth());
    //从灰度图图像中拷贝0通道到 直方图输入图像的0通道
    int nchannels[] = { 0, 0 };
    mixChannels(&hsv, 1, &hue, 1, nchannels, 1);

    //动态调整直方图的 bins ,并做反向投影
    createTrackbar("Histogram Bins", titleStr + "src", &hist_bins, 180, Hist_And_BackProjection);
    Hist_And_BackProjection(0, 0);

    waitKey(0);
    return 0;
}

void Hist_And_BackProjection(int, void*) 
{
    float range[] = { 0,180 };
    const float* histRanges = { range };
    Mat hist;
    // 直方图计算及归一化处理
    calcHist(&hue, 1, 0, Mat(), hist, 1, &hist_bins, &histRanges, true, false);
    normalize(hist, hist, 0, 255, NORM_MINMAX, -1, Mat());

    //画直方图的分布图
    int hist_h = 400;
    int hist_w = 400;
    int bin_w = hist_w / hist_bins;
    Mat histImage(hist_w, hist_h, CV_8UC3, Scalar(255, 255, 255));
    for (int i = 1; i <= hist_bins; i++)
    {
        rectangle(histImage,
            Point((i - 1) * bin_w, (hist_h - cvRound(hist.at<float>(i - 1) * (400 / 255)))),
            Point(i * bin_w, hist_h),
            Scalar(85, 85, 85),
            -1);
    }
    imshow(titleStr + "Histogram", histImage);

    //直方图反向投影
    Mat backPrjImage;
    calcBackProject(&hue, 1, 0, hist, backPrjImage, &histRanges, 1, true);
    namedWindow(titleStr, WINDOW_FREERATIO);
    imshow(titleStr, backPrjImage);
}

如例子所示,控制直方图区间数为5的时候,反向投影基本能提取出输入图像的特征,这里测试的输入图像比较简单,反向投影出来的特征图并没有噪点,如果有一些额外的噪点,可以利用之前学习的膨胀/腐蚀操作来掩盖掉。

模板匹配(Template Match)

接下来简单介绍opencv当中的模板匹配。还是先进行文字介绍:

  1. 模板匹配就是在目标图像的整个区域发现与给定子图像匹配的小块区域
  2. 模板匹配首先得需要一个模板图像T(重点就在这个模板T,很重要!!!)
  3. 在待检测的目标图像上,从左到有,从上往下计算模板图像与子图像匹配的相似程度,相似程度越大,两者内容对等的可能性越大。

 先介绍下opencv相关API——matchTemplate

cv::matchTemplate(

InputArray image,// 源图像,必须是8-bit或者32-bit浮点数图像

InputArray templ,// 模板图像,类型与输入图像一致

OutputArray result,// 输出结果,必须是单通道32位浮点数,假设源图像WxH,模板图像wxh,
                   // 则结果必须为W-w+1, H-h+1的大小。
int method, //匹配相似性的方法标识

InputArray mask=noArray()
)

第三个输出参数,OutputMat的大小是(W-w+1, H-h+1)因为模板匹配是在待检测的目标图像上,从左到有,从上往下计算模板图像与子图像,然后把相似程度输出到对应的位置中。

然后就是着重来学学 模板匹配的相似性有哪些方法:

模板匹配的核心思想就是从模板图像中,找出一个合适的指标来衡量模板T与搜索区域 的相似度。就好譬如小学学习的两个三角形是否相似,所以相似性又演变成以上几组数学关系。

其中的(x', y')代表的是模板T的位置,(x,y)代表的是目标图像 I 的区域起始位置,那么 I(x+x',y+y') 的意思其实就是根据目标图像的以(x,y)为起点,偏移(x', y')的位置。R(x,y)就是以(x,y)为起点位置,(x',y')大小的区域图像,与模板的相似程度。

  • TM_SQDIFF/TM_SQDIFF_NORMED:差值平方和 / 归一化差值平方和

通过计算模板与搜索区域中所有对应位置像素点的像素平方差之和,来衡量两者相似度,计算结果越小表示越相似,当计算结果为0时表示两者完全相同。

  • TM_CCORR / TM_CCORR_NORMED:相关系数 / 归一化相关系数

采用T和I的相关系数作为衡量指标,相关系数越大表示两者越相似。

  • TM_CCOEFF / TM_CCOEFF_NORMED:去均值相关系数 / 去均值归一化相关系数

去均值相关系数与相关系数的区别在于:计算去均值相关系数时T和I都减去各自的均值,而相关系数则不减去均值。这样做是为了消除T和I亮度不同对计算结果的影响,比如T和I的结构非常相似但亮度有很大区别,那么它们分别减去各自的均值,使用每个像素点的亮度偏移来计算,而不是使用亮度本身来计算,因此消除了亮度不同的影响。
 

细心的同学可能会发现,起始模板匹配存在明显的缺点,或者说使用模板匹配会存在很多前置的限制条件:

1、模板的尺寸固定,在目标图像搜索出来的区域就是和模板尺寸一样大,并不能智能识别出不同大小的相似特征区域,在不同大小的目标图像区域,即使相同的相似度算法,也会导致完全不一样结果。

2、目标图像如果存在旋转、缩放、局部非刚性形变的情况下,模板匹配的效果也是不太好。或者说需要对模板图也进行旋转、缩放、局部非刚性形变等操作后,才能使用模板匹配。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/667627.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Knowledge Distillation of Large Language Models

这是大模型系列模型的文章&#xff0c;针对《Knowledge Distillation of Large Language Models》的翻译。 大模型的知识蒸馏 摘要1 引言2 方法2.1 MiniLLM&#xff1a;利用逆向KLD进行知识蒸馏2.2 策略梯度优化2.3 训练算法 3 实验3.1 实验设置3.2 结果3.3 分析3.4 消融实验 …

源码编译安装LAMP——LAMP+DISCUZ论坛搭建

文章目录 一.Apache1.什么是apache2.apache的主要特点3.apache的软件版本4.编译安装优点5.安装服务的一般步骤 二.LAMP简介与概述1.LAMP平台概述2.构建LAMP平台顺序3.各组件的主要作用 三.LAMPDISCUZ论坛搭建1.部署Apache1.1 下载apache相关安装包放入服务器中1.2 解压apache的…

数学公式识别(Mathpix + pix2tex)

文章目录 数学公式识别&#xff08;Mathpix pix2tex&#xff09;1. 下载安装2. 如何使用3. 限制4. 替代品4.1 pix2tex - LaTeX OCR4.2 pix2tex&#xff08;网页版&#xff09;4.3 Simple Tex OCR 数学公式识别&#xff08;Mathpix pix2tex&#xff09; 当我们看论文时&#…

2023软件工程中各种图在现代企业级开发中的使用频率

概览 系统流程图 ✔ 数据流图 不常用 ER图 ✔ 状态转换图 ✔ Warnier图 不常用 IPO图 不常用 Petri网 不常用 层次方框图 不常用 层次图 a.k.a. H图 ✔ 1,层次图描绘软件的层次结构.层层次方框图描绘的是数据结构。 2,层次图的方框表示模块或子模块。层次方框图的方框表示数据结…

C++基础(12)——STL(vector和deque)

前言 本文主要介绍C中STL中的vector和deque容器 7.3&#xff1a;vector容器 7.3.1&#xff1a;vector容器基本概念、特点和构造函数 vector和数组的区别&#xff1a;数组是静态空间&#xff0c;一旦指定大小&#xff0c;之后就不能发生改变。vector可以动态扩展&#xff0c…

(秋招准备)三角化复习

用SVD分解继续宁特征点三角化 三角化又叫三角测量&#xff0c;本质是用相机的运动估计特征点的空间位置&#xff0c;发生在估计得到帧间运动之后(单目情况)。三角测量是指&#xff0c;通过在两处观察同一个点的夹角&#xff0c;确定该点的距离。由于双目本身就能得到视角不同的…

Java集合与数组概述

Java 集合可分为Collection 和Map 两种体系 实线是继承 虚线是实现类 1.Collection接口&#xff1a;单列数据&#xff0c;用来存储一个一个的对象。定义了存取一组对象的方法的集合 ​ List&#xff1a;元素有序、可重复的集合 -->&#xff08;动态数组&#xff09; ​ ----…

B2B2C多用户商城系统是怎么报价的?

买东西的时候&#xff0c;喜欢先问商品的价格&#xff0c;更不用说多用户商城系统的高成本了&#xff0c;现在有很多多用户商城系统&#xff0c;但是价格不一样。所以很多商家朋友都在问&#xff0c;开发一个多用户商城系统的价格是多少&#xff0c;下面jsudo小编一起来看看吧。…

【机器学习】树模型的三种序列化方式的区别(模型存储大小、序列化所用内存、序列化速度)

文章目录 一、导读二、模型运行例子三、运行内存计算四、保存和加载4.1 jsonpickle4.2 pickle4.3 模型自带 五、实验5.1 模型存储大小对比实验5.2 运行的memory对比实验 六、序列化时间对比七、源代码八、总结 一、导读 本文总结常用树模型&#xff1a; rf&#xff0c;xgboost…

【操作系统】进程概述

目录 1.进程的概念和定义 2.进程的特征 3.进程的状态 4.进程状态转换 5.进程的构成 5.1进程控制块&#xff08;PCB&#xff09; 5.1.1PCB的组织方式 5.2程序段 5.3数据段 6.如何控制进程 6.1进程的创建 6.2进程的终止 6.3进程的阻塞和唤醒 7.进程之间的通信手段 …

OceanBase—02(入门篇——使用obd安装OceanBase的几种方式)

OceanBase—02&#xff08;入门篇——使用obd安装OceanBase的几种方式&#xff09; 1. 一键部署1.1 下载并安装 all-in-one 安装包1.2 单机部署 OceanBase 数据库1.2.1 部署命令 1.3 使用 OBClient 客户端连接 OceanBase 数据库1.3.1 两种连接方式1.3.2 遇到的问题1.3.2.1 通过…

Allegro如何设置默认器件的高度信息操作指导

Allegro如何设置默认器件的高度信息操作指导 在给PCB设置限高的时候,一般会添加一个package keepout的铜皮,如下图 如果器件有高度信息,且没有超过限高要求,是不会有DRC报错的,如果器件没有高度信息,软件会默认给匹配一个高度信息,从而导致误报,如下图 可以看到默认的高…

Windows 查看端口占用情况 80端口被占用处理方法

一 . 用netstat指令查看是端口占用情况 查看所有端口的占用情况 C:\Users\Administrator>netstat -ano 活动连接协议 本地地址 外部地址 状态 PIDTCP 0.0.0.0:21 0.0.0.0:0 LISTENING 2228TCP 0.0.0.0:8…

【Leetcode60天带刷】day20二叉树—— 654.最大二叉树 , 617.合并二叉树 , 700.二叉搜索树中的搜索 , 98.验证二叉搜索树

题目&#xff1a; 530. 二叉搜索树的最小绝对差 给你一个二叉搜索树的根节点 root &#xff0c;返回 树中任意两不同节点值之间的最小差值 。 差值是一个正数&#xff0c;其数值等于两值之差的绝对值。 示例 1&#xff1a; 输入&#xff1a;root [4,2,6,1,3] 输出&#xff1…

【工具使用】Gitee

怎么创建Gitee仓库 1. 进入Gitee官网 https://gitee.com/ 2. 没有账号先注册 https://gitee.com/signup?redirect_to_url%2F 3.创建仓库 参考操作页面 你的电脑上要安装git 4. 电脑安装Git 1. 进入git官网&#xff08;官网下载方法-需要魔法工具&#xff09; https://…

视觉SLAM十四讲——ch13代码祥读(设计SLAM系统)

视觉SLAM十四讲——ch13学习过程及代码祥读 0. 可以下载文件的网址1. 重读《视觉SLAM十四讲》ch13实践设计SLAM系统2. 主函数的阅读3. config配置文件4. visual_odometry.cpp视觉里程计文件5. frontend.cpp前端文件&#xff08;重要文件1&#xff09;6. backend.cpp后端文件&am…

【人工智能概论】 Python标准库——typing(类型标注)、 assert断言、 @property装饰器、setter装饰器

【人工智能概论】 Python标准库——typing&#xff08;类型标注&#xff09;、 assert断言、 property装饰器、setter装饰器 文章目录 【人工智能概论】 Python标准库——typing&#xff08;类型标注&#xff09;、 assert断言、 property装饰器、setter装饰器一. typing&#…

向量数据库的行业标准逐渐清晰!Vector DB Bench 正式开源!

大模型带火了向量数据库赛道&#xff0c;也让各式各样的向量数据库进入开发者视野。 对于开发者而言&#xff0c;如何选择一个适合自己的向量数据库至关重要。不过&#xff0c;向量数据库的选型并不简单&#xff0c;开发者不仅需要对市面上各种开源和闭源的数据库进行全面的性能…

我心中世界上最好的语言是PHP,别不信【偷笑】

文章目录 一、前言1.1 最适合的语言2.2 流行的语言2.3 Java和PHP2.4 PHP的性能2.5 关于PHP2.6 作文思路概览 二、PHP的优势2.1 跨平台2.2 开发运行环境搭建方便2.3 强大的包管理工具2.4 拥有优秀的代码调试工具xdebug2.5 上手快&#xff0c;学习成本低2.6 丰富的企业级框架2.7 …

集电极开路是什么?集电极开路电路工作原理讲述

​集电极开路是指集电极电路中出现了断路的情况&#xff0c;导致电路无法正常工作。在集电极开路的情况下&#xff0c;电路中的电流无法通过集电极流过&#xff0c;导致电路无法正常放大信号或者控制其他器件的工作。 集电极开路的原因有很多&#xff0c;可能是器件本身的故障…