《opencv实用探索·十八》Camshift进行目标追踪流程

news2024/12/29 10:55:28

CamShift(Continuously Adaptive Mean Shift)是一种用于目标跟踪的方法,它是均值漂移(Mean Shift)的扩展,支持对目标的旋转跟踪,能够对目标的大小和形状进行自适应调整。

cv::CamShift和cv::meanShift区别:
cv::meanShift: 这是一种用于均值漂移目标跟踪的算法。它基于颜色直方图的均值漂移,寻找输入图像中与模板颜色直方图最相似的区域。在这个算法中,窗口的位置根据均值漂移进行调整,直到找到目标对象。cv::meanShift 返回找到的目标的矩形区域。但它的不足之处在于检测窗口的大小是固定的,而目标是不断变化的比如由近到远,各种旋转,固定的窗口是不合适的。

cv::CamShift: 这是 cv::meanShift 的扩展,用于在图像中寻找旋转目标的位置。cv::CamShift 在 cv::meanShift 的基础上引入了旋转矩形,使得它能够更好地适应旋转目标的情况。实际上,cv::CamShift 返回的是一个旋转矩形(cv::RotatedRect),而不仅仅是矩形。同时,能够对目标的大小和形状进行自适应调整,适用于目标尺寸和形状变化较大的情况下。

下面左图是meanShift,右图是CamShift追踪效果对比,可以看到随着目标有近到远变小,meanShfit追踪窗口始终固定不变,而CamShift能实时变化。
在这里插入图片描述

meanShift原理:
在这里插入图片描述
图中一堆点集,任意位置有个圆形窗口(黑色圆),可以看到窗口的圆心(点1位置)和窗口的质心(点2位置)并不重合,那么这个窗口的圆心便会向质心的方向移动,当圆心1与质心2大致重合时圆的位置大概在红色圆的位置,此时在被红色圆覆盖的点集中3的位置为点集最密集的地方,此时红色圆的质心又被更新到3的位置,那么圆便会继续从2的位置向3的位置移动。
不断执行上面的过程直到圆心最终和质心大致重合。每次迭代移动的矢量即meanShift。

meanShift算法的基本思路:
先设置一个感兴趣窗口(通常为矩形),计算窗口内像素的颜色直方图作为目标对象,根据目标对象的颜色分布,通过不断迭代计算窗口的平均漂移来更新窗口的位置和大小,从而实现目标的实时跟踪。
camShift算法原理是在meanShift基础上加入了自适应调整目标窗口大小和旋转方向实现目标的实时跟踪。

利用opencv的camShift算法来追踪目标:

RotatedRect CamShift( InputArray probImage, CV_IN_OUT Rect& window,
                                   TermCriteria criteria );

probImage:表示概率图像,通常是反向投影的结果。反向投影是基于目标的颜色直方图,用于估计在图像中的可能位置。
window:输入时表示追踪的初始窗口,输出时表示找到的新窗口。这是一个矩形,也就是目标区域的初始位置。
criteria:指定迭代的停止条件,通常是一个 cv::TermCriteria 类型的对象。它定义了迭代的最大次数、最小精度,或两者的组合。
cv::CamShift 函数返回一个 cv::RotatedRect 对象,它表示找到的目标的位置、方向和大小。

camShift追踪流程:
(1)首先在图像上选定一个目标区域(通常为矩形)
(2)计算选定区域的直方图分布,一般是HSV色彩空间的直方图。
(3)对下一帧图像B同样计算直方图分布。
(4)计算图像B当中与选定区域直方图分布最为相似的区域,即比较图像B的直方图和目标对象的直方图,生成一个反向投影图像。这个反向投影图像的每个像素值表示图像B该位置的像素值与目标对象直方图的相似程度。(反向投影图像可以将图像中与给定模式(目标对象)具有相似颜色分布的区域显著地突出显示)
(5)使用camshift算法将选定区域沿着最为相似的部分进行移动,直到找到最相似的区域,便完成了在图像b中的目标追踪。
(6)重复3到5的过程,就完成整个视频目标追踪。

下面是代码示例:

#include <opencv2/opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;
//-----------------------------------【全局变量声明】-----------------------------------------
//		描述:声明全局变量
//-------------------------------------------------------------------------------------------------
Mat image;
bool selectObject = false;
Point origin;
Rect selection;
int vmin = 10, vmax = 255, smin = 30;
bool isSelectRoi = false;
bool targetTrackingEnable = false;
Mat roi_hist;
int channels[] = { 0 };
int histSize = 180;  //bin分为180份
float range[] = { 0, 180 };
const float* histRange = { range };
TermCriteria term_crit_; 

//--------------------------------【onMouse( )回调函数】------------------------------------
//		描述:鼠标操作回调
//-------------------------------------------------------------------------------------------------
static void onMouse(int event, int x, int y, int, void*)
{
	if (selectObject)
	{
		selection.x = MIN(x, origin.x);
		selection.y = MIN(y, origin.y);
		selection.width = std::abs(x - origin.x);
		selection.height = std::abs(y - origin.y);

		selection &= Rect(0, 0, image.cols, image.rows);
	}

	switch (event)
	{
	case EVENT_LBUTTONDOWN:
		origin = Point(x, y);
		selection = Rect(x, y, 0, 0);
		selectObject = true;
		targetTrackingEnable = false;
		break;

	case EVENT_LBUTTONUP:
		selectObject = false;
		if (selection.width > 0 && selection.height > 0)
			isSelectRoi = true;
		break;
	}
}

int main(int argc, const char** argv)
{

	VideoCapture cap;
	Rect trackWindow;
	int hsize = 16;
	float hranges[] = { 0,180 };
	const float* phranges = hranges;

	cap.open(0);

	if (!cap.isOpened())
	{
		cout << "不能初始化摄像头\n";
	}

	namedWindow("Histogram", 0);
	namedWindow("CamShift Demo", 0);
	setMouseCallback("CamShift Demo", onMouse, 0);
	//设置滚动条可以在二值化图像时实时改变阈值
	createTrackbar("Vmin", "CamShift Demo", &vmin, 256, 0);
	createTrackbar("Vmax", "CamShift Demo", &vmax, 256, 0);
	createTrackbar("Smin", "CamShift Demo", &smin, 256, 0);

	Mat frame;

	for (;;)
	{
		cap >> frame;
		if (frame.empty())
			break;
		frame.copyTo(image);

		if (isSelectRoi)
		{
			//获取第一帧图像并指定ROI区域
			Mat roi_hsv;
			Mat roi = image(selection); //截取鼠标绘制的roi
			cvtColor(roi, roi_hsv, COLOR_BGR2HSV);  //把roi图像转为hsv色彩图像

			//去除低亮度值,二值化图像,低亮度置0,高亮度置1
			Mat mask;
			int _vmin = vmin, _vmax = vmax;
			inRange(roi_hsv, Scalar(0, smin, MIN(_vmin, _vmax)),
				Scalar(180, 255, MAX(_vmin, _vmax)), mask);

			//计算直方图
			/*
			在HSV颜色空间中,H(色相)的取值范围是[0, 360),而在OpenCV中,H通道的取值范围被映射到[0, 180)。这是因为OpenCV中对H通道的取值范围进行了缩放,将360度映射到了180度。

			所以,在使用 calcHist 函数计算直方图时,range[] 参数用于指定每个通道的取值范围。对于HSV颜色空间中的H通道,这里使用的是[0, 180)。这确保了直方图的统计考虑了整个H通道的取值范围。

			如果你的颜色空间是RGB,而不是HSV,那么在计算直方图时,range[] 参数应该是[0, 256)。这样就能覆盖RGB图像中每个通道的所有可能取值。
			*/
			calcHist(&roi_hsv, 1, channels, mask, roi_hist, 1, &histSize, &histRange);
			// 归一化
			normalize(roi_hist, roi_hist, 0, 255, NORM_MINMAX);

			// 4. 目标追踪
			// 4.1 设置窗口搜索终止条件:最大迭代次数,窗口中心漂移最小值
			TermCriteria term_crit(TermCriteria::EPS | TermCriteria::COUNT, 10, 1);
			term_crit_ = term_crit;

			waitKey(30);
			isSelectRoi = false;
			targetTrackingEnable = true;
		}
		else if (targetTrackingEnable)
		{
			// 4.2 计算直方图的反向投影
			Mat hsv;
			cvtColor(image, hsv, COLOR_BGR2HSV);  //把输入图像转为hsv色彩图像
			Mat backProject;
			cv::calcBackProject(&hsv, 1, channels, roi_hist, backProject, &histRange);

			// 4.3	进行meanshift追踪
			RotatedRect track_box = cv::CamShift(backProject, selection, term_crit_);

			// 4.4 将追踪的位置绘制在视频上,并进行显示
			ellipse(image, track_box, Scalar(0, 0, 255), 2);
			imshow("CamShift Demo", image);

			if (waitKey(30) == 'q')
				break;

		}

		if (selectObject && selection.width > 0 && selection.height > 0)
		{
			Mat roi(image, selection);
			bitwise_not(roi, roi);
		}

		imshow("CamShift Demo", image);
		if (waitKey(30) == 'q')
			break;
	}

	// 5. 资源释放
	cap.release();
	destroyAllWindows();

	return 0;
}

效果展示:
在这里插入图片描述

Camshift的优点:简单,计算量较少,因为Camshift的本质就局部检测,在局部里检测“密度”最大的位置。
Camshift的缺点:Camshift的优点有时候也正是其缺点,因为其简单,所以对于复杂背景或者纹理丰富的物体跟踪效果较差。因为Camshift是对直方图反投影所形成的二值图像进行处理的,如果背景较为复杂或者物体的纹理较为丰富,那么此二值图像的噪声就很多(具体原因可参考直方图反投影的原理),这将直接干扰Camshift对物体位置的判断。
所以对Camshift的总结为:Camshift适用于物体表面颜色较为单一,且和背景颜色差距较大

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1304885.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【CANopen进阶日记】③ CANopen对象字典工具

【CANopen进阶日记】专栏目录 第一章 CAN协议栈详解 第二章 CANopen协议栈详解 第三章 CANopen对象字典工具 文章目录 【CANopen进阶日记】专栏目录前言一、对象字典简介二、CANopen协议栈框架三、NMT主从四、SDO客户端服务器五、PDO生产者消费者5.1 RPDO5.2 TPDO同步周期5.3 …

python代码200行左右,python100行代码案例

大家好&#xff0c;小编来为大家解答以下问题&#xff0c;python代码200行左右&#xff0c;python100行代码案例&#xff0c;今天让我们一起来看看吧&#xff01; 有用的 Python 单行代码片段&#xff0c;只需一行代码即可解决特定编码问题&#xff01; 在本文中&#xff0c;我…

CTF V8 pwn入门(一)

仍然是因为某些原因&#xff0c;需要学学浏览器pwn 环境 depot_tools建议直接去gitlab里下&#xff0c;github上这个我用魔法都没下下来 下完之后执行 echo export PATH$PATH:"/root/depot_tools" >> ~/.bashrc路径换成自己的就ok了 然后是ninja git clo…

DSP28335之CAN通信易错点总结

一、CAN初始化流程 ①接收发送引脚初始化&#xff1b; ②接收和发送邮箱设置&#xff1b; ③邮箱使能&#xff1b; ④波特率配置&#xff1b; ⑤接收掩码设置&#xff1b; ⑥中断配置。 二、几个重要的知识点 ①影子寄存器 因为ECanbRegs是不可以单独对位操作&#xf…

SD-WAN架构:优化连接以提升性能

SD-WAN架构主要分为三种类型&#xff0c;分别为本地架构、支持云的架构、支持云的骨干架构。每一种架构都基于它们利用广域网&#xff08;WAN&#xff09;的方式而有其独特的优势。本文将对三种SD-WAN架构进行简要介绍。 SD-WAN本地架构 SD-WAN本地架构是在现场使用SD-WAN盒或…

焦炭冶金工艺3D可视化仿真展示更直观、形象

冶金行业作为重要的工业领域&#xff0c;其岗位实践培训一直面临着诸多挑战&#xff0c;随着web3d开发和VR虚拟仿真技术的不断创新和应用&#xff0c;冶金3D虚拟仿真实践教学平台应运而生&#xff0c;为钢铁生产培训带来了崭新的变革。 冶金3D虚拟仿真实践教学平台采用了先进的…

AIGC专题报告:ChatGPT纪要分享

今天分享的AIGC系列深度研究报告&#xff1a;《AIGC专题报告&#xff1a;ChatGPT纪要分享》。 &#xff08;报告出品方&#xff1a;久谦中台&#xff09; 报告共计&#xff1a;135页 OpenAI 高管解密 ChatGPT GPT-3 是一种大型语言模型&#xff0c;被训练用来在给定上下文中…

百度文库下载要用券?Kotlin爬虫几步解决

百度作为国内知名的网站&#xff0c;尤其是文库里面有各种丰富的内容&#xff0c;对我们学习生活都有很大的帮助&#xff0c;就因为其内容丰富&#xff0c;如果看见好用有意思的文章还用复制粘贴等方式就显得有点落后了&#xff0c;今天我将用我所学的爬虫知识给你们好好上一课…

Mac 下 Python+Selenium 自动上传西瓜视频

背景 研究下 PythonSelenium 自动化测试框架&#xff0c;简单实现 Mac 下自动化批量上传视频西瓜视频并发布&#xff0c;分享给需要的同学&#xff08;未做过多的异常处理&#xff09;。 脚本实现 首先通过手工手机号登录&#xff0c;保存西瓜视频网站的 cookie 文件 之后加载…

有什么项目可以大量使用c++实现?

有什么项目可以大量使用c实现&#xff1f; 在开始前我有一些资料&#xff0c;是我根据自己从业十年经验&#xff0c;熬夜搞了几个通宵&#xff0c;精心整理了一份「c的资料从专业入门到高级教程工具包」&#xff0c;点个关注&#xff0c;全部无偿共享给大家&#xff01;&#x…

《opencv实用探索·十七》calcBackProject直方图反向投影

在了解反向投影前需要先了解下直方图的概念&#xff0c;可以看我上一章内容&#xff1a;opencv直方图计算calcHist函数解析 直方图反向投影是一种图像处理技术&#xff0c;通常用于目标检测和跟踪。通过计算反向投影&#xff0c;可以将图像中与给定模式&#xff08;目标对象&a…

工作流程flowable(二)流程节点跟踪

flowable 节点跟踪 一、发起1-1 流程模型1-1-1 流程模型定义1-1-2 部署流程模型 {modelId} 1-2 部署管理1-2-1 流程定义列表查询 新的改变 二、我的申请新的改变 三、我的待办新的改变 三、我的已办新的改变 一、发起 1-1 流程模型 1-1-1 流程模型定义 1-1-2 部署流程模型 {…

我的隐私计算学习——隐私集合求交(2)

笔记内容来自多本书籍、学术资料、白皮书及ChatGPT等工具&#xff0c;经由自己阅读后整理而成。 前篇可见&#xff1a;我的隐私计算学习——隐私集合求交&#xff08;1&#xff09; &#xff08;三&#xff09;PSI应用场景问题 ​在目前的实际应用中&#xff0c;衍生出一些新…

美食大赛的题解

目录 原题描述&#xff1a; 题目描述&#xff1a; 输入格式&#xff1a; 输出格式&#xff1a; 样例输入&#xff1a; 样例输出&#xff1a; 数据规模&#xff1a; 题目大意&#xff1a; 主要思路&#xff1a; 注&#xff1a; 代码&#xff1a; 原题描述&#xff1a…

updateBatch批量更新

java代码 Dao层 int updateBatch(Param("userList") List<User> userList);sql配置文件 <update id"updateBatch" parameterType"java.util.List" ><foreach collection"userList" item"user" separator&quo…

Next.js中的App Router与Page Router,各自的作用和使用方式,如何理解和配置使用?

App Router介绍 Next.js中的App Router是全局的路由器&#xff0c;它用于在应用程序的所有页面之间进行导航。它可以用于在页面之间传递状态和数据&#xff0c;类似于React中的Context。 App Router是通过_app.js文件中的getInitialProps方法来配置的。 在 Next.js 中&#xf…

算法通关村第十三关—数学与数学基础问题(青铜)

数学与数学基础问题 一、统计专题 1.1 符号统计 LeetCode1822给定一个数组&#xff0c;求所有元素的乘积的符号&#xff0c;如果最终答案是负的返回-1&#xff0c;如果最终答案是正的返回1&#xff0c;如果答案是0返回0。  题目比较简单&#xff0c;正数对结果完全没影响&…

RK3568驱动指南|第八篇 设备树插件-第75章ConfigFS的核心数据结构

瑞芯微RK3568芯片是一款定位中高端的通用型SOC&#xff0c;采用22nm制程工艺&#xff0c;搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码&#xff0c;支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU&#xff0c;可用于轻量级人工…

【Docker】进阶之路:(九)Docker网络

【Docker】进阶之路&#xff1a;&#xff08;九&#xff09;Docker网络 Docker网络模式简介bridge网络模式host网络模式none网络模式container网络模式user-defined网络模式1.创建自定义的bridge网络2.使用自定义网络 高级网络配置docker network命令 为什么要了解容器的网络模…