《opencv实用探索·十九》光流法检测运动目标

news2024/11/14 3:22:42

前言
光流法(Optical Flow)是计算机视觉中的一种技术,用于估计图像中相邻帧之间的像素位移或运动。它是一种用于追踪图像中物体运动的技术,可以在视频中检测并测量物体的运动轨迹。
光流的直观理解:
光流是一个视频中两个连续帧之间的逐像素运动估计任务。基本上,光流任务意味着计算像素的移动向量作为物体在两个相邻图像之间的位移差。光流的主要思想是估计物体运动或摄像机运动引起的物体的位移矢量
在这里插入图片描述

光流法基于以下两个主要假设:

灰度恒定假设(Brightness Constancy Assumption): 在短时间内,相邻帧中的像素灰度值保持不变。这意味着在相邻帧中,同一物体的灰度值应该是相似的。

空间一致性假设(Spatial Coherence Assumption): 邻近像素点的运动是相似的。这意味着在一个小的局部区域内,像素点的运动可以通过一个共同的运动向量来描述。

基于这些假设,光流法的目标是计算场景中每个像素点在图像平面上的运动矢量。这些运动矢量描述了像素从一帧到下一帧的位移。
在光流法的实现中,有几种不同的方法,其中最常见的是Lucas-Kanade方法和Horn-Schunck方法。
Lucas-Kanade方法: 该方法基于灰度恒定和空间一致性假设,通过在图像上的局部区域内求解一个线性方程组来计算运动矢量。它假设邻近像素点的运动是相似的,因此在局部区域内使用最小二乘法来估计运动。
Horn-Schunck方法: 该方法通过最小化整个图像上的一个全局能量函数来计算光流场。它对整个图像施加了平滑性的约束,因此在处理相对较大的运动时效果较好。

总体而言,光流法是一种有用的技术,尤其在分析视频中物体的运动、跟踪目标或检测异常事件时。然而,它的性能可能受到场景中运动的复杂性、遮挡、图像噪声等因素的影响,因此在特定应用中需要仔细考虑其局限性。

流光法检测中需要用到的一些函数说明:
(1)cv::goodFeaturesToTrack

void cv::goodFeaturesToTrack(
    InputArray image, // 输入图像(通常是灰度图像)
    OutputArray corners, // 输出参数,包含检测到的角点坐标
    int maxCorners, // 要检测的角点的最大数量
    double qualityLevel, // 角点的质量水平阈值,范围在0到1之间
    double minDistance, // 检测到的角点之间的最小欧氏距离。两个角点之间的距离小于该值的角点将被忽略。
    InputArray mask = noArray(), // 可选参数,用于指定感兴趣区域
    int blockSize = 3, // 角点检测中使用的邻域区域的大小
    bool useHarrisDetector = false, // 是否使用Harris角点检测算法,如果为false,则使用Shi-Tomasi角点检测算法
    double k = 0.04 // Harris角点检测算法的自由参数
);

cv::goodFeaturesToTrack 是OpenCV中用于在图像中检测角点的函数,通常用于计算机视觉中的光流法等任务。这个函数实现了 Shi-Tomasi 角点检测算法,该算法是对 Harris 角点检测算法的改进。
关键参数的设置说明:
maxCorners:如果设置得太小,可能会错过图像中的一些重要角点。如果设置得太大,算法可能检测到冗余的角点,导致性能下降。

qualityLevel:一般情况下设置0.01,较小的 qualityLevel 值会选择图像中质量较高的角点,即灰度梯度变化较为显著的地方。相应地,检测到的角点数量可能相对较少。这个设置适合于希望选择图像中明显特征的情况,例如在纹理较强的区域选择角点。较大的 qualityLevel 值会放宽对角点质量的要求,接受更多的角点,即使它们的质量不太高。这个设置适合于希望检测到更多角点,即使它们的特征不如较高质量的角点明显的情况。

minDistance: 选择通常取决于图像中角点的分布情况。如果图像中的角点密集分布,可以选择较小的值,例如 5-10 像素。如果角点分布较稀疏,可以适当增大该值。

(2)calcOpticalFlowPyrLK(Lucas-Kanade光流算法)

void cv::calcOpticalFlowPyrLK(
    cv::InputArray prevImg,
    cv::InputArray nextImg,
    cv::InputArray prevPts,
    cv::InputOutputArray nextPts,
    cv::OutputArray status,
    cv::OutputArray err,
    cv::Size winSize = Size(21, 21),
    int maxLevel = 3,
    cv::TermCriteria criteria = TermCriteria(TermCriteria::COUNT + TermCriteria::EPS, 30, 0.01),
    int flags = 0,
    double minEigThreshold = 1e-4
);

calcOpticalFlowPyrLK 是 OpenCV 库中用于光流计算的函数之一,用于在两幅图像之间计算稀疏特征点的光流。
prevImg: 先前帧的输入图像(灰度图)。
nextImg: 下一帧的输入图像(灰度图)。
prevPts: 先前帧的输入特征点。
nextPts: 输出参数,包含了在下一帧中找到的对应特征点的坐标。
status: 输出参数,标志每个特征点的跟踪状态(1表示成功,0表示失败)。
err: 输出参数,包含每个特征点的误差。
winSize: 搜索窗口的大小。
maxLevel: 金字塔的最大层数。
criteria: 用于迭代优化的终止准则。
flags: 光流计算的选项。
minEigThreshold: 特征值的阈值,用于判断矩阵是否足够良好。

光流法检测基本流程:
(1)获取两幅相邻的图像帧。这两帧图像之间的时间间隔应足够小,以便近似相邻帧之间的物体位移。对图像进行必要的预处理,例如灰度化、去噪、边缘检测等。预处理的目标是提取图像中的特征,以便在不同帧之间匹配。
(2)在两帧图像中检测特征点。常用的特征点包括角点、角落、边缘等。
(3)计算光流场:光流场表示图像中每个像素的位移向量。计算光流场的目标是找到相邻帧中每个特征点的位移。常见的光流计算方法包括:
Lucas-Kanade方法: 假设在一个小的邻域内,光流是基本一致的。通过局部的亮度梯度来估计位移。
Horn-Schunck方法: 基于全局约束的光流计算方法,考虑整个图像中的光流场。
(4)可以将计算得到的光流场可视化,以便观察物体的运动方向和速度。通常使用箭头或其他标记来表示光流向量。

代码示例:

#include <opencv2/opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;

//-----------------------------------【全局函数声明】-----------------------------------------
//		描述:声明全局函数
//-------------------------------------------------------------------------------------------------
void tracking(Mat& frame, Mat& output);

//-----------------------------------【全局变量声明】-----------------------------------------
//		描述:声明全局变量
//-------------------------------------------------------------------------------------------------
string window_name = "optical flow tracking";
Mat gray_now;	// 当前图片
Mat gray_prev;	// 预测图片
vector<Point2f> pointsPre;	// 上一帧角点集合
vector<Point2f> pointsNow;  //下一帧角点集合
vector<Point2f> pointsPreTmp;	// 一个临时容器,存放上一帧角点集合
vector<Point2f> features;	// 检测的特征
int maxCount = 500;	// 检测的最大特征数
double qLevel = 0.01;	// 特征检测的等级
double minDist = 10.0;	// 两特征点之间的最小距离
vector<uchar> status;	// 跟踪特征的状态,特征的流发现为1,否则为0
vector<float> err;


int main()
{

	Mat frame;
	Mat result;

	VideoCapture capture("1.avi");

	if (capture.isOpened())	// 摄像头读取文件开关
	{
		//获取第一帧图像并保存计算的角点
		capture >> frame;
		if (!frame.empty())
		{
			cvtColor(frame, gray_prev, COLOR_BGR2GRAY);
			//角点检测
			goodFeaturesToTrack(gray_prev, features, maxCount, qLevel, minDist);
			//存放检测的角点
			pointsPre.insert(pointsPre.end(), features.begin(), features.end());
			//临时容器在存放一份角点
			pointsPreTmp.insert(pointsPreTmp.end(), features.begin(), features.end());
		}

		while (true)
		{
			//循环采取下一帧图像
			capture >> frame;

			if (!frame.empty())
			{
				tracking(frame, result);
			}
			else
			{
				printf(" --(!) No captured frame -- Break!");
				break;
			}

			int c = waitKey(50);
			if ((char)c == 27)
			{
				break;
			}
		}
	}
	return 0;
}

//-------------------------------------------------------------------------------------------------
// function: tracking
// brief: 跟踪
// parameter: frame	输入的视频帧
//			  output 有跟踪结果的视频帧
// return: void
//-------------------------------------------------------------------------------------------------
void tracking(Mat& frame, Mat& output)
{
	cvtColor(frame, gray_now, COLOR_BGR2GRAY);

	frame.copyTo(output);

	// 添加特征点
	if (pointsPre.size() <= 10)  //如果角点的数量过少就继续添加
	{
		//角点检测
		goodFeaturesToTrack(gray_prev, features, maxCount, qLevel, minDist);
		//存放检测的角点
		pointsPre.insert(pointsPre.end(), features.begin(), features.end());
		//临时容器在存放一份角点
		pointsPreTmp.insert(pointsPreTmp.end(), features.begin(), features.end());
	}

	//Lucas-Kanade光流法运动估计(pointsNow存放的是估计下一帧gray_now图像中的特征点)
	calcOpticalFlowPyrLK(gray_prev, gray_now, pointsPre, pointsNow, status, err);

	// 保留下一帧中估计出的比较好的特征点
	int k = 0;
	for (size_t i = 0; i < pointsNow.size(); i++)
	{
		//设置跟踪点被接受的条件
		//status[i]:表示第 i 个特征点的跟踪状态,为1表示特征点的流被检测到,为0表示未检测到。
		//前后两次点的x移动距离 + y移动距离 > 2
		if (status[i] && ((abs(pointsPre[i].x - pointsNow[i].x) + abs(pointsPre[i].y - pointsNow[i].y)) > 2))
		{
			pointsPreTmp[k] = pointsPreTmp[i];   //保留了下一帧好的特征点,那么对应的上一帧同样位置的特征点重新备份到临时容器
			pointsNow[k++] = pointsNow[i];      //重新对下一帧角点容器进行更新,保存存放的都是好的特征点
		}
	}
	//重新更新两个容器长度
	pointsNow.resize(k);
	pointsPreTmp.resize(k);

	// 显示特征点和运动轨迹
	for (size_t i = 0; i < pointsNow.size(); i++)
	{
		line(output, pointsPreTmp[i], pointsNow[i], Scalar(0, 0, 255)); //画出直线起点为上一帧特征点,终点为下一帧特征点
		circle(output, pointsNow[i], 3, Scalar(0, 255, 0), -1);         //对下一帧特征点标记圆,可以明显看出运动方向
	}

	// 采集下一帧图像之前先把当前帧的结果更新到上一帧
	pointsPre = pointsNow;
	gray_prev = gray_now.clone();

	imshow(window_name, output);
}

代码分析:
(1)先采集第一帧当作上一帧,进行角点检测存放到容器
(2)进入while循环开启采集下一帧,通过Lucas-Kanade光流法估计上一帧角点在下一帧的位置
(3)筛选下一帧比较好的角点存放容器
(4)画出上一帧到下一帧路线进行显示
(5)在继续开启下一帧图像采集前把这一帧的结果更新到上一帧容器
(6)开启一个新的循环,先判断上一帧容器角点数量是否充足,不充足则添加,然后重复上述步骤

效果显示:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1313196.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VINS-MONO代码解读6----pose_graph

开始pose_graph部分&#xff0c;本部分记住一句话无论是快速重定位还是正常重定位&#xff0c;求出 T w 1 w 2 T_{w_1w_2} Tw1​w2​​就是终极目标。 还剩一个整体Pipeline~~ 1. pose_graph_node.cpp 注意&#xff0c;定义全局变量时即实例化了一个对象 PoseGraph posegra…

开关电源这些纹波噪声如何抑制?

电源工程师都知道&#xff0c;开关电源在运行过程中会产生多种纹波噪声&#xff0c;对电路性能和稳定性产生一定影响&#xff0c;所以要针对各种纹波噪声采取合理的措施来解决&#xff0c;那么如何做&#xff1f; 1、低频纹波噪声主要是由于开关管开关状态的快速变化导致的。在…

C++异步网络库workflow系列教程(3)Series串联任务流

往期教程 如果觉得写的可以,请给一个点赞关注支持一下 观看之前请先看,往期的两篇博客教程,否则这篇博客没办法看懂 workFlow c异步网络库编译教程与简介 C异步网络库workflow入门教程(1)HTTP任务 C异步网络库workflow系列教程(2)redis任务 简介 首先,workflow是任务流的意…

图解python | 字典

1.Python字典(Dictionary) 字典是另一种可变容器模型&#xff0c;且可存储任意类型对象。 字典的每个键值 key>value 对用冒号 : 分割&#xff0c;每个键值对之间用逗号 , 分割&#xff0c;整个字典包括在花括号 {} 中 ,格式如下所示&#xff1a; d {key1 : value1, key…

软件测试职业规划

软件测试人员的发展误区【4】 公司开发的产品专业性较强&#xff0c;软件测试人员需要有很强的专业知识&#xff0c;现在软件测试人员发展出现了一种测试管理者不愿意看到的景象&#xff1a; 1、开发技术较强的软件测试人员转向了软件开发(非测试工具开发)&#xff1b; 2、业务…

题目:区间或 (蓝桥OJ 3691)

题目描述: 解题思路: 本题采用位运算.先求出全部数组每一位各自的前缀和,然后再判断区间内每一位区间和是否为0,不为0则乘上相应的2^n并将各个为的2^n相加,得ans. 实现原理图 题解: #include<bits/stdc.h> using namespace std;const int N 1e5 9;int a[N], prefix[35…

2023AI Agent智能体HR商用落地的案例汇集

过去一周在各类智能体产品不断呈现新发展态势的情况下&#xff0c;我们将注意力继续放回AI Agent智能体在大型和超大型企业不同领域商用落地的可能性探索上面去。 本着这一初衷&#xff0c;我们会继续把注意力转向探索AI Agent智能体在HR领域的商用落地所面临的挑战和最可能实…

ida脚本环境开发配置idapythonidacpp三端环境(win,mac,linux)

ida脚本也有一段时间了,一直有个痛点是找不到比较好的方法热重载脚本来实时改动生效,导致开发效率老慢了。固总结下比较友好的环境搭配 使用ida热加载插件让你开发脚本更高效 github地址: GitHub - 0xeb/ida-qscripts: An IDA plugin to increase productivity when developi…

PyTorch: 基于【VGG16】处理MNIST数据集的图像分类任务【准确率98.9%+】

目录 引言在Conda虚拟环境下安装pytorch步骤一&#xff1a;利用代码自动下载mnist数据集步骤二&#xff1a;搭建基于VGG16的图像分类模型步骤三&#xff1a;训练模型步骤四&#xff1a;测试模型运行结果后续模型的优化和改进建议完整代码结束语 引言 在本博客中&#xff0c;小…

MySQL数据库卸载-Windows

目录 1. 停止MySQL服务 2. 卸载MySQL相关组件 3. 删除MySQL安装目录 4. 删除MySQL数据目录 5. 再次打开服务&#xff0c;查看是否有MySQL卸载残留 1. 停止MySQL服务 winR 打开运行&#xff0c;输入 services.msc 点击 "确定" 调出系统服务。 2. 卸载MySQL相关组…

国标级联/流媒体音视频平台EasyCVR设备录像下载异常该如何解决?

视频监控TSINGSEE青犀视频平台EasyCVR能在复杂的网络环境中&#xff0c;将分散的各类视频资源进行统一汇聚、整合、集中管理&#xff0c;在视频监控播放上&#xff0c;视频安防监控汇聚平台可支持1、4、9、16个画面窗口播放&#xff0c;可同时播放多路视频流&#xff0c;也能支…

一、win10+yolov8+anaconda环境部署

1、安装anaconda &#xff08;1&#xff09;打开aonconda下载地址&#xff1a;https://www.anaconda.com/download&#xff0c;点击download下载。 2、下载完成后&#xff0c;双击打开&#xff0c;点击Next&#xff0c;I Agree&#xff0c;选择just me&#xff1b; 3、勾选…

SQL进阶理论篇(五):什么是Hash索引

文章目录 简介MySQL中的Hash索引与B树的区别总结参考文献 简介 hash&#xff0c;即哈希&#xff0c;也被称为是散列函数。 Hash在数据库中的应用&#xff0c;可以帮助我们大幅度提升检索数据的效率。 大名鼎鼎的MD5其实就是Hash函数的一种变体。 Hash算法&#xff0c;是通过…

ArkTS编译时遇到arkts-no-obj-literals-as-types错误【Bug已解决-鸿蒙】

文章目录 项目场景:问题描述原因分析:解决方案:解决方案1解决方案2此Bug解决方案总结项目场景: 在开发鸿蒙项目过程中,遇到了arkts-no-obj-literals-as-types,总结了自己和网上人的解决方案,故写下这篇文章。 遇到问题: rkTS编译时遇到arkts-no-obj-literals-as-type…

操作系统中的作业管理

从用户的角度看&#xff0c;作业是系统为完成一个用户的计算任务&#xff08;或一次事务处理&#xff09;所做的工作总和。例如&#xff0c;对于用户编制的源程序&#xff0c;需经过对源程序的编译、连接编辑或连接装入及运行产生计算结果。这其中的每一个步骤&#xff0c;常称…

解锁知识的新大门:自建知识付费小程序的技术指南

在数字化时代&#xff0c;知识付费小程序的崛起为创作者和学习者提供了全新的学习和分享方式。本文将以“知识付费小程序源码”为关键词&#xff0c;从技术角度出发&#xff0c;为你展示如何搭建一个独具特色的知识付费平台。 步骤1&#xff1a;选择适用的知识付费小程序源码…

知识库SEO:提升网站内容质量与搜索引擎排名的策略

随着搜索引擎算法的不断更新和优化&#xff0c;单纯依靠关键词堆砌和外部链接的时代已经过去。现在的SEO&#xff08;搜索引擎优化&#xff09;已经转向了以提供高质量、有价值内容为核心的阶段。知识库SEO便是这个新阶段的重要策略之一。 | 一、知识库SEO的概念与意义 1.定义…

《儿童绘本》期刊杂志发表论文投稿

《儿童绘本》杂志是由国家新闻出版管理部门批准&#xff0c;由吉林省舆林报刊发展有限责任公司主管主办&#xff0c;国内外公开发行的全国优秀期刊。办刊宗旨&#xff1a;以“普及绘本知识、推动儿童阅读”为理念&#xff0c;带动家庭亲子阅读&#xff0c;推动阅读教育及图画书…

一文解析数据结构是如何装入 CPU 寄存器的?

我们在之前很多文章的讲解中涉及了CPU与寄存器&#xff0c;然后有同学问了这样一个问题&#xff1a;既然CPU内部的寄存器数量有限&#xff0c;容量有限&#xff0c;那么我们使用的庞大的数据结构是怎样装入寄存器供CPU计算的呢&#xff1f;这篇文章就为你讲解一下这个问题。 内…