传统CV算法——背景建模算法介绍

news2024/9/21 12:41:26

帧差法

由于场景中的目标在运动,目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧图像进行差分运算,不同帧对应的像素点相减,判断灰度差的绝对值,当绝对值超过一定阈值时,即可判断为运动目标,从而实现目标的检测功能。

  • 帧差法非常简单,但是会引入噪音和空洞问题
    在这里插入图片描述

混合高斯模型

在进行前景检测前,先对背景进行训练,对图像中每个背景采用一个混合高斯模型进行模拟,每个背景的混合高斯的个数可以自适应。然后在测试阶段,对新来的像素进行GMM匹配,如果该像素值能够匹配其中一个高斯,则认为是背景,否则认为是前景。由于整个过程GMM模型在不断更新学习中,所以对动态背景有一定的鲁棒性。最后通过对一个有树枝摇摆的动态背景进行前景检测,取得了较好的效果。
混合高斯模型(Gaussian Mixture Model, GMM)是一种统计模型,用于表示具有多个峰值的数据分布。它是由多个高斯分布(也称为正态分布)组合而成的,每个高斯分布被称为一个组分。GMM广泛应用于聚类、密度估计和模式识别等领域。

原理:

混合高斯模型的基本思想是通过多个高斯分布的线性组合来拟合数据的整体分布。模型中每个高斯分布负责描述数据中的一个群(cluster)。

每个高斯分布组分由三个参数定义:

  • 均值(Mean):描述该分布中心的位置。
  • 协方差(Covariance):描述分布的宽度及其方向。
  • 混合权重(Mixture Weight):每个高斯分布在模型中的占比,确保所有分布的混合权重之和为1。

学习方法:

GMM通常使用极大似然估计方法进行参数估计,最常用的算法是期望最大化(EM)算法。EM算法通过迭代两个步骤来求解:

  1. 期望步(E-step):根据当前参数估计,计算每个数据点属于各个高斯分布的概率(软聚类)。
  2. 最大化步(M-step):更新每个高斯分布的参数,使得似然函数最大化。

应用场景:

  1. 聚类分析:GMM可以进行软聚类,即允许数据点以一定的概率属于多个群。这一特性使得GMM在某些应用中比硬聚类方法(如K-means)更为适用。
  2. 图像分割:在图像处理中,可以使用GMM对像素点进行聚类,以实现图像的区域分割。
  3. 语音识别:在语音信号的特征空间中,使用GMM来模拟音频数据的统计特性。
  4. 异常检测:GMM能够估计数据的整体分布,因此可以用来识别那些不符合预期分布的异常点。

混合高斯模型以其灵活性和强大的表达能力,在多个领域内有着广泛的应用。

  • 算法假设 在视频中对于像素点的变化情况应当是符合高斯分布
    在这里插入图片描述
  • 背景的实际分布应当是多个高斯分布混合在一起,每个高斯模型也可以带有权重
    在这里插入图片描述
混合高斯模型学习方法
  • 1.首先初始化每个高斯模型矩阵参数。

  • 2.取视频中T帧数据图像用来训练高斯混合模型。来了第一个像素之后用它来当做第一个高斯分布。

  • 3.当后面来的像素值时,与前面已有的高斯的均值比较,如果该像素点的值与其模型均值差在3倍的方差内,则属于该分布,并对其进行参数更新。

  • 4.如果下一次来的像素不满足当前高斯分布,用它来创建一个新的高斯分布。

混合高斯模型背景建模测试方法

混合高斯模型在背景建模中主要应用于视频监控系统中用于动态背景的检测和分析。该技术通过分析视频帧中的每个像素点随时间变化的统计特性,使用多个高斯分布来表示各个像素点的颜色变化,从而区分出背景和前景(如移动的对象)。这使得系统能够有效地识别和追踪视频中的动态对象,如行人、车辆等,同时忽略由光照变化、树木摇动等因素引起的背景噪声。此方法对于提高视频监控的准确性和效率具有重要作用。

在测试阶段,对新来像素点的值与混合高斯模型中的每一个均值进行比较,如果其差值在2倍的方差之间的话,则认为是背景,否则认为是前景。将前景赋值为255,背景赋值为0。这样就形成了一副前景二值图。

在这里插入图片描述

import numpy as np
import cv2

#经典的测试视频
cap = cv2.VideoCapture('test.avi')
#形态学操作需要使用
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(3,3))
#创建混合高斯模型用于背景建模
fgbg = cv2.createBackgroundSubtractorMOG2()

while(True):
    ret, frame = cap.read()
    fgmask = fgbg.apply(frame)
    #形态学开运算去噪点
    fgmask = cv2.morphologyEx(fgmask, cv2.MORPH_OPEN, kernel)
    #寻找视频中的轮廓
    im, contours, hierarchy = cv2.findContours(fgmask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    for c in contours:
        #计算各轮廓的周长
        perimeter = cv2.arcLength(c,True)
        if perimeter > 188:
            #找到一个直矩形(不会旋转)
            x,y,w,h = cv2.boundingRect(c)
            #画出这个矩形
            cv2.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),2)    

    cv2.imshow('frame',frame)
    cv2.imshow('fgmask', fgmask)
    k = cv2.waitKey(150) & 0xff
    if k == 27:
        break

cap.release()
cv2.destroyAllWindows()

在这里插入图片描述
在这里插入图片描述
混合高斯模型是一种常用的背景建模算法,用于检测视频图像中的静态背景。下面是混合高斯模型检测背景的优点和缺点。

优点:

  1. 处理复杂的背景:混合高斯模型可以建模和适应不同复杂度的背景,包括有多个背景物体、光照变化等。
  2. 自适应性:可以根据图像序列的变化自动更新模型参数,适应背景的变化。
  3. 实时性:混合高斯模型能够处理实时视频流,并在短时间内进行背景差分操作。

缺点:

  1. 参数选择:选择合适的模型参数对于混合高斯模型非常重要,包括高斯分量数目和阈值等,不当的设置会导致误检测和漏检测问题。
  2. 高计算开销:混合高斯模型需要对每个像素计算多个高斯分量的权重,并进行背景更新和背景差分操作,计算开销较高。
  3. 漂移问题:在背景建模的过程中,如果前景对象停留时间过长,混合高斯模型可能会将其误判为背景,从而导致漂移问题。

总体来说,混合高斯模型是一种强大的背景建模算法,适用于多种场景。然而,该模型的参数设置和计算开销需要仔细考虑,同时对于处理停留时间较长的前景对象可能会出现漂移问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2103161.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Python】一文详细向您介绍 `bisect_right` 函数

【Python】一文详细向您介绍 bisect_right 函数 下滑即可查看博客内容 🌈 欢迎莅临我的个人主页 👈这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地!🎇 🎓 博主简介:985高校的普通本硕&#…

从JavaScript入门Go三

前情提要 上一章中我们讲了Go中的变量与函数,这一节我们说说Go中的逻辑语法for、if、switch。最近正好有空,正好给大家更新一下入门的第三章。 PS:没看过的第一章、第二章的小伙伴,可以进入下面的链接查看 从JavaScript入门Go一 从…

新手c语言讲解及题目分享(十)——数组专项练习

C语言中的数组是一个用于存储多个同类型数据的集合。数组在内存中是连续分配的,可以通过索引访问其中的元素。以下是对C语言数组的详细讲解: 1. 数组的定义 数组的定义格式如下: type arrayName[arraySize]; - type:数组中元素…

1Panel 服务器运维面板

文章目录 相关介绍下载安装 1Panel启动 1Panel安装中间件 相关介绍 1Panel是一款现代化、开源的Linux服务器运维管理面板,它采用最新的前端技术和容器技术,使得服务器的运维管理更加简单、更安全,通过Web端轻松管理Linux服务器,包…

Golang | Leetcode Golang题解之第391题完美矩形

题目: 题解: func isRectangleCover(rectangles [][]int) bool {type point struct{ x, y int }area, minX, minY, maxX, maxY : 0, rectangles[0][0], rectangles[0][1], rectangles[0][2], rectangles[0][3]cnt : map[point]int{}for _, rect : range…

C语言 | Leetcode C语言题解之第391题完美矩形

题目&#xff1a; 题解&#xff1a; bool isSubsequence(char* s, char* t) {int mstrlen(s); int nstrlen(t);int k0; int j0;if(mn&&m0) return true;for(int i0;i<n;i){if(s[j]t[i]){j;}if(jm) return true;}return false; }

Delphi入门

Delphi入门 一、初识1.单元文件1.1 interface部分1.2 implementation部分1.3 initialization部分1.4 finalization部分 二、基本数据类型1.定义一个变量1.1 变量的声明1.2 变量的赋值1.3 变量的定义 2.定义一个常量3.定义一个枚举类型4.定义一个子界5.定义一个集合5.1 集合的赋…

基于Bert-base-chinese训练多分类文本模型(代码详解)

目录 一、简介 二、模型训练 三、模型推理 一、简介 BERT&#xff08;Bidirectional Encoder Representations from Transformers&#xff09;是基于深度学习在自然语言处理&#xff08;NLP&#xff09;领域近几年出现的、影响深远的创新模型之一。在BERT之前&#xff0c;已…

中国各地级市的海拔标准差

海拔标准差是衡量地理测量准确性的重要指标&#xff0c;它通过计算特定地点的海拔测量值与平均海拔之间的偏差来评估数据的可靠性。较小的标准差意味着测量结果较为一致&#xff0c;而较大的标准差则可能指出数据的波动性或测量误差。 计算方法 海拔标准差的计算遵循以下公式…

科研绘图系列:python语言制标准差的直方图(STD histogram plot)

介绍 密度分布图是一种统计图表,用于表示数据的分布情况。它通常用于展示变量的频率分布,但与直方图不同,密度分布图通过平滑曲线来表示数据的分布,而不是用柱状图来表示。这种图表可以更直观地展示数据的分布形状,如是否对称、是否多峰等。 在密度分布图中,横轴代表数…

如何录制黑神话悟空的游戏BGM导入iPhone手机制作铃声?

在游戏的世界里&#xff0c;总有那么一些旋律&#xff0c;能够触动玩家的心弦&#xff0c;让人难以忘怀。《黑神话悟空》以其精美的画面和动人的背景音乐&#xff0c;赢得了无数玩家的喜爱。如果你也想将游戏中的背景音录制下来&#xff0c;制作成个性化的m4r格式铃声&#xff…

【Go - 每日一小问 ,const 变量存储在哪里,堆还是栈上?】

答&#xff1a;都不是 &#xff0c; 在bss(未初始化数据区) 和 data(初始化数据区)上。 在内存布局上遵循一定规律&#xff0c;Go 进程的内存空间布局由高地址到低地址大致可分为以下几段: 栈(stack): 用户态的栈&#xff0c;栈的大小是固定的&#xff0c;其大小可以使用ulimi…

轿厢电梯-电动车检测数据集(真实电梯监控)

轿厢电动车检测数据集&#xff0c; 可做电梯乘客、电动车检测任务。 数据集由真实电梯监控图片&#xff08;大约四千&#xff09;、电动车网图、手机拍摄图片构成&#xff0c;总计14000张左右&#xff0c;其中近8000样本已标注。 注&#xff1a;文件夹后面数字为对应数据集样本…

【C++题解】1241 - 角谷猜想

问题二&#xff1a;1241 - 角谷猜想 类型&#xff1a;有规律的循环、递归。 题目描述&#xff1a; 日本一位中学生发现一个奇妙的定理&#xff0c;请角谷教授证明&#xff0c;而教授无能为力&#xff0c;于是产生了角谷猜想。 猜想的内容&#xff1a;任给一个自然数&#xff…

2024表白墙PHP网站源码

2024表白墙PHP网站源码 正常安装 访问域名即可直接进入安装程序 更新安装 请先备份数据库以及updata文件目录 以防出现意外 以及复制后台“基本配置内容” 然后覆盖目录 访问域名再次进入安装程序 在数据库安装完成后不要进行下一步并删除install文件目录 再将“基本配置内容”…

橘子学ES实战操作之管道类型Ingest pipelines的基本使用

简介 我们在使用ES的时候&#xff0c;经常的用法就是把其他数据源比如Mysql的数据灌到ES中。 借用ES的一些功能来提供数据的全文检索以及聚合分析之类的功能。 在这个灌数据的过程中&#xff0c;我们经常会对数据做一些治理&#xff0c;类似ETL的能力。然后把治理后的数据写入…

List 的介绍

目录 1. 什么是List 2. 常见接口介绍 3. List的使用 1. 什么是List 在集合框架中&#xff0c; List 是一个接口&#xff0c;继承自 Collection 。 Collection 也是一个接口 &#xff0c;该接口中规范了后序容器中常用的一些方法&#xff0c;具体如下所示&#xff1a; Iterab…

前端学习笔记-Web APIs篇-02

事件监听(绑定&#xff09; 什么是事件&#xff1f; 事件是在编程时系统内发生的动作或者发生的事情【比如用户在网页上单击一个按钮 】 什么是事件监听&#xff1f; 就是让程序检测是否有事件产生&#xff0c;一旦有事件触发&#xff0c;就立即调用一个函数做出响应&#…

3DMAX建筑魔术师MagicBuilding插件使用方法详解

3DMAX建筑魔术师MagicBuilding&#xff0c;一键创建单个或多个随机楼体&#xff0c;可以用来生成建筑场景中的配景楼&#xff0c;让你快速从繁重的体力劳动中解脱出来&#xff01; 【建议版本】 3dMax2018及以上版本&#xff08;不仅限于此范围&#xff09; *以上只是建议版本…

CRM系统为贷款中介行业插上科技的翅膀

CRM&#xff08;客户关系管理&#xff09;系统为贷款中介公司插上了科技的翅膀&#xff0c;极大提升了贷款中介企业的运营效率、客户管理能力和市场竞争力。鑫鹿贷款CRM系统基于互联网、大数据分析、人工智能、云计算等前沿技术&#xff0c;帮助贷款中介公司实现业务流程的自动…