python数字图像处理基础(十)——背景建模

news2024/9/28 23:34:58

目录

    • 背景建模
      • 背景消除-帧差法
      • 混合高斯模型

背景建模

背景建模是计算机视觉和图像处理中的一项关键技术,用于提取视频中的前景对象。在视频监控、运动检测和行为分析等领域中,背景建模被广泛应用。其基本思想是通过对视频序列中的像素进行建模,找到视频中的静态背景,并将不同的像素标记为背景和前景,从而使后续的对象检测和跟踪更为可靠。

前景-感兴趣的、运动的;背景-不变

背景消除-帧差法

由于场景中的目标在运动,目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧图像进行差分运算,不同帧对应的像素点相减,判断灰度差的绝对值,当绝对值超过一定阈值时,即可判断为运动目标,从而实现目标的检测功能。

在这里插入图片描述
帧差法简单,但会引入噪音,还有空洞问题(前景只有白色轮廓,内部还是黑的)

混合高斯模型

混合高斯模型(Gaussian Mixture Model,简称GMM)是背景建模的一种常用方法。GMM模型假设一个像素的灰度值是由多个高斯分布混合而成的,这些高斯分布代表了不同的场景。对于每个像素,模型会使用多个高斯分布来表示其灰度值的分布,其中每个高斯分布具有特定的均值和方差。

在进行前景检测前,先对背景进行训练,对图像中每个背景采用一个混合高斯模型进行模拟,每个背景的混合高斯的个数可以自适应。然后再测试阶段,对新来的像素进行GMM匹配,如果该像素值能够匹配其中一个高斯,则认为时背景。由于整个过程GMM模型在不断更新学习中,所以对动态背景有一定的鲁棒性。最后通过对一个有树枝摇摆的动态背景进行前景检测,取得了较好的效果。

ps:鲁棒性:在计算机科学中,健壮性(英语:Robustness)是指一个计算机系统在执行过程中处理错误,以及算法在遭遇输入、运算等异常时继续正常运行的能力。 诸如模糊测试之类的形式化方法中,必须通过制造错误的或不可预期的输入来验证程序的健壮性。很多商业产品都可用来测试软件系统的健壮性。健壮性也是失效评定分析中的一个方面。

GMM背景建模的基本步骤如下:

  1. 初始化: 对于每个像素,初始化一个包含多个高斯分布的GMM模型。
  2. 更新: 在每一帧中,对于每个像素,根据当前帧的像素值,更新GMM的参数(均值、方差、权重等)。
  3. 分类: 对于每个像素,根据当前帧的像素值和GMM模型,判断该像素是属于背景还是前景。
  4. 学习: 对于被判断为背景的像素,根据学习率(learning rate)更新GMM的参数,以适应场景的变化。
  5. 提取前景: 将被分类为前景的像素提取出来,用于后续的对象检测和跟踪。

混合高斯模型的主要优势在于能够适应场景的变化,对光照变化和动态背景具有一定的鲁棒性。然而,在处理复杂场景和大规模运动时,可能需要更复杂的背景建模技术。

  • 在视频中对于像素点的变化情况应当是符合高斯分布
    在这里插入图片描述

  • 背景的实际分布应当时多个高斯分布混合在一起,每个高斯模型也可以带有权重
    在这里插入图片描述

混合高斯模型学习方法

1.首先初始化每个高斯模型矩阵参数。
2.取视频中T帧数据图像用来训练高斯混合模型。来了第一个像素之后用它来当做第一个高斯分布。
3.当后面来的像素值时,与前面已有的高斯的均值比较,如果该像素点的值与其模型均值差在3倍的方差内,则属于该分布,并对其进行参数更新。
4.如果下一次来的像素不满足当前高斯分布,用它来创建一个新的高斯分布。一般为3-5个

混合高斯模型测试方法

在测试阶段,对新来像素点的值与混合高斯模型中的每一个均值进行比较,如果其差值在2倍的方差之间的话,则认为是背景,否则认为是前景。将前景赋值为255,背景赋值为0。这样就形成了一副前景二值图。

下面是一个使用OpenCV中的背景建模函数cv2.bgsegm.createBackgroundSubtractorMOG()创建混合高斯模型的简单示例:

import cv2
import numpy as np

# 读取视频
cap = cv2.VideoCapture('your_video.mp4')

# 创建混合高斯模型
bg_subtractor = cv2.bgsegm.createBackgroundSubtractorMOG()

while True:
    ret, frame = cap.read()
    if not ret:
        break

    # 应用背景建模器
    fg_mask = bg_subtractor.apply(frame)

    # 可选:对二值图像进行一些后处理,如膨胀和腐蚀
    kernel = np.ones((5, 5), np.uint8)
    fg_mask = cv2.morphologyEx(fg_mask, cv2.MORPH_CLOSE, kernel)

    # 显示原始帧和背景建模结果
    cv2.imshow('Original Frame', frame)
    cv2.imshow('Foreground Mask', fg_mask)

    if cv2.waitKey(30) & 0xFF == 27:  # 按ESC键退出
        break

cap.release()
cv2.destroyAllWindows()

在这个示例中,cv2.bgsegm.createBackgroundSubtractorMOG()函数创建了一个默认配置的混合高斯模型。可以通过调整参数来适应不同的场景。

此外,OpenCV中还提供了其他一些背景建模函数,如cv2.createBackgroundSubtractorKNN()等,它们也可以用于不同的场景和需求。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1396362.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【信号与系统】【北京航空航天大学】实验四、幅频、相频响应和傅里叶变换

一、实验目的 1、 掌握利用MATLAB计算系统幅频、相频响应的方法; 2、 掌握使用MATLAB进行傅里叶变换的方法; 3、 掌握使用MATLAB验证傅里叶变换的性质的方法。 二、实验内容 1、 MATLAB代码: >> clear all; >> a [1 3 2]; …

干掉xshell, 这款远程终端工具:开源、免费、跨平台,同时支持SSH+SFTP+Telent+TCP+Serial,太香了。

干掉xshell说say you, 这款远程终端工具:开源、免费、跨平台,同时支持SSHSFTPTelentTCPSerial,太香了。 大家好! 我是老码农。 今天分享一款:远程终端连接工具:WindTerm。 如标题所述,值得拥…

按空格键改变text显示的内容并打印输出

注意!如果焦点不在text则无法生效。 整型竟然能和字符串直接相加,立天! import QtQuickWindow {width: 640height: 480visible: truetitle: qsTr("2.2 属性")Rectangle {Text {id: thislabelfont.pixelSize: 30font.family: "…

Elastic Stack(1):Elastic Stack简介

1 简介 ELK是一个免费开源的日志分析架构技术栈总称,官网https://www.elastic.co/cn。包含三大基础组件,分别是Elasticsearch、Logstash、Kibana。但实际上ELK不仅仅适用于日志分析,它还可以支持其它任何数据搜索、分析和收集的场景&#xf…

线程基础知识点

1. 线程和进程的区别? 程序由指令和数据组成,但这些指令要运行,数据要读写,就必须将指令加载至 CPU,数据加载至内存。在指令运行过程中还需要用到磁盘、网络等设备。进程就是用来加载指令、管理内存、管理 IO 的。 当…

自动驾驶概述

自动驾驶技术主要解决的问题 无人驾驶分级 L1:巡航定速(ACC),巡航装置可以纵向控制车辆,可以加速减速 L2:车道保持辅助,系统可以纵向控制也可以横向控制汽车,但车是辅助,人才是主导。 L2.5:可以提供简单路况下的变道能力,比如特斯拉。 L3:L2的基础上提供变道能力,…

[C语言]编译和链接

一、翻译和运行 在ANSI C的任何⼀种实现中,存在两个不同的环境。 1)翻译环境:将源代码被转换为可执行的机器指令 2)执行环境:实际执行代码。 1.翻译环境 首先我们来将翻译环境 翻译环境是由 编译 和 链接 两个大的过程…

龙哥的问题(积性函数,莫比乌斯反演)

题目路径: 221. 龙哥的问题 - AcWing题库 思路:

5G消息一站式解决方案,实现全新“跳代”应用体验

随着5G技术的普及和深化,通信行业迎来发展的“红利期”。5G消息作为基础短信业务的升级,可通过手机一键开启。不仅支持在原生短信界面发送多种内容,如:语音、视频、图片、地理位置等。还可通过chatbot功能模拟人类智能对话&#x…

2017年认证杯SPSSPRO杯数学建模A题(第一阶段)安全的后视镜全过程文档及程序

2017年认证杯SPSSPRO杯数学建模 A题 安全的后视镜 原题再现: 汽车后视镜的视野对行车安全非常重要。一般来说,汽车的后视镜需要有良好的视野范围,以便驾驶员能够全面地了解车后方的道路情况。同时,后视镜也要使图像的畸变尽可能…

Zoho Survey评价:功能全面,值得一试

通常来讲,我们在使用一款问卷调查制作工具制作问卷时会有哪些需求呢? 用户需求 1、操作简单,易上手。 2、能够满足用户个性化的需求。 3、提供多语言服务。 4、能够帮助发布以及数据收集。 5、简化数据分析 市面上的问卷调查制作工具都…

【法如faro】法如三维激光扫描软件Scene2023下载与安装教程

FARO SCENE 2023是法如中国官方开发的一款相套配的三维数字化存档软件,该软件专门设计用于所有的Focus和第三方激光扫描仪,通过使用实时现场配准、自动对象识别、扫描图像配准和定位功能,能够帮助用户轻松而高效地处理和管理扫描后的数据。 文…

HTTPS协议把什么加密了?

HTTPS(Hypertext Transfer Protocol Secure)是一种用于在计算机网络上进行安全通信的协议。它的工作原理主要基于以下几个关键步骤: 1. 握手阶段(Handshake): - 客户端向服务器发送一个请求&#xff0c…

349. 两个数组的交集(力扣)(OJ题)

题目链接:349. 两个数组的交集 - 力扣(LeetCode) 个人博客主页:https://blog.csdn.net/2301_79293429?typeblog 专栏:https://blog.csdn.net/2301_79293429/category_12545690.html 给定两个数组 nums1 和 nums2 &a…

十一、常用API——正则表达式

目录 练习1: 正则表达式的作用 正则表达式 字符类(只匹配一个字符) 预定义字符(只匹配一个字符) 数量词 类 Pattern 正则表达式的构造摘要 反斜线、转义和引用 字符类 行结束符 组和捕获 Unicode 支持 与…

Spring Boot整合MyBatis-Plus

引言 在现代软件开发中,我们经常需要处理大量的数据。为了有效地管理这些数据,我们需要使用一些强大的框架。其中,Spring Boot和MyBatis-Plus是两个非常流行的框架。Spring Boot是一个基于Spring的开源Java框架,可以用于创建独立…

Java:选择哪个Java IDE好?

Java:选择哪个Java IDE好? 在开始前我有一些资料,是我根据网友给的问题精心整理了一份「java的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!&…

动手搓一个kubernetes管理平台(3)-后端框架

后端框架的选择面比较大,由于不涉及复杂的调度/分布式管理等场景,所以后端选用一个标准的web server即可,比如gin, iris, beego等等,因为正好最近在看iris的一些项目,所以就选用了irsicorba的框架进行后端开发 。 通过…

Kafka-消费者-KafkaConsumer分析-PartitionAssignor

Leader消费者在收到JoinGroupResponse后,会按照其中指定的分区分配策略进行分区分配,每个分区分配策略就是一个PartitionAssignor接口的实现。图是PartitionAssignor的继承结构及其中的组件。 PartitionAssignor接口中定义了Assignment和Subscription两个…

KubeSphere 社区双周报 | 2024.01.04-01.18

KubeSphere 社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过 commit 的贡献者,并对近期重要的 PR 进行解析,同时还包含了线上/线下活动和布道推广等一系列社区动态。 本次双周报涵盖时间为:2024.01.04-01.18…