前景物体提取

news2024/12/22 2:44:05

参考:精选课:C++完整的实现双目摄像头图像采集、双目摄像头畸变矫正、前景物体提取、生成视差图、深度图、PCL点云图

前景物体提取是计算机视觉中的一个重要技术,可以用于视频监控、虚拟现实和计算机视觉等领域。

1.前景物体提取的原理

前景物体提取是将摄像机拍摄到的图像中的前景物体(如移动的人、车辆等)从背景中分离出来的过程。其原理是利用帧间差分和背景建模两个步骤。帧间差分是通过相邻帧之间像素点灰度值的差异来检测出运动目标,背景建模是通过不断更新背景图像来适应场景的变化。

2.实现步骤

步骤1:读取摄像机视频并初始化,使用OpenCV库来读取摄像机视频:

cv::VideoCapture cap(0);
if (!cap.isOpened()) {
   std::cout << "Cannot open camera" << std::endl;
   return -1;
}

cv::Mat frame;
cap.read(frame);

步骤2:背景建模,定义一个背景图像和一个学习率,初始值为0.01。在每一帧中,将当前帧与背景图像相减,得到一个差分图像。

cv::Mat background;
double learning_rate = 0.01;

// 第一帧作为背景图像
background = frame.clone();

// 对于后面的帧,逐像素地计算背景图像
while (true) {

    cap.read(frame);

    // 将当前帧与背景图像相减,得到一个差分图像
    cv::Mat diff;
    cv::absdiff(frame, background, diff);

    // 根据差分图像更新背景图像
    for (int i = 0; i < diff.rows; i++) {
        for (int j = 0; j < diff.cols; j++) {
            cv::Vec3b pixel = diff.at<cv::Vec3b>(i, j);
            if (pixel[0] > 50 || pixel[1] > 50 || pixel[2] > 50) {
                // 更新背景像素
                cv::Vec3b background_pixel = background.at<cv::Vec3b>(i, j);
                cv::Vec3b frame_pixel = frame.at<cv::Vec3b>(i, j);
                background_pixel[0] = (1 - learning_rate) * background_pixel[0] + learning_rate * frame_pixel[0];
                background_pixel[1] = (1 - learning_rate) * background_pixel[1] + learning_rate * frame_pixel[1];
                background_pixel[2] = (1 - learning_rate) * background_pixel[2] + learning_rate * frame_pixel[2];
                background.at<cv::Vec3b>(i, j) = background_pixel;
            }
        }
    }
}

步骤3:帧间差分,将当前帧与背景图像相减,得到差分图像。然后将差分图像进行二值化处理,得到前景物体掩模。

// 帧间差分
cv::Mat diff;
cv::absdiff(frame, background, diff);

// 二值化处理,得到前景掩模
cv::Mat foreground_mask;
cv::threshold(diff, foreground_mask, 50, 255, cv::THRESH_BINARY);

步骤4:过滤掉小的前景物体,使用形态学操作对前景掩模进行处理,去除噪声和小物体。

// 使用开运算去除噪声和小物体
cv::Mat kernel = cv::getStructuringElement(cv::MORPH_ELLIPSE, cv::Size(5, 5));
cv::Mat foreground_mask_filtered;
cv::morphologyEx(foreground_mask, foreground_mask_filtered, cv::MORPH_OPEN, kernel);

步骤5:显示结果,将原始图像和前景掩模相乘,得到只有前景物体的图像。

// 显示结果
cv::Mat result = frame.clone();
cv::Mat foreground_image = cv::Mat::zeros(frame.size(), frame.type());
frame.copyTo(foreground_image, foreground_mask_filtered);

cv::imshow("Original Image", frame);
cv::imshow("Foreground Mask", foreground_mask_filtered);
cv::imshow("Foreground Image", foreground_image);

cv::waitKey(30);

3.完整代码

演示了对单个摄像头的前景物体提取,双目摄像机需要对两个摄像头的同一幅图片场景分别做前景物体提取,然后作为左右视图对其进行进一步畸变矫正。

#include <iostream>
#include <opencv2/opencv.hpp>

int main() {
    // 打开摄像机
    cv::VideoCapture cap(0);
    if (!cap.isOpened()) {
        std::cout << "Cannot open camera" << std::endl;
        return -1;
    }

    // 初始化
    cv::Mat frame;
    cap.read(frame);

    // 背景建模
    cv::Mat background;
    double learning_rate = 0.01;
    background = frame.clone();
    while (true) {
        // 读取帧
        cap.read(frame);

        // 背景建模
        cv::Mat diff;
        cv::absdiff(frame, background, diff);

        for (int i = 0; i < diff.rows; i++) {
            for (int j = 0; j < diff.cols; j++) {
                cv::Vec3b pixel = diff.at<cv::Vec3b>(i, j);
                if (pixel[0] > 50 || pixel[1] > 50 || pixel[2] > 50) {
                    cv::Vec3b background_pixel = background.at<cv::Vec3b>(i, j);
                    cv::Vec3b frame_pixel = frame.at<cv::Vec3b>(i, j);
                    background_pixel[0] = (1 - learning_rate) * background_pixel[0] + learning_rate * frame_pixel[0];
                    background_pixel[1] = (1 - learning_rate) * background_pixel[1] + learning_rate * frame_pixel[1];
                    background_pixel[2] = (1 - learning_rate) * background_pixel[2] + learning_rate * frame_pixel[2];
                    background.at<cv::Vec3b>(i, j) = background_pixel;
                }
            }
        }

        // 帧间差分
        cv::Mat diff2;
        cv::absdiff(frame, background, diff2);
        cv::Mat foreground_mask;
        cv::threshold(diff2, foreground_mask, 50, 255, cv::THRESH_BINARY);

        // 去除噪声和小物体
        cv::Mat kernel = cv::getStructuringElement(cv::MORPH_ELLIPSE, cv::Size(5, 5));
        cv::Mat foreground_mask_filtered;
        cv::morphologyEx(foreground_mask, foreground_mask_filtered, cv::MORPH_OPEN, kernel);

        // 显示结果
        cv::Mat result = frame.clone();
        cv::Mat foreground_image = cv::Mat::zeros(frame.size(), frame.type());
        frame.copyTo(foreground_image, foreground_mask_filtered);

        cv::imshow("Original Image", frame);
        cv::imshow("Foreground Mask", foreground_mask_filtered);
        cv::imshow("Foreground Image", foreground_image);

        cv::waitKey(30);
    }

    // 释放资源
    cap.release();
    cv::destroyAllWindows();

    return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2263543.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

汽车供应链 “剧变”开始,“智能感知潜在龙头”诞生

智能汽车产业链“剧变”已经开启&#xff0c;智能感知软硬件能力的权重正在不断被放大。 比如满足高阶泊车的第二代AK2超声波传感器、满足人机共驾场景需求的电子外后视镜&#xff08;CMS&#xff09;、iTOF 3D成像视觉感知&#xff08;用于舱内监控&#xff09;等新产品&…

Python+OpenCV系列:AI看图识人、识车、识万物

在人工智能风靡全球的今天&#xff0c;用 Python 和 OpenCV 结合机器学习实现物体识别&#xff0c;不仅是酷炫技能&#xff0c;更是掌握未来的敲门砖。本篇博文手把手教你如何通过摄像头或图片输入&#xff0c;识别人、动物、车辆及其他物品&#xff0c;让你的程序瞬间具备 AI …

JVM 详解

一. JVM 内存区域的划分 1. 程序计数器 程序计数器是JVM中一块比较小的空间, 它保存下一条要执行的指令的地址. [注]: 与CPU的程序计数器不同, 这里的下一条指令不是二进制的机器语言, 而是Java字节码. 2. 栈 保存方法中的局部变量, 方法的形参, 方法之间的调用关系. 栈又…

C# opencvsharp 流程化-脚本化-(2)ROI

ROI ROI也是经常需要使用的方法。特别是在图像编辑中。ROI又称感兴趣的区域&#xff0c;但是图像是矩阵是矩形的&#xff0c;感兴趣的是乱八七糟的&#xff0c;所以还有一个Mask需要了解一下的。 public class RoiStep : IImageProcessingStep{public ImageProcessingStepType…

wazuh-modules-sca-scan

sca模块主函数wm_sca_main -> wm_sca_start 检查policy文件中的每一个项目wm_sca_check_policy static int wm_sca_check_policy(const cJSON * const policy, const cJSON * const checks, OSHash *global_check_list) {if(!policy) {return 1;}const cJSON * const id c…

uniapp 自定义图标03

插入工程&#xff0c;修改名称文件内容 编译运行

在Windows本地用网页查看编辑服务器上的 jupyter notebook

​ Motivation: jupyter notebook 可以存中间变量&#xff0c;方便我调整代码&#xff0c;但是怎么用服务器的GPU并在网页上查看编辑呢&#xff1f; 参考 https://zhuanlan.zhihu.com/p/440080687 服务端(Ubuntu)&#xff1a; 激活环境 source activate my_env安装notebook …

【YOLO 项目实战】(11)YOLO8 数据集与模型训练

欢迎关注『youcans动手学模型』系列 本专栏内容和资源同步到 GitHub/youcans 【YOLO 项目实战】&#xff08;1&#xff09;YOLO5 环境配置与检测 【YOLO 项目实战】&#xff08;10&#xff09;YOLO8 环境配置与推理检测 【YOLO 项目实战】&#xff08;11&#xff09;YOLO8 数据…

Ubuntu22.04上安装esp-idf

一、安装准备# 建议使用Ubuntu 20.04 或 Ubuntu 22.04 操作系统 为了在 Ubuntu 22.04 中使用 esp-idf&#xff0c;需要安装一些依赖包 sudo apt-get install git wget flex bison gperf python3\python3-pip python3-venv cmake ninja-build ccache\libffi-dev libssl-dev dfu…

nginx-虚拟主机配置笔记

目录 nginx的安装可以查看nginx安装https://blog.csdn.net/m0_68472908/article/details/144609023?spm1001.2014.3001.5501 一、 基于域名 二、 基于IP 三、 基于端口 nginx的安装可以查看nginx安装https://blog.csdn.net/m0_68472908/article/details/144609023?spm100…

AlipayHK支付宝HK接入-商户收款(PHP)

一打开支付宝国际版 二、点开商户服务 三、下载源码

Soul Android端稳定性背后的那些事

前言&#xff1a;移动应用的稳定性对于用户体验和产品商业价值都有着至关重要的作用。应用崩溃会导致关键业务中断、用户留存率下降、品牌口碑变差、生命周期价值下降等影响&#xff0c;甚至会导致用户流失。因此&#xff0c;稳定性是APP质量构建体系中最基本和最关键的一环。当…

深度学习模型 DeepSeek-VL2 及其消费级显卡需求分析

DeepSeek-VL2 是由 DeepSeek 团队开发的一款先进的视觉语言模型&#xff0c;采用了混合专家&#xff08;MoE&#xff09;架构&#xff0c;旨在提升多模态理解能力。该模型包括三个版本&#xff1a;DeepSeek-VL2-Tiny、DeepSeek-VL2-Small 和 DeepSeek-VL2。每个版本具有不同的模…

首批|云轴科技ZStack成为开放智算产业联盟首批会员单位

近日 &#xff0c;在Linux基金会AI & Data及中国开源软件推进联盟的指导之下&#xff0c;开放智算产业联盟成立大会在北京成功召开。在大会上&#xff0c;联盟首次公布了组织架构并颁发了首批会员单位证书。凭借ZStack AIOS平台智塔和在智算领域的技术创新&#xff0c;云轴…

word实现两栏格式公式居中,编号右对齐

1、确定分栏的宽度 选定一段文字 点击分栏&#xff1a;如本文的宽度为22.08字符 2、将公式设置为 两端对齐&#xff0c;首行无缩进。 将光标放在 公式前面 点击 格式-->段落-->制表位 在“制表位位置”输入-->11.04字符&#xff08;22.08/211.04字符&#xff09;&…

go语言zero框架中config读取不到.env文件问题排查与解决方案

在Go语言中&#xff0c;如果你使用.env文件来存储环境变量&#xff0c;通常会用到一些第三方库&#xff0c;例如github.com/joho/godotenv&#xff0c;它可以帮助我们从.env文件中读取环境变量。然而&#xff0c;在使用godotenv时&#xff0c;可能会遇到一些问题&#xff0c;导…

修改vscode设置的原理

转载请标明出处&#xff1a;小帆的帆的专栏 修改vscode设置 首先需要理解的是&#xff0c;vscode的系统设置和插件设置都是通过settings.json文件管理的。 vscode中有三个Settings&#xff0c;三个Settings分别对应三个settings.json文件 Default Settings&#xff1a;默认…

Qt之修改窗口标题、图标以及自定义标题栏(九)

Qt开发 系列文章 - titles-icons-titlebars&#xff08;九&#xff09; 目录 前言 一、修改标题 二、添加图标 三、更换标题栏 1.效果演示 2.创建标题栏类 3.定义相关函数 4.使用标题栏类 总结 前言 在我们利用Qt设计软件时&#xff0c;经常需要修改窗口标题、更改软…

环境变量的知识

目录 1. 环境变量的概念 2. 命令行参数 2.1 2.2 创建 code.c 文件 2.3 对比 ./code 执行和直接 code 执行 2.4 怎么可以不带 ./ 2.4.1 把我们的二进制文件拷贝到 usr/bin 路径下&#xff0c;也不用带 ./ 了 2.4.2 把我们自己的路径添加到环境变量里 3. 认识PATH 3.…

【时时三省】(C语言基础)通讯录1

山不在高&#xff0c;有仙则名。水不在深&#xff0c;有龙则灵。 ----CSDN 时时三省 通讯录 1 .通讯录中能够存放1000个人的信息 每个人的信息&#xff1a; 名字年龄性别电话地址 2、增加人的信息 3、删除指定人的信息 4、修改指定人的信息 5&#xff0c;查找指定人的信…