opencv 视频处理

news2025/2/27 13:11:29

概述

        OpenCV 的视频模块是其核心组成部分之一,主要负责视频文件的读取、处理、分析以及视频流的捕获和输出。这一模块使得开发者能够轻松地处理来自摄像头、文件或其他视频源的视频数据,进行实时或离线的图像处理和计算机视觉任务。以下是 OpenCV 视频模块的一些关键组件和功能简介:

1. cv::VideoCapture 类

  • 功能:用于从摄像头或视频文件中捕获视频帧。通过传递设备索引或视频文件路径给构造函数,可以创建一个 VideoCapture 对象。之后,可以通过 read() 方法逐帧读取视频。
  • 属性获取:可以获取视频的帧率 (CAP_PROP_FPS)、帧大小 (CAP_PROP_FRAME_WIDTHCAP_PROP_FRAME_HEIGHT) 等属性。
  • 视频来源:支持多种视频源,包括本地文件(如 .mp4.avi 等)和网络摄像头。

2. cv::VideoWriter 类

  • 功能:用于将处理后的视频帧写入视频文件。可以指定输出文件名、编码器、帧率和帧大小。
  • 编码器选择:通过 fourcc 参数指定编码器(例如,cv::VideoWriter::fourcc('M','J','P','G') 对应于 MJPG 编码)。
  • 视频输出:支持多种视频格式,但实际可用的编码器和格式依赖于系统安装的 FFmpeg 或其他后端库。

3. 实时视频处理

  • 帧处理:读取的每一帧都可以通过 OpenCV 提供的各种图像处理函数进行处理,如色彩空间转换、滤波、边缘检测、特征提取等。
  • 实时应用:结合高效的算法,可以实现实时的视频监控、人脸识别、物体追踪等应用。

4. 视频分析

  • 运动检测:基于帧差法、背景减除等技术,可以识别视频中的运动区域。
  • 目标跟踪:实现对特定目标的连续帧间跟踪,如卡尔曼滤波器、光流法、深度学习跟踪器等。
  • 场景解析:进行场景分割、行为识别等高级视频理解任务。

5. 后端支持与兼容性

  • FFmpeg集成:OpenCV 可以利用 FFmpeg 库来支持更广泛的视频格式和编解码器,提升兼容性和性能。
  • 跨平台:OpenCV 的视频模块设计为跨平台,支持 Windows、Linux、macOS 等操作系统,但具体功能和性能可能会因操作系统和后端库的差异而有所不同。

6. 性能优化

  • 多线程和硬件加速:虽然 OpenCV 自身不直接提供多线程视频处理功能,但开发者可以通过多线程技术并结合硬件加速(如利用 CUDA、OpenCL 或 FFmpeg 的 GPU 解码)来提升视频处理的效率。

实现原理

         接口上opencv支持cv::VideoCapture、cv::VideoWriter两个接口来处理视频,后端则支持多种框架,一般默认使用的ffmpeg作为后端处理。

通过cmake-gui 查看参数配置

生成的信息查看ffmpeg信息

你也可以通过代码查看后端类型

cv::VideoCapture cap(videoFileName);
std::cout << "BackendName" << cap.getBackendName() << std::endl;

使用示例

打开默认摄像头

//declare a capture object
cv::VideoCapture cap(0, cv::CAP_MSMF);
//or specify the apiPreference with open
cap.open(0, cv::CAP_MSMF);

打开视频文件

//declare a capture object
cv::VideoCapture cap(filename, cv::CAP_MSMF);
//or specify the apiPreference with open
cap.open(filename, cv::CAP_MSMF);

处理视频流

    cv::VideoCapture cap(videoFileName); // 替换为你的视频文件路径
    if (!cap.isOpened()) {
        std::cout << "无法打开视频文件" << std::endl;
        return ;
    }
    
    auto frameCount = cap.get(cv::CAP_PROP_FRAME_COUNT);
    while (true) {
        cv::Mat frame;
        if(!cap.read(frame))
        {
            break;
        }
        // do ......
        
    } 
    cap.release();

视频播放

#include <opencv2/opencv.hpp>
#include <iostream>

int main(int argc, char** argv)
{
    // 检查是否有视频文件作为参数传入
    if (argc != 2)
    {
        std::cout << "Usage: " << argv[0] << " <video_file_path>" << std::endl;
        return -1;
    }

    // 使用视频文件路径初始化VideoCapture对象
    cv::VideoCapture cap(argv[1]);
    if (!cap.isOpened())
    {
        std::cout << "Error opening video file" << std::endl;
        return -1;
    }

    // 获取视频的帧率
    double fps = cap.get(cv::CAP_PROP_FPS);
    if (fps <= 0)
    {
        fps = 30; // 如果无法获取帧率,默认设为30
    }

    // 创建一个窗口用于显示视频
    cv::namedWindow("Video Player", cv::WINDOW_NORMAL);

    cv::Mat frame;
    while (true)
    {
        // 读取下一帧
        if (!cap.read(frame))
        {
            // 如果没有更多帧,跳出循环
            break;
        }

        // 显示当前帧
        cv::imshow("Video Player", frame);

        // 按任意键退出,或者根据fps控制播放速度
        if (cv::waitKey(1000 / fps) >= 0)
        {
            break;
        }
    }

    // 释放资源并关闭窗口
    cap.release();
    cv::destroyAllWindows();

    return 0;
}

对ffmpeg进行特殊处理

        可以设置环境变量OPENCV_FFMPEG_WRITER_OPTIONS、OPENCV_FFMPEG_CAPTURE_OPTIONS传递附加参数。

参数格式:key;value|key;value|key;valuehwaccel;cuvid|video_codec;h264_cuvid|vsync;0vcodec;x264|vprofile;high|vlevel;4.0

OPENCV_FFMPEG_WRITER_OPTIONS 是一个环境变量,用于传递给 OpenCV 的 FFmpeg 视频写入器(VideoWriter)的特定选项。这些选项可以影响视频编码、质量、格式等。该环境变量的值是一个字符串,通常以分号(;)分隔不同的选项键值对。

每个键值对的格式通常是 key;value,其中 key 是选项的名称,value 是对应的值。例如:

  • video_codec;h264:指定视频编码器为 H.264。
  • audio_codec;aac:指定音频编码器为 AAC。
  • bit_rate;1000000:设置比特率为 1000000 bps。
  • preset;slow:设置编码预设,如 slowmedium 或 fast,这会影响编码速度和质量。
  • crf;23:设置恒定速率因子(Constant Rate Factor),影响视频质量。

请注意,不是所有的 FFmpeg 选项都适用于 OPENCV_FFMPEG_WRITER_OPTIONS,因为 OpenCV 的 VideoWriter 类可能只支持 FFmpeg API 的一部分。此外,可用的选项可能因 OpenCV 版本和 FFmpeg 版本的不同而不同。在使用时,建议查阅 OpenCV 和 FFmpeg 的官方文档以获取最新和最准确的信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1841533.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

唯一工业操作系统!蓝卓supOS入榜中国500最具价值品牌

6月19日 在第21届世界品牌大会上 世界品牌实验室(World Brand Lab) 正式发布2024年《中国500最具价值品牌》分析报告 蓝卓supOS 以131.65亿元的品牌价值成为 国内首个入榜工业操作系统 国内首个工业操作系统的蜕变之旅 蓝卓supOS快速迭代指数增长 不断引领海内外多个首…

同时使用磁吸充电器和Lightning时,iPhone充电速度会变快吗?

在智能手机的世界里&#xff0c;续航能力一直是用户关注的焦点。苹果公司以其创新的MagSafe技术和传统的Lightning接口&#xff0c;为iPhone用户提供了多样化的充电解决方案。 然而&#xff0c;当这两种技术同时使用时&#xff0c;它们能否带来更快的充电速度&#xff1f;本文…

Day9—Spark运行模式及RDD的创建

Spark概述 大数据开发的总体架构 可以看到&#xff0c;在数据计算层&#xff0c;作为Hadoop核心组成的MapReduce可以结合Hive通过类SQL的方式进行数据的离线计算&#xff08;当然也可以编写独立的MapReduce应用程序进行计算&#xff09;&#xff1b;而Spark既可以做离线计算&a…

【Spring Cloud】Gateway 服务网关限流

文章目录 route限流导入依赖编写配置类测试 自定义API分组总结 网关是所有请求的公共入口&#xff0c;所以可以在网关进行限流&#xff0c;而且限流的方式也很多&#xff0c;我们本次采用前面学过的 Sentinel 组件来实现网关的限流。 Sentinel 支持对 SpringCloud Gateway、Zuu…

网络程序通信的流程---socket与TCP的简单认识

网络程序通信的流程 网络程序通信的流程&#xff1a; 1.通过ip地址找到网络中的设备 2.通过端口号找到对应进程的端口 3.传输数据时还需要使用传输协议&#xff08;TCP&#xff09;&#xff0c;保证数据的可靠性 4.socket完成进程之间网络数据的传输 ip地址的介绍 IP地址…

知识库的创建(5) - FaissKBService

文章目录 前言一、追踪代码二、源码分析三、详解kb_faiss_pool类的load_vector_store1. 方法定义2. 方法实现3. 优点4. 再看看self.new_vector_store 总结 前言 上一篇文章&#xff0c;我们追到了这里&#xff0c;了解了kb是通过KBServiceFactory产生的一个对象&#xff0c;而…

计算机网络-BGP路由优选原则八

一、优选到Next_Hop的IGP度量值最小的路由。 查看BGP路由详细信息&#xff1a; [AR1]dis bgp routing-table 192.168.1.0BGP local router ID : 1.1.1.1Local AS number : 100Paths: 2 available, 1 best, 1 selectBGP routing table entry information of 192.168.1.0/24:Fr…

ADOP带你了解:数据中心的高速互联解决方案

随着大语言模型和AIGC的飞速发展&#xff0c;数据中心对于高速、高可靠性的网络连接需求日益增长。ADOP系列产品正是在这样的背景下应运而生&#xff0c;为现代数据中心提供了全面的连接解决方案。 ADOP系列产品概览 ADOP系列产品旨在为云、高性能计算、Web 2.0、企业、电信、…

Python | Leetcode Python题解之第167题两数之和II-输入有序数组

题目&#xff1a; 题解&#xff1a; class Solution:def twoSum(self, numbers: List[int], target: int) -> List[int]:low, high 0, len(numbers) - 1while low < high:total numbers[low] numbers[high]if total target:return [low 1, high 1]elif total <…

吴恩达机器学习 第二课 week4 决策树

目录 01 学习目标 02 实现工具 03 问题描述 04 构建决策树 05 总结 01 学习目标 &#xff08;1&#xff09;理解“熵”、“交叉熵&#xff08;信息增益&#xff09;”的概念 &#xff08;2&#xff09;掌握决策树的构建步骤与要点 02 实现工具 &#xff08;1&#xff09;…

格式化数据恢复,4个方法,恢复文件好帮手

“由于电脑病毒的原因&#xff0c;我不得已将磁盘格式化了&#xff0c;不知道大家有没有方法恢复格式化的数据呢&#xff1f;” 在数字时代的浪潮中&#xff0c;我们每个人的生活都如同被数据编织成的一幅幅绚丽画卷。然而&#xff0c;有时这幅画卷可能会因为一次意外的格式化操…

【科研基础】通感一体化讲座

通信和感知在硬件结构上相似&#xff0c;高效地利用资源&#xff0c;实现相互的增益&#xff1b; 感知是基于不同的任务&#xff0c;比如

Python联动Mysql

首先配置pip源(不然在安装库的时候会很慢!!!) pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/安装必要库: mysql.connector MySQL 连接器/ODBC 是 MySQL ODBC 驱动程序&#xff08;以前称为 MyODBC 驱动程序&#xff09;系列的名称&#xff0c;它使…

计算机网络:运输层 - TCP 流量控制 拥塞控制

计算机网络&#xff1a;运输层 - TCP 流量控制 & 拥塞控制 滑动窗口流量控制拥塞控制慢开始算法拥塞避免算法快重传算法快恢复算法 滑动窗口 如图所示&#xff1a; 在TCP首部中有一个窗口字段&#xff0c;该字段就基于滑动窗口来辅助流量控制和拥塞控制。所以我们先讲解滑…

kotlin集合框架

1、集合框架的接口类型对比 2、不可变和可变List fun main() {// 不可变List - 不能删除或添加元素val intList: List<Int> listOf(1,2,3)intList.forEach{println(it) // 1 2 3}println("")// 可变List - 可以删除或添加元素val mutableList mutableListO…

为什么要学Java?

想要自己教会自己java&#xff0c;从小白成长到架构师。实现硬实力就业&#xff01; 因为Java是全球排名第一的编程语言&#xff0c;Java工程师也是市场需求最大的软件工程师&#xff0c;选择Java&#xff0c;就是选择了高薪。 为什么Java应用最广泛&#xff1f; 从互联网到…

[Linux] 文件系统

UNIX操作系统将文件组织成一个有层次的树形结构&#xff1a; 标准目录&#xff1a; 根目录&#xff1a; /tmp目录 主目录&#xff1a; 这就是主目录 一般与系统有关的信息都存放在etc目录下 注意&#xff1a; /etc/passwd存放的是用户账户信息&#xff0c;不是密码信息&#xf…

适用于所有 Android 手机的 8 大 Android 解锁工具

有时您无法解锁手机&#xff0c;因为您忘记了密码或设备停止响应解锁图案。不要惊慌。我们在这里为您列出了最好的 Android 解锁工具。只需选择一个您喜欢的。 为了保护重要数据&#xff0c;许多手机用户倾向于使用图案锁、密码、指纹甚至面部识别来锁定设备。但有时&#xff…

抉择与未来:高考后专业与学校的深度选择思考

引言 随着2024年高考的尘埃落定&#xff0c;数百万考生及其家庭正面临一个至关重要的决策&#xff1a;在有限的分数条件下&#xff0c;是优先选择专业还是学校&#xff1f;这一选择不仅影响着个人的未来职业道路&#xff0c;也关系到大学生活的质量和个人综合素质的培养。本文将…