图像读写(imgcodecs 模块)与视频读写

news2024/10/7 8:30:19
内置格式

OpenCV 可以在没有任何第三方库帮助的情况下读取以下格式:

  • BMP的

  • 高动态范围 (WITH_IMGCODEC_HDR)

  • 太阳栅格 (WITH_IMGCODEC_SUNRASTER)

  • PPM、PGM、PBM、PFM(、WITH_IMGCODEC_PXM``WITH_IMGCODEC_PFM)

PNG、JPEG、TIFF、WEBP 支持
格式选择违约强制构建自己
巴布亚新几内亚WITH_PNGBUILD_PNG
JPEG格式WITH_JPEGBUILD_JPEG
TIFF格式WITH_TIFFBUILD_TIFF
网络WITH_WEBPBUILD_WEBP
使用 OpenJPEG 进行JPEG2000WITH_OPENJPEGBUILD_OPENJPEG
与 JasPer JPEG2000WITH_JASPER(见注释)BUILD_JASPER
EXR的WITH_OPENEXRBUILD_OPENEXR

读取这些格式的图像所需的所有库都包含在 OpenCV 中,如果在配置阶段找不到,将自动构建。相应的选项将强制构建和使用自己的库,它们在某些平台上默认启用,例如 Windows。BUILD_*

  • 注意

    OpenJPEG 的优先级高于已弃用的 JasPer。为了使用 JasPer,必须禁用 OpenJPEG。

GDAL集成

WITH_GDAL(默认:OFF)

GDAL 是一个更高级别的库,支持读取多种文件格式,包括 PNG、JPEG 和 TIFF。打开文件时,它将具有更高的优先级,并且可以覆盖其他后端。该库将使用 cmake 包机制进行搜索,确保安装正确或手动设置环境或 cmake 变量。GDAL_DIR

GDCM集成

WITH_GDCM(默认:OFF)

通过 GDCM 库启用 DICOM 医学图像格式支持。该库将使用 cmake 包机制进行搜索,确保安装正确或手动设置环境或 cmake 变量。GDCM_DIR

视频读写(videoio模块)

TODO:videoio的工作原理,注册表,优先级

Video4Linux的

WITH_V4L(Linux;默认值:ON )

使用 Video4Linux API 从相机捕获图像。必须安装 Linux 内核头文件。

FFmpeg的

WITH_FFMPEG(默认值:ON)

与 FFmpeg 库集成,用于解码和编码视频文件和网络流。该库可以读取和写入许多流行的视频格式。它由几个组件组成,这些组件必须作为构建的先决条件进行安装:

  • AVCODEC解码器

  • AVVonfig

  • 阿武蒂尔

  • 斯瓦斯卡

  • avresample(可选)

例外情况是 Windows 平台,其中包含 FFmpeg 的预构建插件库将在配置阶段下载并复制到包含所有生成库的文件夹中。bin

  • 注意

    可以使用 Libav 库代替 FFmpeg,但这种组合不受积极支持。

GStreamer(GS特雷默)

WITH_GSTREAMER(默认值:ON)

实现与 GStreamer 库的集成,用于解码和编码视频文件,从摄像机和网络流中捕获帧。可以安装许多插件来扩展支持的格式列表。OpenCV 允许运行任意 GStreamer 管道,这些管道作为字符串传递给 cv::VideoCapture 和 cv::VideoWriter 对象。

各种 GStreamer 插件在不同平台上提供硬件加速的视频处理。

Microsoft 媒体基金会

WITH_MSMF(Windows;默认值:ON)

启用使用 Windows 内置媒体基础框架的 MSMF 后端。可用于从相机捕获帧,解码和编码视频文件。此后端具有硬件加速处理支持(选项,默认为 ON)。WITH_MSMF_DXVA

  • 注意

    旧版本的 Windows(10 之前的版本)可能具有不兼容的 Media Foundation 版本,并且已知从 OpenCV 使用时会出现问题。

DirectShow(直接显示)

WITH_DSHOW(Windows;默认值:ON)

此后端使用较旧的DirectShow框架。它只能用于从相机捕获帧。它现在已被弃用,取而代之的是 MSMF 后端,尽管两者都可以在同一版本中启用。

AV发布

WITH_AVFOUNDATION(Apple;默认值:ON)

AVFoundation 框架是 Apple 平台的一部分,可用于从相机捕获帧、编码和解码视频文件。

其他后端

有多个不太流行的框架可用于读取和写入视频。每个都需要安装相应的库或 SDK。

选择违约描述
WITH_1394使用 DC1394 库的 IIDC IEEE1394支持
WITH_OPENNI关闭OpenNI 可用于 从 深度 感应 相机 采集 数据。荒废的。
WITH_OPENNI2关闭OpenNI2 可用于从深度感应相机捕获数据。
WITH_PVAPI关闭PVAPI 是用于 Prosilica GigE 相机的旧版 SDK。荒废的。
WITH_ARAVIS关闭Aravis 库用于使用 Genicam 相机进行视频采集。
WITH_XIMEA关闭XIMEA 相机支持。
WITH_XINE关闭XINE 库支持。
WITH_LIBREALSENSE关闭RealSense 摄像头支持。
WITH_MFX关闭MediaSDK 库可用于原始视频流的硬件加速解码和编码。
WITH_GPHOTO2关闭GPhoto 库可用于从相机获取帧。
WITH_ANDROID_MEDIANDKMediaNDK 库自 API 级别 21 起在 Android 上可用。
VideoIO插件

从 4.1.0 版本开始,一些 videoio 后端可以构建为插件,从而打破了对第三方库的严格依赖,并在运行时使它们成为可选的。可以使用以下选项来控制此机制:

选择违约描述
VIDEOIO_ENABLE_PLUGINS完全启用或禁用插件。
VIDEOIO_PLUGIN_LIST以逗号或分号分隔的要编译为插件的后端名称列表。支持的名称包括 ffmpeggstreamermsmfmfxall

查看 OpenCV 安装概述,了解独立插件构建说明

 在线教程

  • 麻省理工学院人工智能视频教程 – 麻省理工人工智能课程
  • 人工智能入门 – 人工智能基础学习。Peter Norvig举办的课程
  • EdX 人工智能 – 此课程讲授人工智能计算机系统设计的基本概念和技术。
  • 人工智能中的计划 – 计划是人工智能系统的基础部分之一。在这个课程中,你将会学习到让机器人执行一系列动作所需要的基本算法。
  • 机器人人工智能 – 这个课程将会教授你实现人工智能的基本方法,包括:概率推算,计划和搜索,本地化,跟踪和控制,全部都是围绕有关机器人设计。
  • 机器学习 – 有指导和无指导情况下的基本机器学习算法
  • 机器学习中的神经网络 – 智能神经网络上的算法和实践经验
  • 斯坦福统计学习

请添加图片描述

人工智能书籍

  • OpenCV(中文版).(布拉德斯基等)
  • OpenCV+3计算机视觉++Python语言实现+第二版
  • OpenCV3编程入门 毛星云编著
  • 数字图像处理_第三版
  • 人工智能:一种现代的方法
  • 深度学习面试宝典
  • 深度学习之PyTorch物体检测实战
  • 吴恩达DeepLearning.ai中文版笔记
  • 计算机视觉中的多视图几何
  • PyTorch-官方推荐教程-英文版
  • 《神经网络与深度学习》(邱锡鹏-20191121)

  • 在这里插入图片描述

第一阶段:零基础入门(3-6个月)

新手应首先通过少而精的学习,看到全景图,建立大局观。 通过完成小实验,建立信心,才能避免“从入门到放弃”的尴尬。因此,第一阶段只推荐4本最必要的书(而且这些书到了第二、三阶段也能继续用),入门以后,在后续学习中再“哪里不会补哪里”即可。

第二阶段:基础进阶(3-6个月)

熟读《机器学习算法的数学解析与Python实现》并动手实践后,你已经对机器学习有了基本的了解,不再是小白了。这时可以开始触类旁通,学习热门技术,加强实践水平。在深入学习的同时,也可以探索自己感兴趣的方向,为求职面试打好基础。

第三阶段:工作应用

这一阶段你已经不再需要引导,只需要一些推荐书目。如果你从入门时就确认了未来的工作方向,可以在第二阶段就提前阅读相关入门书籍(对应“商业落地五大方向”中的前两本),然后再“哪里不会补哪里”。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1411824.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言第九弹---二维数组

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】 二维数组 1、二维数组的创建 1.1、二维数组的概念 ​1.2、⼆维数组的创建 2、二维数组的初始化 2.1、不完全初始化 ​2.2、完全初始化 ​2.3、按照行初始化 ​2.4、…

C++实用教程(四):面向对象核心多态 笔记

推荐B站视频:C现代实用教程(四):面向对象核心多态_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV15v4y1M7fF/?spm_id_from333.999.0.0&vd_sourcea934d7fc6f47698a29dac90a922ba5a3 本项目通用的tasks.json文件和launch.json tasks.json {"versi…

TMS智慧园区物流系统:提升化工园区管理效率的最佳选择

在化工行业园区中,企业面临着诸多痛点,如人工管理流程复杂、园区堵车、园区安全管理不到位、设备资产管理缺失、环境管理混乱无章、数据无法追溯等。这些问题不仅影响企业的生产效率和经济效益,还可能对员工的生命安全和环境造成潜在威胁。为…

uniapp封装公共的方法或者数据请求方法

仅供自己参考,不是每个页面都用到这个方法,所以我直接在用到的页面引用该公用方法: 1、新建一个util.js文件 export const address function(options){return new Promise((resolve,reject)>{uni.request({url:"https://x.cxniu.…

C# 命名管道管道NamedPipeServerStream使用

NamedPipeServerStream 是 .NET Framework 和 .NET Core 中提供的一个类,用于创建和操作命名管道的服务器端。命名管道是一种在同一台计算机上或不同计算机之间进行进程间通信的机制。 命名管道允许两个或多个进程通过共享的管道进行通信。其中一个进程充当服务器&…

CentOS网络配置进阶:深入研究network服务和NetworkManager

前言 如果你正在使用CentOS系统,并且想要深入了解网络管理和配置,那么本文肯定适合你!在这篇文章中,作者深入探讨了CentOS中的两种网络管理方式:network服务和NetworkManager。通过详实的讲解和实用的示例,你将会学习到如何使用这两种工具来管理网络接口、配置IP地址、网…

外贸邮件群发软件有哪些?邮件群发的系统?

外贸邮件群发软件哪个比较好?外贸开发信软件推荐? 对于许多外贸企业来说,邮件营销是一种非常有效的推广方式。那么,外贸邮件群发软件就成为了必备的工具。蜂邮EDM将为你揭秘几款主流的外贸邮件群发软件,助你更好地开展…

用javadoc生成springboot的文档

概述:生成 Spring Boot 项目的 JavaDoc 文档与生成普通的 Java 项目类似。 目录 第一步:创建一个springboot项目 第二步:编写pom文件 第三步:运行 Maven 命令生成 JavaDoc 第四步:查看结果 第一步:创建…

海外媒体发稿:出口贸易媒体发稿推广8种方法让您事半功倍-华媒舍

通过出口贸易媒体发稿可以帮助企业拓展市场、提升知名度,从而取得更好的出口贸易业绩。在进行媒体发稿时,需要确定目标受众,编写吸引人的标题,提供有价值的内容,并选择合适的媒体平台和发布时间。通过持续改进和优化&a…

自然语言NLP学习

2-7 门控循环单元(GRU)_哔哩哔哩_bilibili GRU LSTM 双向RNN CNN 卷积神经网络 输入层 转化为向量表示 dropout ppl 标量 在物理学和数学中,标量(Scalar)是一个只有大小、没有方向的量。它只用一个数值就可以完全…

docker之部署青龙面板

青龙面板是一个用于管理和监控 Linux 服务器的工具,具有定时运行脚本任务的功能。在实际情况下也可以用于一些定期自动签到等任务脚本的运行。 本次记录下简单的安装与使用,请提前安装好docker,参考之前的文章。 一、安装部署 1、拉取镜像 # …

小迪安全21WEB 攻防-JavaWeb 项目JWT 身份攻击组件安全访问控制

#知识点: 1、JavaWeb 常见安全及代码逻辑 2、目录遍历&身份验证&逻辑&JWT 3、访问控制&安全组件&越权&三方组件 Java:大部分都是第三方插件出现漏洞 webgoat的搭建:——java靶场 JDK版本要求:11.0…

图形绘制QGraphicsView、QGraphicsScene、QGraphicsItem、Qt GUI

QGraphicsView、QGraphicsScene、QGraphicsItem 和 Qt GUI(QGuiApplication)可以用来构建和管理基于图形的用户界面。 一、它们之间的关系: QGuiApplication 作为应用程序的基础,提供了窗口和事件管理等功能。 QGraphicsView 则…

15- OpenCV:模板匹配(cv::matchTemplate)

目录 1、模板匹配介绍 2、cv::matchTemplate 3、模板匹配的方法(算法) 4、代码演示 1、模板匹配介绍 模板匹配就是在整个图像区域发现与给定子图像匹配的小块区域。 它可以在一幅图像中寻找与给定模板最相似的部分。 模板匹配的步骤: &a…

中移(苏州)软件技术有限公司面试问题与解答(4)—— virtio所创建的设备2

接前一篇文章:中移(苏州)软件技术有限公司面试问题与解答(4)—— virtio所创建的设备1 在上一篇文章中,对于面试所提出的问题“virtio会创建哪些设备?”,有了初步答案,即…

基于python和定向爬虫的商品比价系统实现

目录 前言 一、系统设计 1. 系统需求分析 2. 系统设计思路 二、系统实现 1. 爬虫部分 2. 比价部分 3. 完整系统代码 三、系统优化 1. 多线程爬取 2. 引入数据库 四、总结 前言 商品比价系统是一种可以帮助用户快速找到最优价格商品的系统。本文将介绍如何使用pyth…

开源的API Gateway项目- Kong基于OpenResty(Nginx + Lua模块)

Kong 是一个在 Nginx 内运行的开源 API 网关和微服务抽象层。它是用于处理 API 流量的灵活、可扩展、可插入的工具。 Kong 提供了以下功能: 用户登录:Kong 提供了多种认证插件,像 JWT、OAuth 2.0 等,可以满足用户登录需求。Toke…

Linux---文件系统

在基础IO中,我们所讲的都是对被打开文件的管理,但是不是所有的文件都是被打开的,对那些在磁盘中保存的没有被打开的文件,我们同样也需要管理,这个就像是快递站中等待被人取走的快递,我们需要将它们分门别类…

Java项目:15 springboot vue的智慧养老手表管理系统

作者主页:源码空间codegym 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 本系统共分为两个角色:家长,养老院管理员 框架:springboot、mybatis、vue 数据库:mysql 5.7&…

Fink CDC 1.0 至3.0的从古至今

本文主要分享Flink CDC 1.0 至3.0的发展历程,了解其背后的关键特性和发展趋势,探讨其在大数据领域的影响和价值。 一、CDC概述 CDC是一种用以掌控数据变化的软件架构(技术思路),用于捕获和传递数据库中发生的数据变化。当数据库中发生增(INSERT)/删(DELETE)/改(UPD…