Python实时视频流+网络摄像头+视频检测流程播放

news2026/2/14 23:52:54

实时视频处理

概述
- 需求
- 网络摄像头推流
- - 流媒体服务器
  - 查看设备视频、音频设备列表
  - 查看指定设备配置信息
- 不编码、指定分辨率推流
- 编码加速
- python服务端处理
- - 多线程
  - 最终的处理方式
- 问题与分析

概述

一款桌面应用，可以配置视频处理参数，根据参数播放网络摄像头实时视频，根据参数调整视频检测模型，并把视频检测结果绘制在视频画面上，以下主要分析如何获得处理后的视频。

需求

视频播放实时，包括视频播放的实时性和视频检测结果绘制的实时性；
视频播放流畅，没有明显卡顿；
视频播放延迟不超过300ms；
视频播放显示于web端；
视频处理受外部（web端）传入参数控制；

网络摄像头推流

神器：ffmpeg
推流要实时，最好是对流啥都不做，不解码编码，原样推送，解码编码一定会耗时，输入的视频帧分辨率尽量小，小图的传输速度更快，以上要求对摄像头本身也有要求，所以要先检查一下摄像头本身的配置。

流媒体服务器

视频推流需要推送到一个流媒体服务器中，mediamtx是一个开源的服务器，百度查询，下载即用。

查看设备视频、音频设备列表

ffmpeg -f dshow -list_devices true -i dummy

在这里插入图片描述

查看指定设备配置信息

ffmpeg -f dshow -list_options true -i video="Integrated Webcam"

vcodec 视频编解码器
pixel_format
s 分辨率
fps 帧率
在这里插入图片描述

不编码、指定分辨率推流

ffmpeg -f dshow -i video="Integrated Webcam" -s 640x480 -vcodec copy -f rtsp rtsp://localhost:8554/stream

-s 640x480 指定输入分辨率为640x480
-vcodec copy 不解码编码，即指定输出视频流和输入视频流的编码格式保持一致

编码加速

ffmpeg -f dshow -i video="Integrated Webcam" -c:v libx264 -preset ultrafast -tune zerolatency -pix_fmt yuyv422 -max_delay 0 -bf 0 -f rtsp rtsp://localhost:8554/stream

-c:v libx264：使用libx264作为视频编码器（同 -vcodec libx264）
-preset ultrafast 预设，极速快，但输出质量较低
-tune zerolatency 调优，零延迟设置
-pix_fmt yuyv422 指定像素格式和输入一样，减少解码时间
-max_delay 0 最大延迟0ms，好像默认就是0，设置延迟可增加编码器质量
-bf 0 设置B帧为0，B帧不太了解，好像是h264视频会有的（应该也存在其他编码格式拥有），描述前后2帧差异的帧

python服务端处理

要求是视频检测结果绘制也要实时，即每一帧视频画面上的绘制内容，都是对应帧的检测结果，这意味着，不能进行抽帧处理，必须要逐帧进行处理。

多线程

一开始使用多线程、线程池的方式进行处理：
线程1：从网络摄像头读取视频帧，存入先进先出队列
线程2：从队列读取视频帧，丢给线程池处理（异步），这将返回一个Future对象，把该对象存入另一个先进先出队列，以保证视频帧的顺序
线程3：从Future对象的队列，读取异步处理结果，发送给web端
考虑使用线程池进行异步操作，充分利用cpu，结果效果不佳，视频延迟卡顿明显，猜测可能是因为python的多线程实际上不是并行的，它存在一个全局锁，只有当当前线程阻塞的时候，其他线程才有机会使用资源，意味着同时只有一个线程能使用资源，再加上线程切换需要开销，因此效果比之单线程处理要差。