可视化目标检测算法推理部署(三)YOLOv8模型视频推理

news2025/1/16 15:48:11

在上一章节中博主利用Gradio完成了YOLOv8模型的图像推理,那么在本章节中将进行视频推理,其代码十分简单,只需要将原本的视频切分为一帧帧图像再去检测即可,代码如下:

def detectio_video(input_path):
    output_path="result.mp4"
    cap = cv2.VideoCapture(input_path)
    fps = int(cap.get(5))
    t = int(1000 / fps)
    videoWriter = None
    while True:
        _, img = cap.read()
        if img is None:
            break
        yolo_det(img)
        cv_dst = yolo_det.draw_detections(img)
        if videoWriter is None:
            fourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')
            videoWriter = cv2.VideoWriter(output_path, fourcc, fps, (cv_dst.shape[1], cv_dst.shape[0]))
        videoWriter.write(cv_dst)
    cap.release()
    videoWriter.release()
    return output_path

至此,模型的视频推理过程便完成了,但我们在UI界面上却发现,上传的视频是没有画面的,同时,返回的视频虽然成果保存,但其在界面上却显示为NaN

在这里插入图片描述
在这里插入图片描述
其实,对于学习YOLO模型推理的过程而言,这已无伤大雅,但博主还有那么一点完美主义精神的,看看能否解决呢?
经过查询相关资料,发现这是由于OpenCV合成视频操作造成的,解决方式是使用moviepy,具体如何做呢?

Moviepy合成视频

我们先来看一个moviepy合成视频的案例,可以看到它其实是读取文件夹内所有图像,随后再统一写入

from moviepy.editor import ImageSequenceClip
import os

# 指定图像文件夹路径
image_folder = '/path/to/image/folder'
# 获取文件夹中的所有图像文件
image_files = [f for f in os.listdir(image_folder) if f.endswith(('.png', '.jpg', '.jpeg'))]
# 按文件名排序图像,确保它们按顺序排列
image_files.sort()
# 创建一个ImageSequenceClip对象,它将自动将图像序列转换为视频
clip = ImageSequenceClip(image_files, fps=30)
# 指定输出视频的文件名
output_video = '/path/to/output/video.mp4'
# 保存视频
clip.write_videofile(output_video, codec='libx264')

将原本的Opencv合成视频进行改造:

def moviepy_video(input_path):
    from moviepy.editor import ImageSequenceClip
    output_path="result.mp4"
    cap = cv2.VideoCapture(input_path)
    fps = int(cap.get(5))
    t = int(1000 / fps)
    images=[]
    while True:
        _, img = cap.read()
        if img is None:
            break
        yolo_det(img)
        cv_dst = yolo_det.draw_detections(img)
        images.append(cv_dst)
    clip = ImageSequenceClip(images, fps=fps)
    clip.write_videofile(output_path, codec='libx264')
    clip.close()
    cap.release()
    return output_path

可以看到,现在这个返回的视频可以展示了,但博主在实验时发现,其最终视频的处理时间要比OpenCV慢上许多,大家根据自己的需要选择即可。

在这里插入图片描述

至于视频上传时,点击播放只有声音没有画面的问题,博主搜索了一些资料但也没有找到解决方法,大家如果有解决方案希望能够不吝赐教。

图像推理改进

随后对模型的图像推理模块进行改进,添加了置信度与IOU的进度条,实现代码如下:

import YOLODet
import gradio as gr
import cv2
#from vis import demo_gradio
model = 'yolov8n.onnx'
base_conf,base_iou=0.5,0.3
def det_img(cv_src,conf_thres, iou_thres):
    yolo_det = YOLODet.YOLODet(model, conf_thres=conf_thres, iou_thres= iou_thres)
    yolo_det(cv_src)
    cv_dst = yolo_det.draw_detections(cv_src)
    return cv_dst
    
if __name__ == '__main__':
    img_input = gr.Image()
    img_output = gr.Image()
    video_input=gr.Video(sources="upload")
    app1 = gr.Interface(fn=det_img, inputs=[img_input,
                                            gr.Slider(maximum=1,minimum=0,value=base_conf),
                                            gr.Slider(maximum=1,minimum=0,value=base_iou)], outputs=img_output)
    app2 = gr.Interface(fn=moviepy_video, inputs=video_input, outputs="video")
    demo = gr.TabbedInterface(
        [app1, app2],
        tab_names=["图像目标检测", "视频目标检测"],
        title="目标检测"
    )

    demo.launch()

实现界面如下:

在这里插入图片描述

完整代码已发布在Github:

Gradio+YOLO模型推理部署

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1968038.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[C++]多态与虚函数

一、多态的概念 顾名思义,多态的意思就是一个事物有多种形态,在完成某个行为的时候,当不同的对象去完成时会产生不同的状态。在面向对象方法中一般是这样表示多态的:向不同的对象发送同一条消息,不同的对象在接收时会产…

记录|Stock编程

目录 前言一、Stock编程?二、聊天工具开发1. 目的2. 服务器端开启对端口的监听3. VS创建服务器端ServiceStep1. 创建Step2. Listener对象监听事件Step1~2效果展示 4. 创建客户端,与服务器端链接5. VS创建客户端ClientStep1. 创建Step2. Client对象Step1~…

二维码门楼牌管理应用平台建设:实有人口采集管理

文章目录 前言一、移动快采,精准定位,高效管理二、新增与注销,灵活管理人口信息三、多维度查询,精准锁定目标人群四、信息核实,确保数据准确无误 前言 在智慧城市建设的大潮中,二维码门楼牌管理应用平台以…

POI 快速入门 Excel导入导出

Excel导入导出 1 什么是POI POI简介(Apache POI),Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。 Apache POI官网http://poi.apache.org/ HSSF - 提…

Ubuntu22.04 Docker更换阿里云镜像

由于运营商网络原因,会导致您拉取Docker Hub镜像变慢,甚至下载失败。那么可以更换阿里云镜像加速器,从而加速官方镜像的下载。 1.获取镜像加速器地址 登录容器镜像服务控制台,在左侧导航栏选择镜像工具 > 镜像加速器&#xf…

课题项目结题测试的作用

课题项目结题测试是课题项目研究过程中的一个重要环节,它对于确保课题项目的质量和成果具有重要的作用。本文将详细介绍课题项目结题测试的作用。 一、确保课题项目质量 课题项目结题测试是对课题项目研究成果的全面评估和检测。通过结题测试,可以对课…

使用Echarts来实现数据可视化

目录 一.什么是ECharts? 二.如何使用Springboot来从后端给Echarts返回响应的数据? eg:折线图: ①Controller层: ②service层: 一.什么是ECharts? ECharts是一款基于JavaScript的数据可视化图标库,提供直观&…

生产力工具|vscode for mac安装及过程留存

一、安装vscode 在官网下载.zip 文件: Visual Studio Code - Code Editing. Redefined 第一步:下载后解压后,直接双击种类为应用程序的文件,将vscode显示在启动台的程序中; 第二步:将文件拖到应用程序中,打开启动…

中国工商银行长春分行开展“工驿幸福 健康财富”长辈客群康养活动

中国工商银行长春分行作为国有大行,持续完善有温度、专业化、安全稳健的养老场景服务,以工行驿站为依托、以长辈客群养老需求为中心,积极对接社区构建敬老、康养的“金融泛金融”工行驿站服务生态,进一步提升长辈客群的到店体验。…

APP逆向 day25unidbg中

一.前言 昨天我们讲了unidbg的上篇,都是一些之前讲过的简单案例,末尾还单独说了一个新案例海南航空,今天我们来讲的案例都是之前讲过的,主要是和大家说补环境 二.唯品会skey 大家如果不记得了,可以去看看前面的文章…

一个函数统一238个机器学习R包,这也太赞了吧

Caret 是一个试图标准化机器学习过程的一个包。Caret 对 R 中最常用的机器学习方法 (目前支持238个R包)提供了统一的接口。 进行数据预处理 实现机器学习方法流程化模型构建 通过参数组合和交叉验证评估模型的参数 选择最优模型 评估模型性能 一键满足各种掉包&#xff0c…

带通采样定理

一、采样定理 1.1 低通采样定理(奈奎斯特采样) 低通采样定理(奈奎斯特采样)是要求大于信号的最高上限频率的两倍 1.2 带通采样定理 带通信号的采样频率在某个时间小于采样频率也能无失真恢复原信号 二、频谱混叠 对一个连续时域信号,采…

【网络安全】CVSS 10信息披露+图片元数据不适当处理

未经许可,不得转载。 文章目录 漏洞1漏洞2漏洞1 app.redacted.com,是一个在线学习应用程序,适用于企业。但其仅限于会员。尝试使用wappalyzer分析其技术堆栈。 首先想到的是对敏感文件进行目录模糊测试。主要使用 dirsearch 和 ffuf 进行此操作。 首先,我运行了 dirsear…

嵌入式人工智能(39-基于树莓派4B的震动传感器和霍尔传感器)

这两个传感器实验比较简单,也都属于力传感器,就放一起做了。 1、震动传感器 震动传感器是一种用于检测和测量物体震动、振动和冲击的设备。它通常由一个敏感元件和一个信号处理单元组成。敏感元件可以是压电材料、光电材料、加速度传感器等。当物体发生…

day 18流的定位、文件IO以及Linux系统中时间的获取

流的定位 偏移量:读和写都在偏移量的位置进行 文件IO 相对于标准IO来说,文件IO直接在Linux的内核中操作,也更加的简洁精炼 对文件的操作也是三个部分 1.打开文件 open 2.读写文件 read write 3.关闭文件 close 还有一些其他的函数接口…

Msf安装

环境安装 渗透测试:CentOS 7 环境下 MSF 工具部署(Metasploit 渗透测试框架安装)_msfconsole安装-CSDN博客https://blog.csdn.net/zatongtong/article/details/135744217?ops_request_misc&request_id&biz_id102&utm_term%E6%9…

stack和list

前言 stack和list的使用就不讲了&#xff0c;讲一下模拟实现&#xff0c;然后讲一下deque&#xff0c;最后讲一下优先队列 1. stack的模拟实现 template<class T,class container>//这个container是vector&#xff0c;或者list或者deque&#xff08;后面会说&#xff0…

基于树莓派的收银系统-KwickPOS

基于树莓派的收银系统在繁忙的餐厅和零售场所大受欢迎 低成本、功能强大、紧凑和稳定的Raspberry Pi计算模块提供平滑的收银解决方案&#xff0c;为北美和中美洲的数千名KwickPOS客户提供不间断的运行时间。 解决方案 Compute Module 3 Compute Module 4 企业规模 中小企业…

java之抽象类以及如何优化

抽象类的作用是什么: 当我们抽取共性时候,无法确定方法体,就把方法定义为抽象的,强制让子类按照某种格式重写,抽象方法所在的类,必须是抽象类.我们先定义一个抽象类 ,abstract的意思就是抽象类, 一般来说,在抽象类里面定义的方法也是抽象方法. public abstract class Animal {p…