YOLOv7 模型融合

news2024/12/22 15:47:31

将两种训练模型的检测结果融合

首先需要两种模型,一个是yolov7原有的模型,另一个是你训练出来的模型

在这里插入图片描述
其中yolov7.pt是官方提供的模型,有80个类别
其中yolov7_3.7HRW.pt是我们自己训练的模型,有三个分类,举手、看书、写字

开始前需要确保ffmpeg是否安装

conda install x264 ffmpeg -c conda-forge -y

还需要建立一个python脚本
get_classes.py
写入如下内容:

import torch
from pathlib import Path
from models.experimental import attempt_load

def get_classes(model_file_path):
    
    # 加载模型
    model = attempt_load(model_file_path, map_location='cpu')
    
    # 获取分类标签
    classes = model.module.names if hasattr(model, 'module') else model.names
    
    # 返回分类标签
    return classes

然后创建:
merged_labels.py

import sys
from numpy import random
import os

# 获取第一个参数的值
class1 = sys.argv[1].split("[")[-1].split("]")[0].split(", ")

# 获取第二个参数的值
class2 = sys.argv[2].split("[")[-1].split("]")[0].split(", ")

# 获取第三个参数的值
merged_labels_path = sys.argv[3]

merge_class = class1+class2

# 随机生成颜色
colors = [[random.randint(0, 255) for _ in range(3)] for _ in merge_class]

path1 = './runs/detect/exp/labels/'
path2 = './runs/detect/exp2/labels/'

for file_name in os.listdir(path1):
    file_path1 = os.path.join(path1, file_name)
    merged_file_path = os.path.join(merged_labels_path, file_name)
    with open(file_path1) as f1, open(merged_file_path, 'a') as fw:
        lines1 = f1.readlines()
        for line in lines1:
            fw.write(line)


import os
import argparse
import cv2

# 设置不同类别的颜色和标签
class_colors = [(255, 0, 0), (0, 255, 0), (0, 0, 255), (200, 0, 0), (0, 200, 0), (0, 0, 200),(150, 0, 0), (0, 150, 0), (0, 0, 150), (100, 0, 0), (0, 100, 0)] # 对应11个类别的颜色
class_label1 = ['ball', 'sandpile', 'ruler', 'weight', 'pit', 'weigh', 'height measure', 'drop ball', 'size measure', 'record'] # 对应10个类别的标签
class_label2 = ['person']
class_labels = class_label1 + class_label2
# 定义parse对象,用于输入命令行参数
parser = argparse.ArgumentParser(description='Merge the detection results of two YOLOv7 models and draw bounding boxes on images.')
parser.add_argument('path1', type=str, help='the path of the detection results from the first YOLOv7 model')
parser.add_argument('path2', type=str, help='the path of the detection results from the second YOLOv7 model')
parser.add_argument('image_path', type=str, help='the path of the images to be processed')
args = parser.parse_args()

# 分别获取两个检测结果文件的路径,并将它们的内容合并
path1 = os.path.join(args.path1, 'labels')
path2 = os.path.join(args.path2, 'labels')
merged_labels_path = os.path.join(args.path1, 'merged_labels')

os.makedirs(merged_labels_path, exist_ok=True)



for file_name in os.listdir(path1):
    file_path1 = os.path.join(path1, file_name)
    merged_file_path = os.path.join(merged_labels_path, file_name)
    with open(file_path1) as f1, open(merged_file_path, 'a') as fw:
        lines1 = f1.readlines()
        for line in lines1:
            fw.write(line)

for file_name in os.listdir(path2):
    file_path2 = os.path.join(path2, file_name)
    merged_file_path = os.path.join(merged_labels_path, file_name)

    with open(file_path2) as f2, open(merged_file_path, 'a') as fw:
        lines2 = f2.readlines()
        for line in lines2:
            class_id, x_center, y_center, w, h = line.split()
            if class_id != "0":
                continue
            class_id = str(len(class_label1) + int(class_id))
            line = class_id + ' ' + x_center + ' ' + y_center + ' ' + w + ' ' + h + '\n'

            fw.write(line)

# 处理每张图像,画上检测框
image_path = args.image_path
output_path = 'output'


os.makedirs(output_path, exist_ok=True)

for file_name in os.listdir(image_path):
    image_file_path = os.path.join(image_path, file_name)
    label_file_path = os.path.join(merged_labels_path, file_name[:-4] + '.txt')
    # label_file_path = os.path.join(merged_labels_path, file_name.split("_")[0] + "_" + str(int(file_name.split("_")[1].split('.')[0])) + '.txt')
    assert os.path.exists(label_file_path), f"Label file not found: {label_file_path}"

    img = cv2.imread(image_file_path)

    with open(label_file_path) as f:
        for line in f:
            # 使用yolo格式标签在图片上画矩阵
            class_id, x_center, y_center, w, h = line.split()
            x_center, y_center, w, h = float(x_center), float(y_center), float(w), float(h)
            x_min = int((x_center - w / 2) * img.shape[1])
            y_min = int((y_center - h / 2) * img.shape[0])
            x_max = int((x_center + w / 2) * img.shape[1])
            y_max = int((y_center + h / 2) * img.shape[0])

            class_id = int(class_id)

            # 取一个颜色和标签并应用在当前的类别上
            color = class_colors[class_id % len(class_colors)]
            label = class_labels[class_id % len(class_labels)]

            cv2.rectangle(img, (x_min, y_min), (x_max, y_max), color, 2)

            # 在矩形框上显示类别标签
            cv2.putText(img, label, (x_min, y_min), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)

    output_file_path = os.path.join(output_path, file_name)
    cv2.imwrite(output_file_path, img)

print('Done.')



首先是一个bash脚本,用来控制所有程序运行。

bash fusionDetection.sh 待检测的视频路径 每秒裁剪帧数 输出视频帧的路径 第一种模型权重的路径 第二种权重的路径 合并的检测结果(txt)路径
如:
bash fusionDetection.sh ./inVideo/1.mp4 1 ./outFrames ./yolov7.pt ./yolov7_4.2k_HRW.pt ./merged_labels

inVideo=$1
frameRate=$2
outFrames=$3
weight1=$4
weight2=$5

# 先对输出视频帧的路径进行清空处理
CRTDIR=$(pwd)

if [[ ! -d "${outFrames}" ]]; then
  echo "${outFrames} doesn't exist. Creating it.";
  mkdir -p ${outFrames}
fi

cd ${outFrames}
rm -rf *
cd ${CRTDIR}

# 对视频进行裁剪
out_name="${outFrames}/out_%06d.jpg"
ffmpeg -i "${inVideo}" -r ${frameRate} -q:v 1 "${out_name}"

# 进入 yolov7 的目录

# 先清空之前的检测结果
if [[ ! -d "./runs/detect/" ]]; then
  echo "./runs/detect/ doesn't exist. Creating it.";
  mkdir -p "./runs/detect/"
fi

cd ./runs/detect/
rm -rf *
cd ../../

python detect.py --weights ${weight1} --conf 0.25 --img-size 640 --source ${outFrames} --save-txt
python detect.py --weights ${weight2} --conf 0.25 --img-size 640 --source ${outFrames} --save-txt

# 读取权重种的类别

# 调用 Python 脚本获取分类标签
classes1=$(python -c "from get_classes import get_classes; print(get_classes('${weight1}'))")

classes2=$(python -c "from get_classes import get_classes; print(get_classes('${weight2}'))")

# 打印分类标签
echo "Classes: ${classes1}"
echo "Classes: ${classes2}"

# 融合的xt的位置
merged_labels_path = './mergedLabels/'

if [[ ! -d "${merged_labels_path}" ]]; then
  echo "${merged_labels_path} doesn't exist. Creating it.";
  mkdir -p ${merged_labels_path}
fi


python merged_labels.py "${classes1}" "${classes2}" "${merged_labels_path}"



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/632963.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WPF开发txt阅读器6:用树形图管理书籍

txt阅读器系列: 需求分析和文件读写目录提取类💎列表控件与目录字体控件绑定书籍管理系统 TreeView控件 TreeView可以通过可折叠的节点来显示层次结构中的信息,是表达文件系统从属关系的不二选择,其最终效果如下 为了构建这个树…

UnityVR--组件6--Animation动画

目录 新建动画Animation Animation组件解释 应用举例1:制作动画片段 应用举例2:添加动画事件 Animator动画控制器 应用举例3:在Animator中设置动画片段间的跳转 本篇使用的API:Animation、Animator以及Animator类中的SetFlo…

【Python可视化大屏】「淄博烧烤」热评舆情分析大屏

文章目录 一、开发背景二、爬虫代码2.1 展示爬取结果2.3 导入MySQL数据库 三、可视化代码3.1 大标题3.2 词云图(含:加载停用词)3.3 玫瑰图(含:snownlp情感分析)3.4 柱形图-TOP10关键词3.5 折线图-讨论热度趋…

ViewOverlay-使用简单实践

ViewOverlay-使用简单实践 一、ViewOverlay能实现什么?二、基础用法2.1 一个简单案例2.2 overlay.add(drawable)/groupOverlay.add(view)之后,不显示问题解决2.2.1 add(Drawable)方法2.2.1 add(View)方法 一、ViewOverlay能实现什么? 在Andro…

北京软件外包开发流程

随着软件的规模越做越多,功能也越来越复杂,对项目管理和开发人员也提出了更高的要求。软件开发的流程通常包括需求分析、项目评估与计划、设计、编码、测试等多个环节,今天和大家分享这方面的知识,希望对大家有所帮助。 软件外包开…

关系代数表达式练习(针对难题)

教师关系T(T#,TNAME,TITLE)课程关系C(C#,CNAME,TNO)学生关系S(S#,SNAME,AGE,SEX)选课关系SC(S#,C#,SCORE) 检索至少选修了C2,C4两门课程的学生学号: 涉及减法相关: 检索不学C2课的学生姓名和年龄 涉及除法相关: 检索…

使用SQL语句创建存储过程

前言: 本篇文章是记录学校学习SQL server中知识,可用于复习资料. 目录 前言:一、存储过程的创建1、创建简单存储过程2、创建带参数的存储过程3、创建带输出参数的存储过程 二 、使用T一SQL语句管理和维护存储过程2.1 使用sp_helptext查看存储过程student_sc的定义脚本2.2 使用…

Redis安装与启动

概念 简介:Redis是基于内存的数据结构存储系统,它可以用作:数据库、缓存和消息中间件。特点:Redis是用C语言开发的一个开源的高性能健值对(key-value)数据库,官方提供的数据是每秒内查询次数十万加。它存储的value类型比较丰富&a…

问麻了…阿里一面索命27问,过了就60W+

前言 在40岁老架构师尼恩的(50)读者社区中,经常有小伙伴,需要面试阿里、 百度、头条、美团、京东等大厂。 下面是一个小伙伴成功拿到通过了阿里三次技术面试,小伙伴通过三个多小时技术拷问,最终拿到 offe…

git修改commit的注释内容

文章目录 1. 查看所有commit2. 修改最近一次commit注释3. 修改某一次commit注释 要修改 Git 中的 commit 注释内容,可以使用 git commit --amend 命令。具体步骤如下: 1. 查看所有commit 运行 git log --oneline 命令,查看需要修改的 commi…

202316读书笔记|《作家榜名著:花间集》——花半坼,雨初晴,满身香雾簇朝霞,娇艳轻盈香雪腻

202316读书笔记|《作家榜名著:花间集》——花半坼,雨初晴,满身香雾簇朝霞,娇艳轻盈香雪腻 《作家榜名著:花间集》作者赵崇祚 房开江。这里有绮丽的艳词,缱绻的缠绵,温婉绵延的思愁。或慵懒梳洗迟…

springboot+vue.js学生宿舍报修信息管理系统68ozj

本学生宿舍信息管理系统管理员,学生,维修人员,商家四个角色。管理员功能有个人中心,班级管理,学生管理,维修人员管理,商家管理,宿舍信息管理,宿舍安排管理,报…

【沐风老师】详解3DMAX一键破损插件PolyDamage使用方法

3DMAX一键破损插件教程 3dMax一键破损插件PolyDamage是一种快速添加模型损坏和缺陷的工具。现实生活中没有什么是完美的,所以给你的模型增加一些破损会看起来更逼真。PolyDamage是使用其他软件包手动雕刻损伤的快速替代方案。PolyDamage为混凝土墙、地面、石头和柱子增添了…

什么是Vue的Virtual DOM,如何使用?

什么是Vue的Virtual DOM,如何使用? Vue是一款流行的JavaScript框架。它采用了Virtual DOM的概念来提高应用程序的性能和响应能力。本文将介绍Vue的Virtual DOM是什么,以及如何使用它来构建更快的Vue应用程序。 什么是Vue的Virtual DOM&#…

萤石摄像头RTSP流获取(黑屏解决)

前言 在获取萤石摄像头RTSP视频流时,视频流获取不成功,黑屏并且一直显示缓冲中。下面对获取过程中查阅的资料和解决方案做一下汇总。 打开RTSP 在萤石云视频APP中打开RTSP,【我的】-【工具】-【局域网设备预览】-【开始扫描】-【选择摄像头…

【前端 - CSS】第 12 课 - 字体修饰属性

欢迎来到博主 Apeiron 的博客,祝您旅程愉快 ! 时止则止,时行则行。动静不失其时,其道光明。 目录 1、缘起 2、字体修饰属性 2.1、字体大小 2.2、字体粗细 2.3、字体倾斜 2.4、字体族 2.5、font 复合属性 2.6、文本缩进 …

基于YOLOv5的火焰烟雾检测算法实战

一个不知名大学生,江湖人称菜狗 original author: Jacky Li Email : 3435673055qq.com Time of completion:2023.6.11 Last edited: 2023.6.11 导读: 火焰烟雾检测是智慧安防业务场景中重要的功能之一,本文提出了一种基于YOLOv5的…

热力管网DTU,让管网运营更加高效可靠

供热行业一直是人们生活中不可或缺的重要组成部分,然而,传统的热力管网维护方式却存在一系列隐患,尤其是在数据传输和安全方面。这些问题可能给您的工作带来许多麻烦和困扰。 首先,数据传输速度缓慢成为制约供热管网维护效率的主要…

chatgpt赋能python:Python的库

Python的库 Python是一种流行的编程语言,被广泛用于Web开发、数据科学、人工智能等领域。Python语言的优点之一就是其强大的库生态系统。库是Python中可重用的模块,可以帮助程序员快速构建现代应用程序。本文将介绍Python中的库及其用法。 什么是Pytho…

chatgpt赋能python:Python如何去除字符串中的空格

Python如何去除字符串中的空格 在Python中,字符串是一种非常重要的数据类型,用于表示文本。但是,在实际编程中,经常需要去除字符串中的空格。本文将介绍Python中几种常用的去除字符串中空格的方法。 1. 使用strip()方法 strip(…