YOLOv5屏蔽区域训练(选择区域训练)

news2024/12/30 3:45:42

YOLOv5屏蔽区域/选择区域 训练(重点区域训练)

  • 前期准备
    • labelme选择mask区域
  • 代码改动

前期准备

思路就是通过使用一个mask掩膜,对我们想要屏蔽或者选择的区域进行定向遮挡或者定向选择,在训练的时候v5需要加载数据即图片和标注信息,我们在数据加载的过程中,将掩膜覆盖到输入图像上,即完成了屏蔽区域/选择区域训练。

labelme选择mask区域

在这里插入图片描述
标注好我们想检测的区域之后,我这里将标注区域命名成了mask,然后我们点击保存导出json文件:
在这里插入图片描述
然后我们再打开终端,cd到json所在的文件夹路径下,输入如下命令:

labelme_json_to_dataset xxx.json

这里有的兄弟会遇到一些报错,主要原因还是环境的版本问题,可以在网上查到,替换一下对应版本的库就行了。

我们就会在这个路径下获得一个文件夹:
在这里插入图片描述

打开文件夹之后会看到里面有这么五个文件,我们需要的就是label.png,其他的不用管:
在这里插入图片描述
到这里,我们的前期准备工作就完成了。

代码改动

打开utils/datasets.py文件,在代码的最面前,首先读取mask图像,然后将其转成二值图像:
在这里插入图片描述
然后再下方设置好超参数,方便在训练和检测时的设置:
在这里插入图片描述
要想对训练时的图像加载的图像进行操作,显然我们首先要到train.py中寻找数据加载的函数,我们可以定位到train函数下调用的create_dataloader()函数:
在这里插入图片描述
摁住ctrl+左键进入该函数:
来到了utils/datasets.py下的函数:
在这里插入图片描述
这里我们注意到该函数返回的dataset是通过LoadImagesAndLabels()函数来读取的,进入该函数之后,我们往下拉,找到加载图片的代码,可以在getitem()函数中看到:
在这里插入图片描述
查看这一段代码,我们发现当设置mosaic的时候,是一种加载方式,当未设置mosaic的时候就是直接加载的方式,v5默认的是mosaic之后再训练,因此我们直接进入load_mosaic()函数中:
在这里插入图片描述
进入到load_mosaic()函数之后,我们发现代码先调用load_image()函数来读取图像,然后通过顺序判断来进行mosaic组合,我们这里继续进入load_image()函数中,感觉胜利即将在前方了:
在这里插入图片描述
果然在进入load_image之后我们看到了加载图像的那句代码!这里的红框就是我自己加的代码,通过bool型来判断是否需要进行mask以及mask的作用是屏蔽还是选择,而这些bool型变量已经在这篇博客的开始被我们定义好了,可以根据需求来排列组合。这样就完成了我们的选择区域/屏蔽区域训练的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/939577.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

登录校验-Interceptor-详解

目录 拦截路径 执行流程 只有拦截器 过滤器和拦截器同时存在 拦截路径 拦截器可以通过需求,在配置类中配置不同的拦截路径 可以设置要拦截的路径以及不进行拦截的路径 package com.example.tlias.config;import com.example.tlias.Interceptor.LoginCheckInterc…

如何判断自动化测试的时机?

判断自动化测试的时机时,可以考虑以下因素: 1、软件稳定性评估: 确定软件的开发阶段,如果软件还在快速迭代和开发中,可能变动频繁,不适合引入自动化测试。 分析软件的功能和接口是否已经相对稳定&#xf…

iOS砸壳系列之三:Frida介绍和使用

当涉及从App Store下载应用程序时,它们都是已安装的iOS应用(IPA)存储在设备上。这些应用程序通常带有保护的代码和资源,以限制用户对其进行修改或者逆向工程。 然而,有时候,为了进行调试、制作插件或者学习…

基于 vSphere 环境安装 Oracle19c RAC 详细过程

文章目录 前言1. 安装环境说明2. 配置规划说明2.1. 网络规划2.2. 目录规划2.3. 磁盘规划 3. 设置系统环境3.1. 删除 virbr0 设备3.2. 配置主机网络3.3. 配置 hosts 解析3.4. 关闭系统防火墙3.5. 关闭 SELINUX3.6. 关闭时钟同步服务3.7. 关闭 avahi-daemon 守护进程3.8. 准备软件…

数据分析作业四-基于用户及物品数据进行内容推荐

## 导入支持库 import pandas as pd import matplotlib.pyplot as plt import sklearn.metrics as metrics import numpy as np from sklearn.neighbors import NearestNeighbors from scipy.spatial.distance import correlation from sklearn.metrics.pairwise import pairwi…

【Python|第40期】Python操作MongoDB

日期:2023年8月28日 作者:Commas 签名:(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释:如果您觉得有所帮助,帮忙点个赞,也可以关注我,我们一起成长;如果有不对的地方&#xf…

一步一步实验,讲解python中模块和包的使用

背景 为什么要提出这个问题? 在一个项目中,每一个python文件打开后,都会看到依赖了其他的一些包、模块等;概念混乱,魔改目标不清晰 为什么要修改? 如果需要将某开源包进行自定义处理,不再使…

AI智慧,书香飘溢|在图书馆的世界,知识与未来交汇!

“如果有天堂,天堂应该是图书馆的模样。”阿根廷国家图书馆前馆长、著名作家博尔赫斯如此形容图书馆。人类文明的演进与传承,倚仗于知识的积累,而知识的载体往往绕不开书籍,其集散地——图书馆,更是在这一过程扮演着极…

【精算研究01/10】 计量经济学的性质和范围

一、说明 计量经济学是使用统计方法来发展理论或测试经济学或金融学中的现有假设。计量经济学依赖于回归模型和零假设检验等技术。计量经济学也可以用来预测未来的经济或金融趋势。 图片来源:https://marketbusinessnews.com 二、 计量经济之简介 计量经济学是对经济…

javacv基础02-调用本机摄像头并预览摄像头图像画面视频

引入架包&#xff1a; <dependency><groupId>org.openpnp</groupId><artifactId>opencv</artifactId><version>4.5.5-1</version></dependency><dependency><groupId>org.bytedeco</groupId><artifactId…

【校招VIP】算法考点之堆排

考点介绍&#xff1a; 排序算法属于数据结构和算法的基础内容&#xff0c;并且也是大厂笔试中的高频考点。 堆排序是使用一棵树存储序列这个课树只保证跟节点是这棵树中的最小值&#xff0c;但并不保证其他节点是按顺序的。因此他的排序是每次从堆中取得堆顶&#xff0c;取得 n…

Qt Scroll Area控件设置,解决无法显示全部内容,且无法滚动显示问题。

前言&#xff0c;因为要显示很多条目的内容&#xff0c;原来是用Vertical Layout控件里面嵌套Horizontal layout显示了很多行控件&#xff0c;发现最简单的方法就是使用滚动条控件&#xff0c;但是无论如何调整需要滚动的控件高度&#xff0c;始终无法滚动显示内容。也就是说添…

5. 线性层及其他层

5.1 神经网络结构 5.2 线性拉平 import torch import torchvision from torch import nn from torch.nn import ReLU from torch.nn import Sigmoid from torch.utils.data import DataLoader from torch.utils.tensorboard import SummaryWriterdataset torchvision.datase…

ant-vue1.78版监听a-modal遮罩层的滚动事件

监听a-modal遮罩层的滚动事件 我们开发过程中经常有遇到监听页面滚动的事件需求&#xff0c;去做一些下拉加载或者是下拉分页的需求&#xff0c;我们直接在vue的生命周期中去绑定事件监听非常的方便&#xff0c;但如果是弹框的遮罩层的滚动监听呢&#xff1f;页面的监听完全是…

Stone Prover:StarkWare的STARK Prover

1. 引言 StarkWare将基于Apache 2.0 license&#xff0c;开源其以C编写的STARK Prover&#xff0c;名为Stone&#xff08;STARK one&#xff09;。 其基本流程为&#xff1a; 1&#xff09;编写Cairo0程序。2&#xff09;使用Cairo工具 将Cairo0程序编译为CASM。3&#xff…

数据结构:八种数据结构大全

数据结构 1.1 数据结构概述 数据结构是计算机存储、组织数据的方式&#xff1b;通常情况下&#xff0c;精心选择的数据结构可以带来更高的运行或者存储效率。数据结构的优良将直接影响着我们程序的性能&#xff1b;常用的数据结构有&#xff1a;数组&#xff08;Array&#xff…

K8S Nginx Ingress实现金丝雀发布

通过给 Ingress 资源指定 Nginx Ingress 所支持的 annotation 可实现金丝雀发布。 需给服务创建2个 Ingress&#xff0c;其中1个常规 Ingress&#xff0c;另1个为带 nginx.ingress.kubernetes.io/canary: "true" 固定的 annotation 的 Ingress&#xff0c;称为 Cana…

浅谈Lua协程和函数的尾调用

前言 虽然不经常用到协程&#xff0c;但是也不能谈虎色变。同时&#xff0c;在有些场景&#xff0c;协程会起到一种不可比拟的作用。所以&#xff0c;了解它&#xff0c;对于一些功能&#xff0c;也会有独特的思路和想法。 协程 概念 关于进程和线程的概念就不多说。 那么…

这所985专业课均分130!复试笔试很难!淘汰率很高!

一、学校及专业介绍 东南大学坐落于六朝古都南京&#xff0c;是享誉海内外的著名高等学府。学校是国家教育部直属并与江苏省共建的全国重点大学&#xff0c;是国家“双一流”、“985工程”、“211工程”重点建设高校。2017年&#xff0c;东南大学入选世界一流大学建设名单。 …

字符集(Latin1,GBK,utf8,utf8mb4)

Latin1 1个字符占一个字节GBK 1个字符占两个字节utf8utfmb3 1个字节占三个字节utf8mb4 1个字符占四个字节