YOLO-V5分类实战系列 —— 快速训练自己的数据集

news2024/11/29 12:29:51

YOLO-V5 训练自己的分类模型

    • 1、获取官方源码
    • 2、测试官方源码
      • 2.1、公开数据集测试源码
    • 3、源码模块解析
      • 3.1、数据读取
    • 4、快速开始训练自己的数据
      • 4.1、准备自己的数据
      • 4.2、配置训练参数


1、获取官方源码

官方代码:https://github.com/ultralytics/yolov5
更新版本:v6.2 添加了分类模块,v7.0 添加分割模块,所以至少要下载 v6.2 之后的版本
环境安装:按照下面的方式安装,
在这里插入图片描述
拉取特定版本的代码:参考我的博文 YOLO-V5 算法和代码解析系列(一)—— 快速开始

2、测试官方源码

下图是官方的代码结构(v6.2),增加了一个文件夹【classify】,存放分类的代码,包括训练代码 train.py,预测代码 predict.py,评估代码 val.py

在这里插入图片描述


2.1、公开数据集测试源码

按照上述代码结构,进入【classify】文件夹,打开训练脚本【train.py】。根据训练脚本最开始的注释内容,可以使用官方数据集,也可以使用自己的数据集,以及单卡和多卡的训练命令,

在这里插入图片描述
官方训练命令如下,

python classify/train.py --model yolov5s-cls.pt --data cifar100 --epochs 5 --img 128

运行上述命令,会自动下载所需的数据集【cifar100】,以及模型文件【yolov5s-cls.pt】。下载完成后,数据的存放结构如下图所示,包含测试集【test】和训练集【train】。注意,参考官方的数据存放结构,可以准备自己数据集
在这里插入图片描述
每一个文件夹内,存放一个类别的图片,如下图所示
在这里插入图片描述

训练过程如下,训练基本正常,

在这里插入图片描述


3、源码模块解析

3.1、数据读取

  • 数据路径【data_dir/train】下的文件夹数量,用于判别训练的类别数量,具体代码如下:
    nc = len([x for x in (data_dir / 'train').glob('*') if x.is_dir()])  # number of classes
    

yolov5-cls 的网络结构如下图所示,只用了目标检测网络的主干部分。基础模块包括:C3,Conv,其详细的结构,可以参考之前写的博文,YOLO-V5 系列算法和代码解析(四)—— 网络结构
在这里插入图片描述

4、快速开始训练自己的数据

按照在官方数据集上的测试过程,要想快速开始训练,只要两方面的准备:(1)准备好自己的数据集;(2)配置部分训练参数。具体的过程在以下章节陈述

4.1、准备自己的数据

根据【2.1】节的陈述,可以确认自己数据集的存放结构,每一个文件夹放一个类别的图片。【mono_classify】就是存放自己的训练数据的目录名称,也是训练时传入的数据标志,
在这里插入图片描述
在这里插入图片描述


4.2、配置训练参数

为了训练自己的数据集,首先保证官方代码能够在自己的数据集上正常训练,并且达到基本的训练效果即可,之后再进行网络调优。所以,这一章节的目的是让官方源码在自己的数据集上快速开始训练,并且能够得到基本的训练效果。为此,修改训练脚本(train.py)的部分训练参数,具体如下,

  • 模型选择,默认是 yolov5-cls,也可以是 efficient-b0,b1,b2,b3resnet18

    parser.add_argument('--model', type=str, default='yolov5s-cls.pt', help='initial weights path')
    
  • 修改训练数据路径

    parser.add_argument('--data', 
                        type=str, 
                        default='mono_classify', 
                        help='cifar10, cifar100, mnist, imagenet, etc.')
    
  • 根据自己的需要,修改如下参数

    parser.add_argument('--epochs', type=int, default=10)
    parser.add_argument('--batch-size', type=int, default=64, help='total batch size for all GPUs')
    parser.add_argument('--imgsz', '--img', '--img-size', 
    					type=int, 
    					default=128, 
    					help='train, val image size (pixels)')
    
  • 根据是否需要预训练,修改参数

    parser.add_argument('--pretrained', nargs='?', const=True, 
    					default=True, 
    					help='start from i.e. --pretrained False')
    

配置完参数后,开启训练,过程如下从精度来看,基本正常,达到最基本的效果

在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/646301.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Matter】Matter学习笔记1

文章目录 前言Matter协议架构1.Matter Over IPV62.Matter协议架构3.Matter标准协议架构 Matter网络拓扑结构Mesh组网1.单一网络拓扑2.星形网络拓扑 设备数据模型(Date Model)1.设备和端点(Node、Endpoint)2.节点角色(N…

58、基于51单片机GPS定位自动报站时间显示语音播报公交车系统设计(程序+原理图+PCB源文件+参考论文+开题报告+任务书+元器件清单等)

摘 要 1831年,英国的沃尔特汗考为他的国家制造出了世界上第一辆装载发动机的公共汽车,至今,公交车已经经历过近200年的发展过程。从刚开始“闷罐头”样式到如今配套空调系统;从专人售票至无人售票;从人工报站至半自动…

咖啡店小程序开发 让烟火小店更有生机

随着人们生活水平的提高和生活压力的增大,很多人都靠喝咖啡来缓解疲劳和压力,也为我们的生活增添了一丝情趣,但高峰时期排队购买一杯咖啡很浪费时间,很多赶时间的上班族不得不放弃。随着互联网技术深入到各行各业,传统…

电商人看过来,这个 AI 工具可以一键生成商品背景图

在2023年,如果你还不会玩AI,那你就out了。如果AI只是作为娱乐的话,学起来还是挺费劲的,但是如何将AI嵌入到我们的工作流程中,从而提升工作效率,这很重要。 于是,经过小编一个下午的疯狂测试&am…

华为OD机试真题 JavaScript 实现【通信误码】【2022Q4 100分】,附详细解题思路

一、题目描述 信号传播过程中会出现一些误码,不同的数字表示不同的误码ID,取值范围为1~65535,用一个数组记录误码出现的情况。 每个误码出现的次数代表误码频度,请找出记录中包含频度最高误码的最小子数组长度。 二、输入描述 …

【色度学】颜色的显色系统

我的理解: HSV模型应该对应的是下面的:色相、视明度、饱和度的定义。 1. 色彩的心里属性 1.1 色相Hue 色相是指颜色的基本相貌,它是颜色彼此区别的最主要和最基本的特征,它表示颜色质的区别,也叫色调。 从光的物理刺…

大厂精简人员,技术人员如何跳出“舒适圈”

你还记得自己为求职焦虑是什么时候吗? 是刚毕业找工作,还是第一次跳槽,还是在毫无准备的情况下被优化掉? 疫情下,裁员消息成为这个年底让所有互联网从业人员最为关注的新闻。企业选择剥离主线业务之外的枝枝蔓蔓&…

Mediapipe实时3D目标检测和跟踪(自动驾驶实现)

🚀 导语 3D目标检测是根据物体的形状、位置和方向来识别和定位物体的任务。在2D目标检测中,被检测到的物体仅表示为矩形边界框。3D目标检测任务通过预测物体周围的包围框,可以获取物体的三维位置信息。 3D目标检测在各行各业都有广泛的应用。…

(2023年最新版)史上最全Python/Java自动化测试学习路线图!没有之一!

废话少说,直接上干货! 保证是你2023年看到最全最详细的自动化测试进阶学习路线全栈图!!赶紧保存! 由于全图图片太大上传不了,这里就不展示了。需要的小伙伴们可以文末小卡片联系我 下面展示部分截图&#…

express的使用(四) nodejs转发表单到后台

原文链接 搬砖的林小白-express的使用(四) 个人博客地址,求关注,也希望大家在里面批评我的不足之处 看前提示 本篇所讲述的内容是node端转发前端发送过来的表单到第三方中,应用的场景有很多,如我们经常做的将文件存储到七牛云或…

Cesium教程(十八):可视域分析

Cesium教程(十八):可视域分析 三维可视域分析是计算从某点出发的视线在一定视角范围内能通视的区域。是一种常规的三维空间分析手段。Cesium没有封装完整的可视域分析方法,这里提供简单的可视域分析的简化实现方法。 效果预览 其中需要另外引入四个js文件。下载地址在文章最…

5年测试经验怎么着我也能要个20K吧?没想到被阿里P8问傻了····

都说金三银四是跳槽涨薪季,我也是着急忙慌的准备简历——5年软件测试经验,可独立测试大型产品项目,熟悉项目测试流程…薪资要求?5年测试经验起码能要个20K吧? 我加班肝了一页半简历,投出去一周&#xff0c…

软件测试如何提高自己的工作汇报能力?

汇报自己的工作是一件非常重要的事,但往往被一些人忽视掉。 我有个朋友,他带的组里有一个小伙子,技术能力不错,代码也写得干净漂亮,但是不喜欢汇报自己的工作成果,他的想法是:我做完的东西&…

【Spring源码解读四】IoC容器之AnnotationConfigApplication的refresh()刷新方法其三

finishBeanFactoryInitialization() freezeConfiguration() preInstantiateSingletons() getBean() 这一篇博文主要是记录refresh()方法中的finishBeanFactoryInitialization()方法。对于使用注解注入Bean的方式来说,这个方法是很重要的,它会初始化所…

使用Unity开发一个独立的区块链

Arouse Blockchain [Unity独立区块链] 这是一个学习性质的项目,使用了Unity进行独立区块链游戏的开发。使用此项目,将默认你有一定的Unity基础,如果你是Unity小白,可以先学习Unity,B站有大量的教材。 内容列表 项目的…

武职301-day01

文章目录 实现永和小票页面效果图问题分析开发分析开发步骤order.html页面 问题:HTML代码和CSS样式代码混杂在一起网页中使用样式style修饰常用2种方式自定义样式表base.css 作业 实现永和小票页面 效果图 问题分析 把一个大的开发任务,先进行任务分析…

web前端-ES6语法学习

Vue3.0的学习 ES6的模块化语法ES6 模块化规范的概述ES6 模块化的体验默认导出与默认导入按需导出 和 按需导入直接导入并执行模块中的代码 Promiseasync/awaitEventLoop宏任务和微任务 ES6的模块化语法 ES6中文教程网:https://www.w3cschool.cn/escript6/ ES6 模块…

Makerbase SimpleFOC ESP32 例程8 电机旋钮控制测试

Makerbase SimpleFOC ESP32 例程8 电机旋钮控制测试 第一部分 硬件介绍 1.1 硬件清单 序号品名数量1ESP32 FOC V1.0 主板12YT2804电机2312V电源适配器14USB 线156pin杜邦线2 注意:YT2804是改装的云台无刷电机,带有AS5600编码器,可实现360连续运转。 …

基于java springboot+mybatis OA办公自动化系统设计和实现

基于java springbootmybatis OA办公自动化系统设计和实现 博主介绍:5年java开发经验,专注Java开发、定制、远程、指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java项目精品实战案例《500套》 欢迎点赞 收藏 ⭐留言 文末获取源码联系方…

利用fiddler测试APP及高级应用

我们经常需要用到Fiddler做代理服务器对Web、APP应用进行抓包,以便我们对接口功能进行测试调试,定位问题等。这篇将讲述怎么通过Fiddler对APP进行抓包,以及简单介绍一些高级应用场景。 首先,附上Fiddler使用的环境配置清单&#…