YOLOV8——快速训练指南(上手教程、自定义数据训练)

news2024/11/26 10:48:26

概述    

    本篇主要用于说明如何使用自己的训练数据,快速在YOLOV8 框架上进行训练。当前(20230116)官方文档和网上的资源主要都是在开源的数据集上进行测试,对于算法“小白”或者“老鸟”如何快速应用到自己的项目中,这个单纯看官方文档显得有点凌乱,因为YOLOV8 不再致力于做一个单纯算法,而是想要做一个一统(分类、检测、分割且多种模型)的框架。下面以检测为例。

    安装,官方提供了完整的安装方式:Quickstart - Ultralytics YOLOv8 Docs 如果希望不安装直接使用,参考本文第七节。 

详细

1、标注

        准备自己的数据,数据的标注格式和YOLOV5没有分别,一般工业还是需要使用如labelme等标注,格式为coco格式(class_id x y w x)xywx均需要归一化,类别号从0开始,一个框一行。

2、目录的组织形式:

        低阶使用, 可无痛迁移YOLO6 YOLOv7

        以“images” 命名图片路径,标签路径仅仅是将“images” 变为“labels”;代码自动对应images和labels,所以一张图片的标签需要和图片同名(如果没有对应的label 就是认为是背景图,没有目标)。

        高阶使用, YOLOV6 YOLOv7 当前某些方式不支持。

        20230116 主要的源码路径为:https://github.com/ultralytics/ultralytics/blob/main/ultralytics/yolo/data/dataloaders/v5loader.py

函数“LoadImages”用于推理,函数“LoadImagesAndLabels” 用于训练,但是并没有统一支持的数据目录存放格式。

        1)使用文件夹(列表)文件夹存储所有的训练图片(由于磁盘文件系统,单个文件夹文件过多影响吞吐速度)。

单个文件夹对应配置文件的写法

path: ../datasets/VOC
train: # train images (relative to 'path')
  - images/train2007
val: # val images (relative to 'path')
  - images/test2007
test: # test images (optional)
  - images/test2007

多个文件夹对应配置文件的写法

path: ../datasets/VOC
train: # train images (relative to 'path')
  - images/train2012
  - images/train2007
val: # val images (relative to 'path')
  - images/test2007
test: # test images (optional)
  - images/test2007

2)使用文本文件(列表)存储图片

单个文本文件对应配置文件的写法

path: ../datasets/VOC
train: # train images (relative to 'path')
  - train2017.txt
val: # val images (relative to 'path')
  - val2017.txt
test: # test images (optional)
  - test-dev2017.txt

多个文本文件对应配置文件的写法(目前20230116仅detect 推理支持,训练不支持,需要修改源码)

path: ../datasets/VOC
train: # train images (relative to 'path')
  - train2017.txt
  - train2012.txt
val: # val images (relative to 'path')
  - val2017.txt
test: # test images (optional)
  - test-dev2017.txt

参考源代码:

1)函数“LoadImages”用于推理

注意:

*可以为多个文件夹路径,为相对路径

*文件名列表文本文件只支持一个文本文件,路径为绝对路径

*可以同时存在一个文本文件+若干目录

2)函数“LoadImages”用于训练和评测

注意:

*可以为多个文件夹路径,为相对路径

*可以为多个文件名列表文本文件,路径为:绝对路径,或者相对路径但是是相对文本文件的路径!

*可以同时存在若干文本文件+若干目录

3、编写data yaml 文件

可以参考:https://github.com/ultralytics/ultralytics/blob/main/ultralytics/yolo/data/datasets/coco128.yaml

4、编写模型yaml 文件 或者用预训练模型

    这里的yaml 文件其实就是利用现有的模型组件重新搭建一个新的网络,可以参照如下,或者简单就用预训练的模型(只需要改为yolov8n.pt)。官方配置文件:ultralytics/yolov8n.yaml at main · ultralytics/ultralytics · GitHub

5、编写训练参数文件(可选、高阶)

    官方终于把所有的配置项目全部解耦到配置文件,不再像YOLOV5一样,一部分在配置文件,一部分在train.py 的启动参数中。主要修改如下三个大的代码段。其中有个需要注意的代码段就是“close_mosaic”这个参数,关于这个的讨论见我的另一个文章:yolov5 mosaic相关,目前要实现一个改进的mosaic,预计后续后评测效果后会考虑开源。官方配置文件:https://github.com/ultralytics/ultralytics/blob/main/ultralytics/yolo/configs/default.yaml。

    Note:

    *如果你用的Python 接口,那么目前20230116官方无法直接传参进去修改这个配置文件或者引用新的配置文件,是写死的(下面第一张图)。https://github.com/ultralytics/ultralytics/blob/4962733b49d45e1ae6e7b3ca367e9af9756758bc/ultralytics/yolo/utils/__init__.py

    *如果是cli接口,那么可以复写这个配置文件,下面第二、三张图。https://github.com/ultralytics/ultralytics/blob/c42e44a0211881b661b47050ac2727658078497d/docs/cli.md

    *当然常用的修改参数也是可以传参修改的,见:Configuration - Ultralytics YOLOv8 Docs,下面第四、五张图。 Detection - Ultralytics YOLOv8 Docs。

    *个人还是建议通过配置文件的方式管理训练过程,这样可以快速的追溯每一个实验。 完整的命令就是:

 yolo task=init  # 可选,复制一份默认配置到当前目录供修改。

 yolo  data=coco128.yaml model=yolov8n.pt  cfg=exp1.yaml #一旦用了cfg参数 命令行的task=detect、 mode=train 当前版本不再生效

6、训练脚本

7、高阶使用

        如果你想改源码,或者不希望通过pip 的方式,污染环境,还是希望安装源码,然后python xxxx.py 运行。那么需要:

1)git clone 源码

2)新建(复制)一个自己的调用脚本。

源码链接:https://github.com/ultralytics/ultralytics/blob/main/ultralytics/yolo/cli.py。复制到根目录 。

3)根目录正常调用 python cli.py cfg=/home/xxx/…/exp1.yaml 这个yaml 就是https://github.com/ultralytics/ultralytics/blob/main/ultralytics/yolo/configs/default.yaml。

原理:

        其实官方也是通过这两个文件完成的打包和调用,主要就是这句话:

1)https://github.com/ultralytics/ultralytics/blob/main/setup.py

2)https://github.com/ultralytics/ultralytics/blob/main/ultralytics/yolo/cli.py

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/167281.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

操作系统IO控制方式

操作系统I&O控制方式 视频地址:https://www.bilibili.com/video/BV1YE411D7nH?p64 I&O设备按照信息交换的单位可以分为以下两类: 块设备 数据传输的基本单位是块,传输速率较高,可寻址,可随机读写任意一块。…

78.循环神经网络(RNN)

1. 潜变量自回归模型 2. 循环神经网络 计算损失是比较ot和xt之间来计算损失,但是xt是用来更新ht,使得其挪到下一个单元。 用一个额外的whh来存时序信息。 3. 使用循环神经网络的语言模型 4. 困惑度(perplexity) 5. 梯度剪裁 g表…

《Stealth秘密行动》游戏开发记录

游戏开发的学习记录项目:Stealth秘密行动开始时间:2022.12.30一、新学到的:二、遇到的问题:三、成品部分展示:游戏开发的学习记录⑧ 项目:Stealth秘密行动 开始时间:2022.12.30 (…

数据分析-深度学习Pytorch Day6

卷积神经网络如何运用到图片分类问题感受野 Receptive Field步长Stride填充Padding参数共享share parameter最大池化MaxPoolingCNN全过程仅个人理解学习引言CNN卷积神经网络最初主要是用于计算机视觉和图像处理中,比如图像分类:最终的分类数绝对维度&…

【代码随想录】哈希表-golang

哈希表 from 代码随想录 hash表解法可以是slice,map…,目的是将时间复杂度降为O(1) 有效的字母异位词 给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。 排序 思路:直接重新声明字符的字节形式,然后对其进行…

Vue的依赖收集和性能问题

什么是依赖收集Vue能够实现当一个数据变更时,视图就进行刷新,而且用到这个数据的其他地方也会同步变更;而且,这个数据必须是在有被依赖的情况下,视图和其他用到数据的地方才会变更。 所以,Vue要能够知道一个…

逻辑思维训练1200题-蓝桥杯计算思维参考

黑格尔曾说过,逻辑是一切思考的基础。逻辑思维能力强的人能迅速、准确地把握住问题的实质,面对纷繁复杂的事情能更容易找到解决的办法。《逻辑思维训练1200 题》介绍了排除法、递推法、倒推法、作图法、假设法、计算法、分析法、类比法、推理法、判断法、…

自动化 | 这些常用测试平台,你们公司在用的是哪些呢?

本文节选自霍格沃兹测试学院内部教材测试管理平台是贯穿测试整个生命周期的工具集合,它主要解决的是测试过程中团队协作的问题。在整个测试过程中,需要对测试用例、Bug、代码、持续集成等等进行管理。下面分别从这四个方面介绍现在比较流行的管理平台。6…

四、template模板

模板 之前的案例中&#xff0c;能够返回简单的字符串信息给浏览器。那如果想要返回html页面给浏览器该怎么做呢&#xff1f; 当然&#xff0c;我们可以这么写&#xff1a; def index(request):return HttpResponse(<h1 style"color:red">我是硬编码的</h…

23年3月如何准备pmp考试?

首先要把PMP考试如何报名、考试内容等都要了解清楚&#xff0c;再去备考。<<PMP入门知识>>PMP考试时长&#xff1a;230分钟。PMP考试形式&#xff1a;笔试。PMP考试题型&#xff1a;题型包括单选题和多选题&#xff0c;多选题将说明需选择几个正确选项。PMP考试题量…

NEUQ week11题解

P1796 汤姆斯的天堂梦 汤姆斯的天堂梦 题目描述 汤姆斯生活在一个等级为 000 的星球上。那里的环境极其恶劣&#xff0c;每天 121212 小时的工作和成堆的垃圾让人忍无可忍。他向往着等级为 NNN 的星球上天堂般的生活。 有一些航班将人从低等级的星球送上高一级的星球&#…

【Java寒假打卡】Java基础-网络编程UDP和TCP

【Java寒假打卡】Java基础-网络编程UDP和TCP网络编程的三要素网络编程的常见命令InetAddress类端口协议UDP发送数据UDP接受数据UDP通信程序的练习TCP通信程序-发送数据TCP通信程序-接受数据网络编程的三要素 网络编程的常见命令 ipconfig 查看本机IP地址ping IP地址&#xff1…

【系列03】方法的学习 方法重载 命令行传参 递归 简单计算机 [有目录]

方法的学习 什么是方法 方法是解决一类问题的步骤的有序组合包含于类或者对象之中方法在程序中被创建,在其他地方被引用 就比如输出方法如:System.out.println(); 就是被封装好的方法 方法设计原则:一个方法完成一个功能,利于后期扩展 [原子性] 使用方法: public class D…

vue中使用echarts 动态渲染数据

一、业务场景&#xff1a; 最近在vue中使用echarts时 引入的时候怎么也引不上&#xff0c;后面发现需要绑定在原型上就可以完美解决(也可以直接在需要引入的页面用ES5中的require引入require&#xff08;‘echarts’&#xff09;) 为了避免大家走弯路&#xff0c;下面整合了一下…

FLStudio水果21最新Daw (宿主软件)电音混音编曲制作工具

对许多音乐爱好者来说&#xff0c;从单独欣赏作品过渡到按自己的心情创作作品&#xff0c;是一种奇妙而令人高兴的体验。 音乐的编曲&#xff0c;特别是电子的编曲&#xff0c;Daw (宿主软件)是重要的要素。 编曲软件有很多。 “专业”这个词取决于你是否在行业的某个部分。 就…

MyBatis 详解 (1) -- 环境搭建、查询操作

MyBatis 详解 1 -- 环境搭建、查询操作一、MyBatis 是什么二、为什么学习 MyBatis三、MyBatis 查询3.1 前言3.2 创建数据库和表3.3 添加 MyBatis 框架支持添加 MyBatis 和 MySQL 驱动3.4 配置连接字符串 和 MyBatis3.4.1 配置连接字符串3.4.2 配置 MyBatis 中的 XML 路径3.5 添…

CSS造成阻塞的原理

目录 1.原理解析 A.webkit渲染过程 B.Gecko渲染过程 C.解析原理 接上篇文章CSS会造成阻塞吗&#xff1f; 我们来说一下CSS造成阻塞的原理 1.原理解析 那么为什么会出现上面的现象呢&#xff1f;我们从浏览器的渲染过程来解析下。 不用浏览器使用的内核不同&#xff0c…

leetcode 648. 单词替换【python3哈希集与两种字典树的方法的思考过程整理】

题目 在英语中&#xff0c;我们有一个叫做 词根(root) 的概念&#xff0c;可以词根后面添加其他一些词组成另一个较长的单词——我们称这个词为 继承词(successor)。例如&#xff0c;词根an&#xff0c;跟随着单词 other(其他)&#xff0c;可以形成新的单词 another(另一个)。…

UI自动化测试模块与环境管理全面打通,MeterSphere开源持续测试平台v2.6.0发布

2023年1月16日&#xff0c;MeterSphere一站式开源持续测试平台正式发布v2.6.0版本。 在这一版本中&#xff0c;MeterSphere的UI自动化测试模块与环境管理全面打通&#xff0c;更好地满足了用户一个脚本同时跑多个环境的测试需求。在测试跟踪模块中&#xff0c;测试计划关联测试…

怎么系统的阅读文献

文章目录一、文献阅读1、综述类文献 review article2、研究类文章 research article3、方法学的文章第一部分 综述类文章的阅读第二部分 研究型文章的阅读a. 研究型论文结构b. 如何有选择阅读文献c. 如果整理笔记Citation和Reference的区别二、文献阅读工具1、Connected Papers…