YOLO_V8训练自己的数据集

news2025/4/6 17:37:34

YOLO_V8在2023年开年横空出世，在春节前还得卷一下。

由于YOLO_V8和YOLO_V5是同一个作者，所以很多操作都是一样的，下面主要描述一下如何用自己的数据集进行训练和测试（非命令行的方式）。

1、训练数据和模型的目录结构

这里以口罩数据集为例，该数据集分为两类，戴口罩和不戴口罩：['mask', 'no-mask']，由于本文是进行目标检测任务，直接将数据集放到“detect”目录下，实际使用时可将“MaskDataSet”文件夹放到工程中的任何位置。

MaskDataSet
├─ test
│    ├─ images
│    │    └─ ······
│    └─  labels
│       └─ ······
 
├─ train
│    ├─ images
│    │    └─ ······
│    └─  labels
│       └─ ······
 
├─ valid
│    ├─ images
│    │    └─ ······
│    └─  labels
│       └─ ······
├─ data.yaml
└─ yolov8s.yaml

2、训练数据集的说明

train文件夹下主要包含训练图片images和标签labels，其中图片名和标签文件（.txt）名一一对应，且标签文件中保存的是对应图片中各个目标的类别和坐标（和YOLO_V5一样），例如：

类别+坐标
0 0.4669 0.2392 0.1822 0.3123

test和valid存储的东西和train完全一致。

3、数据集参数文件data.yaml

data.yaml文件保存训练数据集的目录，类别数，类别名，如图所示：

我这里由于数据集的路径太深，直接使用了绝对路径，可根据需求自行修改。

4、模型参数文件yolov8s.yaml

YOLO_V8包含5种模型，主要差异还是在：depth_multiple和width_multiple

depth_multiple: 0.33  # scales module repeats
width_multiple: 0.50  # scales convolution channels

本文以YOLOv8s为例进行说明，将yolov8s.yaml中的nc改为2即可。

5、训练前的参数配置

之前的YOLO_V5实在train.py文件中配置模型路径，数据路径，epochs等参数的，但是YOLO_V8做了较大的改变，将所有的参数整合到一个文件中集中配置（.\YOLOv8\ultralytics\yolo\configs\default.yaml），并且划分了检测、分类、分割任务，便于后续集成多个项目，特别容易维护。

task: "detect" # choices=['detect', 'segment', 'classify', 'init'] # init is a special case. Specify task to run.
mode: "predict" # choices=['train', 'val', 'predict'] # mode to run task in.