YOLOv5项目调试与实战

news2026/2/13 12:09:26

拥有青春的时候

你就要感受它

不要浪费你的黄金时代

把宝贵的内在生命活出来

什么都别错过

一、项目介绍与环境配置

github地址

选择5.0版本的tag，并下载源码

使用Pycharm打开代码

选择解释器，我选择的是之前conda创建的pytorch环境

安装项目所需要用到的包

打开项目的requirements.txt文件，里面有运行项目所需要的包，这是一个好的编码习惯，自己写的代码也可以这样做。

然后在终端运行下载代码

二、利用YOLOv5进行预测

找到detect.py文件，运行代码

可能出现的错误1：

AttributeError: Can't get attribute 'SPPF' on <module 'models.common' from '

解决方案：

1. 自己在官网下载对应的yolov5s.pt模型，然后放到项目里去（推荐）。

2. 按下面方式修改项目代码

增加代码

class SPPF(nn.Module):
    def __init__(self, c1, c2, k=5):
        super().__init__()
        c_ = c1 // 2
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c_ * 4, c2, 1, 1)
        self.m = nn.MaxPool2d(kernel_size=k, stride=1, padding=k // 2)
 
    def forward(self, x):
        x = self.cv1(x)
        with warnings.catch_warnings():
            warnings.simplefilter('ignore')
            y1 = self.m(x)
            y2 = self.m(y1)
            return self.cv2(torch.cat([x, y1, y2, self.m(y2)], 1))

可能出现的错误2：

File "/Users/lihui/Documents/ai/anaconda3/envs/pytorch/lib/python3.8/site-packages/torch/nn/modules/upsampling.py", line 157, in forward
recompute_scale_factor=self.recompute_scale_factor)
File "/Users/lihui/Documents/ai/anaconda3/envs/pytorch/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1614, in __getattr__
raise AttributeError("'{}' object has no attribute '{}'".format(
AttributeError: 'Upsample' object has no attribute 'recompute_scale_factor'

随着路径找到对应的文件

找到出问题的代码，删掉

应该是python版本导致的问题。

修改完报错之后，再次运行代码

使用不同的模型进行训练，得出的效果不一样。

如我下载下面四个模型，进行测试

训练顺序依次为5s、5m、5l、5x

可以看出选择复杂度更高的模型，训练时间更久，但是效果更好。

检测视频

检测模型会将视频一帧一帧地进行检测，最后将结果输出出来。

进阶玩法

手机下载APP ip摄像头

然后让服务和手机在同一个局域网下，代码的路径改为

http://admin:admin@手机上打开之后显示的IP地址，就能通过手机进行实时的物体检测。

同样，如果要实时检测摄像头拍摄的物体，可以将路径改为摄像头推过来的RTSP流。

参数解释

--weights：模型权重文件的路径。就是使用什么模型来跑，可以指定一个或多个路径，用空格分隔。

--source：数据源的路径或URL。可以是文件夹路径、视频文件路径或者网络摄像头的URL。

--img-size：推理时输入图像的大小（像素）。默认为640。

--conf-thres：目标置信度阈值。检测到的目标的置信度必须大于此阈值才会被接受。比如你检测人的置信度设置为0.8，那么在检测中只有大于0.8概率的才会被检测框框出来。

--iou-thres：非最大值抑制（NMS）的IOU阈值。交并集，取检测最接近的一个检测框。

--device：设备选择，可以是CUDA设备的索引（如0）或者多个设备的索引（如0,1,2,3），也可以是cpu。默认为空字符串，表示使用默认设备。

--view-img：显示结果图像。如果设置了该参数，在跑代码的时候会实时显示检测结果的图像。

--save-txt：保存结果到.txt文件。如果设置了该参数，则会将检测结果保存为文本文件。

--save-conf：在保存的.txt标签中保存置信度。如果设置了该参数，则会在保存的文本标签中包含目标的置信度。

--nosave：不保存图像/视频。如果设置了该参数，则不会保存检测结果的图像或视频。

--classes：按类别过滤。可以指定一个或多个类别的索引，用空格分隔。例如，--classes 0表示只保留类别索引为0的目标。每一个类别的值，比如人的类别是0，如果你设置了classes 0,那么只会检测人。

--agnostic-nms：类别不可知的NMS。如果设置了该参数，则使用类别不可知的非最大值抑制。

--augment：增强推理。如果设置了该参数，则在推理过程中使用数据增强技术，更准确。

--update：更新所有模型。如果设置了该参数，则会更新所有模型。没啥用。

--project：结果保存的项目路径。默认为runs/detect。

--name：结果保存的名称。默认为exp。

--exist-ok：允许覆盖现有的项目/名称。如果设置了该参数，则不会增加项目/名称的后缀。

参数设置tips：

在这里设置你需要的参数，这样每次跑项目你就不用每次在命令行手敲了。

三、训练YOLOv5神经网络

打开train.py训练文件

参数解释

- `--weights`：初始权重文件的路径。选择训练模型，默认为`yolov5s.pt`。

- `--cfg`：模型配置文件（`model.yaml`）的路径。

- `--data`：数据集配置文件（`data.yaml`）的路径。默认为`data/coco128.yaml`。

- `--hyp`：超参数文件的路径。默认为`data/hyp.scratch.yaml`。

- `--epochs`：训练的总轮数，默认为300。

- `--batch-size`：每个批次的样本数。默认为16。

- `--img-size`：训练和测试图像的尺寸。可以指定一个或两个整数值作为列表，例如`--img-size 640 640`。默认为`[640, 640]`。

- `--rect`：使用矩形训练。如果设置了该参数，则训练过程中使用矩形图像而不是正方形图像。不是矩阵的会自动进行填充。

- `--resume`：恢复最近的训练。如果设置了该参数，则会恢复最近一次的训练。

- `--nosave`：只保存最终的检查点。如果设置了该参数，则只保存最后一个轮次的模型检查点。

- `--notest`：只测试最终的轮次。如果设置了该参数，则只在最后一个轮次进行测试。

- `--noautoanchor`：禁用自动锚框检查。

- `--evolve`：演化超参数。如果设置了该参数，则会根据训练过程中的结果自动调整超参数。

- `--bucket`：Google Cloud Storage（GCS）存储桶的路径。

- `--cache-images`：缓存图像以加快训练速度。

- `--image-weights`：使用加权的图像选择进行训练。

- `--device`：设备选择，可以是CUDA设备的索引（如`0`）或者多个设备的索引（如`0,1,2,3`），也可以是`cpu`。

- `--multi-scale`：变化的图像尺寸。如果设置了该参数，则训练过程中会随机调整图像尺寸的大小。

- `--single-cls`：将多类别数据作为单一类别进行训练。

- `--adam`：使用`torch.optim.Adam()`优化器。

- `--sync-bn`：使用`SyncBatchNorm`，只在DDP模式下可用。

- `--local_rank`：DDP参数，不要修改。

- `--workers`：最大数据加载器的工作进程数。

- `--project`：保存结果的项目路径。默认为`runs/train`。

- `--entity`：W&B实体。

- `--name`：保存结果的名称。默认为`exp`。

- `--exist-ok`：允许覆盖现有的项目/名称。

- `--quad`：使用四分之一的数据加载器。

- `--linear-lr`：使用线性学习率。

- `--label-smoothing`：标签平滑的ε值。

- `--upload_dataset`：将数据集上传为W&B的artifact表格。

- `--bbox_interval`：设置W&B的边界框图像日志记录间隔。

- `--save_period`：每隔多少轮保存一次模型。

- `--artifact_alias`：数据集artifact的版本别名。

云端GPU训练模型

谷歌提供的免费网站

官网地址