要点:
- 归纳
YOLOv5 github
1 YOLO v1
1) 将一幅图像分成SxS个网格(grid cell),如果某个object的中心 落在这个网格中,则这个网格就负责预测这个object。
2)每个网格要预测B个bounding box,每个bounding box 除了要预测位置之外,还要附带预测一个confidence值。每个网格还要预测C个类别的分数。
网络结构:
损失函数
2 YOLO v2
YOLOv2中的各种尝试:
- pBatch Normalization
- pHigh Resolution Classifier
- pConvolutional With Anchor Boxes
- pDimension Clusters
- pDirect location prediction
- pFine-Grained Features
- pMulti-Scale Training
3 YOLO v3
目标边界框的预测
正负样本的匹配
置信度损失
3.1 YOLOv3 SPP
SPP模块
实现了不同尺度的特征融合实现了不同尺度的特征融合,
注意:这里的SPP和SPPnet中的SPP结构不一样,Spatial Pyramid Pooling
CIoU Loss
解读参考:IoU、GIoU、DIoU、CIoU损失函数的那点事儿
4 YOLOv4
5 YOLOv5
5.1 模型框架
5.2 网络结构
5.2.1 普通CSP结构
5.2.2 C3结构
5.2.3 SPP
5.2.4 SPPF
5.3 训练策略
5.3.1 损失计算