1 V4版本概述
集各种优秀方案于一身,嫁接了众多主流的目标识别方面的情况。
V4 贡献
3. 数据增强策略分析
BOF
Bag of freebies(BOF)
Mosiac 数据增强
- Mixup
比如将狗和猫的两张图片混合,一半猫,一半狗。 label 也变成 Dog 0.5 , Cat 0.5
- Cutout, 将狗的部分身体挡住,学习局部,提高难度
- CutMix 将其他类别的如猫提出来挡住狗的一部分。 标签如改成Dog 0.6, Cat 0.4
yolov4作者参考以上方法,参考CutMix,各个图像按照原有的图像增强方法进行增强,然后将4张图像拼接成一张进行训练。
数据增强
- Random Erase
- Hide and Seek
4. DropBlock与标签平滑方法
-
引入噪音干扰,增强当前的输入
-
DropBlock
Dropout: 为了防止过拟合,随机的杀死一些神经元
DroBlack:杀死部分模块,比如将眼镜、耳朵等块挡住,降低过拟合风险,提高泛化能力。
-
Label Smoothing
神经网络自觉不错,经常过拟合
修改标签,进行标签平滑,提高抗过拟合能力。使主要标签占大比例,如0.95
5. 损失函数遇到的问题
- IOU损失
IOU=0,会出现梯度消失的情况
引入C,C可以把A、B包含在内
6. CIOU损失函数的定义
yolov4最终使用CIOU作为损失函数,同时考虑了重叠面积(IOU),中心距离和长宽比
7.NMS细节改进
NMS: 先找置信度值最大的,然后将其他的提出掉
Soft-NMS:算完DIOU-NMS后,图上绿色框大概率会被干掉。但是图上有2只🐎,绿色的应该要被保留。不满足要求的先不直接剔除掉,而是对其降分,然后在之后看其综合表现,如能达标,则留下,不能达标,则剔除。
8. SPP与CSP 网络结构
## SPP
拆成两部分后,一部分正常走网络,数据量变小了,速度变快了。
CBAM
attention:百分比,挑重点
10 PAN模块
激活函数