一。mosaic图像增强
其实就是将多张图片给汇总到一起,在源码当中就是默认使用4张图片进行拼接,进行预测。
优点:
- 增加数据的多样性
- 增加目标个数
- BN能一次性统计多张图片的参数(变相的增加了,输入一张图片其实就已经包含了4张图片的均值和方差信息。)
二。spp模块
在经过backbone(darknet53)之后,额外添加了一个spp机构。实现了不同特征的融合。
三。IOU LOSS
1.GIOU LOSS
- [ Ac:整个外界矩形的面积]
- [ U:代表的是并集部分的面积]
缺点:收敛慢,不能准确回归。
2.DIOU LOSS
DIOU的计算公式:
- [rou平方:欧式距离]
- [b:为预测边界框的中心点]
- [bgt:为真实边界框的中心点]
- [c:外接矩阵的]
DIOU损失能够直接最小化两个boxes之间的距离,所以会收敛的快。
3.CIOU LOSS
定位损失应该考虑到3种几何参数:重叠面积,中心点距离,长宽比。
Focal Loss
未完待续。。。
参考自:
https://space.bilibili.com/18161609/channel/series