1、论文
论文题目:《Focal and Efficient IOU Loss for Accurate Bounding Box Regression》
2、引言
CIoU Loss虽然考虑了边界框回归的重叠面积、中心点距离、高宽比。但是其公式中的v反映的是高宽的差异,而不是高宽分别与其置信度的真实差异。因此,有时会阻碍模型有效的优化相似性。针对这一问题,本文在CIoU的基础上将高宽比拆开,提出了EIoU Loss,并且引入了Focal Loss聚焦优质的锚框。
文章贡献:
- 将高宽比的损失项拆分成预测的高宽分别与最小外接框高宽的差值,加快了收敛速度,提高了回归精度;
- 引入了Focal Loss,优化了边界框回归任务中的样本不平衡问题,即减少了与目标边界框重叠程度较低的锚框对BBox回归的优化贡献,使回归过程更专注于高质量的锚框。
- 对合成数据和真实数据进行了广泛的实验。出色的实验结果验证了所提出方法的优越性。详细的消融实验显示了损失函数和参数值不同设置的影响。
3、EIoU Loss
EIoU Loss包括三个部分:IoU损失、距离损失、高宽损失(重叠面积、中心点举例、高宽比)。高宽损失直接最小化了预测目标边界框和真实边界框的高度和宽度的差异,使其有更快的收敛速度和更好的定位结果。
其中,wc和hc是预测边界框与真实边界框的最小外接矩形的宽度和高度。p是两点之间的欧氏距离。
4、Focal-EIoU Loss
考虑到预测目标边界框回归的过程中存在训练样本不平衡的问题,即在一张图像中,回归误差小的高质量锚框数量远少于误差大的低质量锚框数量。质量较差的锚框会产生过大的梯度,影响训练过程。直接使用EIoU Loss效果并不好,所以作者结合Focal Loss提出了Focal-EIoU Loss,从梯度的角度出发,把高质量的锚框和低质量的锚框分开,公式如下:
作者通过消融实验发现,γ=0.5时可以实现最佳权衡。
注意:该损失中的Focal与传统的Focal Loss有一定的区别。传统的Focal Loss更专注于训练困难的样本,越困难的样本损失越大。而Focal-EIoU Loss则是IoU越高的样本损失越大,相当于加权作用,有助于提高回归精度。
5、效果
虽然Focal-EIoU Loss偶尔会在大目标附近分配错误的框,但总体而言,在中型和大型目标上的表现效果比其他损失函数更好。但对小目标,Focal-EIoU Loss略逊于IoU Loss,可能会忽略或将低质量框和低置信度预测分配给小目标。