YOLO
v3
目标的中心点在哪个网格内由该网格负责预测该目标,max-iou matching
策略
(1)计算GT的中心点在哪个网格;
(2)计算该网格内的所有anchor与GT的IOU,选择IOU最大的anchor负责预测该GT,将此anchor对应的预测框作为正样本;
(3)
每一个目标都只有一个正样本,gt和anchor一一对应,不考虑阈值
正样本用于分类回归及confidence的学习,负样本仅用于confidence学习
yolov3与单个分支单个网格的单个anchor匹配; yolov5为增加正样本数量,与多个分支多个网格中的多个ancor匹配
SSD
尽管一个GT可以与多个anchor匹配,但是每张图片中GT个数有限,所以负样本相对正样本多很多。为了保证正负样本尽量平衡,SSD采用了ohem
Faster RCNN
正样本参与分类和回归损失函数计算,负样本只参与分类。
区别
1、与SSD和faster rcnn不同,yolo类别预测不考虑背景,引入confidence,区分前景和背景
2、ssd和faster rcnn训练过程中需要使用ohem,yolo不需要?
可能与confidence损失项相关
3、IOU阈值
yolo中gt和anchor的匹配策略不考虑IOU阈值
,gt和anchor一一对应,即使gt和anchor的iou较小,只需符合max-iou matching
策略即可。
ssd和faster rcnn中若IOU阈值
或者anchor
设置不合理,可能导致部分gt没有与之匹配的anchor,在训练过程中被忽略。
参考资料:
YOLO正负样本匹配机制
SSD原理及实现
轻松掌握 MMDetection 中常用算法(二):Faster R-CNN|Mask R-CNN
目标检测正负样本区分和平衡策略