YOLO-V3
这张图讲道理真的过分了!!!我不是针对谁,在座的各位都是
终于到V3了,最大的改进就是网络结构,使其更适合小目标检测特征做的更细致,融入多持续特征图信息来预测不同规格物体
先验框更丰富了,3种scale,每种3个规格,一共9种
softmax改进,预测多标签任务
多scale
为了能检测到不同大小的物体,设计了3个scale
scale变换经典方法
左图:图像金字塔;右图:单一的输入;
残差连接-为了更好的特征
核心网络架构
先验框设计
YOLO-V2中选了5个,这回更多了,一共有9种
1313特征图上:(116x90),(156x198),(373x326)2626特征图上:(30x61),(62x45),(59x119)
52*52特征图上:(10x13),(16x30),(33x23)
YOLO-V2中选了5个,这回更多了,一共有9种
softmax层替代
物体检测任务中可能一个物体有多个标签
logistic激活函数来完成,这样就能预测每一个类别是/不是