yolov2相对于yolov1的改进:
1、加入Batch Normalization
2、yolov2使用更大的分辨率图片
V1训练使用图片分辨率为224*224,测试图片分辨率为448*448。
V2在V1上的改进为:V2训练时额外又进行了10次448*448的微调。
3、yolov2的网络结构
相对于yolov1的改进之处:
1.取消了FC层,用Maxpool进行5次降采样(得到13*13的特征图),因此可以输入不同分辨率的图片。
2.使用了1*1卷积,降低参数量和计算量。
4、聚类提取先验框(anchor box)
yolov1中的先验框是固定的,不一定符合数据集中物体的尺寸,yolov2做出的改进就是从数据集(如coco)中聚类提取先验框,yolov2提取的先验框分为五类,即k=5,聚类的计算方法由下图给出:
5、Direction Location Prediction 有向位置预测
6、3*3卷积替换5*5和7*7
好处:1. 参数量减少。 2. 增加非线性表达能力。
7、特征融合