模型创新点
在论文引言中,作者提出了目前语义分割存在的问题,并且给出了解决办法:
-
下采样会导致我们图像空间分辨率降低——解决办法 使用膨胀卷积
-
目前语义分割网络基本都是采用CNN网络作为主干网络,但是CNN网络主要适用于目标检测任务,具有空间不变性,也就是图像旋转或者平移,都能够识别出图像中的目标,但是语义分割和图像识别不同,图像中的物体稍微平移一点,对应的像素也会变化
针对上述问题,DeepLabv1提出了两个创新点:
CRF可以解决空间不变性问题,但是目前已经不怎么使用了,DeepLabv3之后就不使用了
DeepLabv1优势
下面是DeepLabv1的优势:
MSc(Mutil-Scale)结构
下面在主要介绍DeepLabv1中的MSc结构:
MSc主要是用来融合多个尺度的信息
将输入原图的数据和前四个maxpooling层输出的数据和最后输出进行融合
虽然MSc能够提高识别准确率,但是会降低推理速度,增大训练缓存,因此不推荐
下面是更加详细的示意图: