本文重点
卷积神经网络中为什么要使用卷积,它和全连接层相比,卷积层的两个主要优势在于参数共享和稀疏连接。
参数比较
对于一张32*32*3图片:
如果用了 6 个大小为 5×5 的过滤器,输出维度为 28×28×6,如果使用卷积层我们的参数就是5*5*3*6+6=456
如果使用全连接32×32×3=3072,28×28×6=4704,4074×3072≈1400 万,所以要训练的参数很多,这还仅仅是32*32*3的小图片。
参数越多,需要存储越多的海量参数,同时还需要海量的计算,所以卷积神经网络相对于全连接神经网络更加具备优势。
卷积神经网络参数少的原因
卷积网络映射这么少参数有两个原因:
一是参数共享
比如垂直边缘检测如果适用于图片的某个区域,那么它也可能适用于图片的其他区域。每个特征检测器以及输出都可以在输入图片的不同区域中使用同样的参数,以便提取垂直边缘或其它特征。它不仅适用于边缘特征这样的低阶特征,同样适用于高阶特征,例如提取脸上的眼睛,猫或者其他特征对象。
直观感觉是,一个特征检测器,如垂直边缘检测器用于检测图片左上角区域的特征,这个特征很可能也适用于图片的右下角区域。因此在计算图片左上角和右下角区域时,你不需要添加其它特征检测器。也就是说整张图片共享特征检测器,提取效果也很好。
<