1. 理论知识
GoogLeNet首次出现在2014年ILSVRC 比赛中获得冠军。这次的版本通常称其为Inception V1。Inception V1有22层深,参数量为5M。同一时期的VGGNet性能和Inception V1差不多,但是参数量也是远大于Inception V1。
Inception Module是Inception V1的核心组成单元,提出了卷积层的并行合并,实现了在同一层就可以提取不同的特征,如下图a。
按照这样的结构来增加网络的深度,虽然可以提升性能,但是还面临计算量大(参数多)的问题。为改善这种现象,Inception Module
借鉴Network-in-Network
的思想,使用1x1的卷积核实现降维操作(也间接增加了网络的深度),以此来减小网络的参数量与计算量,如上图b所示。
备注举例: 假如前一层的输出为100x100x128
,经过具有256个5x5
卷积核的卷积层之后(stride=1,pad=2),输出数据为100x100x256
。其中,卷积层的参数为5x5x128x256+256
。假如上一层输出先经过具有32个1x1
卷积核的卷积层(1x1卷积降低了通道数,且特征图尺寸不变),再