1. 背景
卷积神经网络CNN(Convolutional Neural Network,又称ConvNet)保留了空间信息,因此可以更好地用于图像分类。
卷积操作基于仔细甄选的局部感受野,在多个特征平面共享权值;之后全连接层基于传统的多层感知机,使用softmax作为输出层。
2. 网络组成
2.1 局部感受野
卷积:把相邻输入神经元的子矩阵与下一层的单个隐藏神经元连接,这个隐藏的单个神经元就代表一个局部感受野。
CNN有多个叠加在一起的滤波器,用来独立识别图像不同位置的特定视觉特征,这些特征在最初的网络层中非常简单,并随着网络层次的加深变得越来越复杂。
(1)padding='same': 表示保留边界处的卷积结果,输入边界填充为0,其输出与输入大小相同;
(2)padding='vaild': 表示只对输入和滤波器完全叠加的部分做卷积计算,其输出小于输入。
2.2 共享权重和偏差
2.3 池化
所有的池化操作都是对一个给定区域进行汇总运算。
汇总特征平面的输出(把这些子矩阵聚合成单个的输出值),进而描述相关联的物理区域的意义。
2.3.1 最大池化
2.3.2 平均池化
3. 应用
一维卷积主要用于声音和文本数据在时间维度上的处理;
二维卷积(高*宽)主要用于图像数据的处理;
三维卷积(高*宽*时间)主要用于视频数据的处理;
3.1 LeNet网络
特点:让较低的网络层交替进行卷积和最大池化运算,对简单几何变换和扭转具有很好的鲁棒性。