一. CNN卷积神经网络与传统神经网络的不同

1. 模型图

2. 参数分布情况

3. 卷积神经网络和传统神经网络的层次结构

4. 传统神经网络的缺点：

二. CNN的基本操作

1. 卷积

2. 池化

三. CNN实现过程

1. 算法流程图

2. 输入层

3. 卷积层

4. 激活层

5. 池化层

6. 全连接层

二. CNN卷积神经网络的过程

1. 正向传播过程

2. 反向传播过程（算法核心）

三. 卷积神经网络代码

1. CnnLayer类

2. Dataset类

3. FullCnn类

4. LayerBuilder类

5. LayerTypeEnum类

6. MathUtils类

7. Size类

四. 运行结果

一. CNN卷积神经网络与传统神经网络的不同

1. 模型图

传统神经网络和卷积神经网络的大致模型如下图所示：

2. 参数分布情况

首先我们根据矩阵运算划分——传统神经网络处理过程是一维过程，卷积神经网络（CNN）处理过程是多维的，更进一步解释就是传统神经网络的数据输入仅仅是一个向量，CNN的数据输入是一张图片这个图片有深度depth、高度height和宽度width。卷积神经网络：卷积神经层由多个特征面构成，每一个特征面则是由很多个神经元构成，卷积核代表参数w。传统神经网络：每层由排成一列的神经元构成；神经元：每个神经元代表矩阵的一个列向量Xi，神经元连线代表系数W。每一个像素值，都是一个神经元，每个神经元代表了一个特征。

3. 卷积神经网络和传统神经网络的层次结构

传统神经网络：

输入层：的每个神经元代表了一个特征
隐藏层：特征提取
输出层：输出层个数代表了分类标签的个数

卷积神经网络：

多通道输入，多卷积核，输出的通道数=卷积核的个数。输入层->卷积层->激活层->池化层->全连接层
数据输入层：对原始数据进行初步处理，使卷积神经网络能有更好的效果
卷积层：提取特征（矩阵大小个数都变化）；卷积核遍历图片上每一个像素点
激活层：计算结果通过一个激活函数加一个非线性的关系，使能逼近任何函数。
池化层：数据压缩，提取主要特征，降低网络复杂度；不改变矩阵的深度，缩小矩阵，减少网络的参数（矩阵变小，个数不变）
全连接层：分类器角色，将特征映射到样本标记空间，本质是矩阵变换。将特征图拉成一维向量，将每个特征点作为一个神经元进行分类任务。把所有局部特征结合变成全局特征，用来计算最后每一类的得分。

4. 传统神经网络的缺点：

首先将图像展开为向量会丢失空间信息（局部相关性被破坏）；其次参数过多效率低下，训练困难；同时大量的参数也很快会导致网络过拟合。

相较之下，卷积神经网络（Convolutional Neural Network，CNN）是一种深度学习的模型，它可以有效地处理图像等高维数据。卷积神经网络的主要特点是使用卷积层和池化层来提取图像的局部特征和降低维度，从而减少参数数量和计算量。

二. CNN的基本操作

1. 卷积

介绍完卷积神经网络和传统神经网络，我们这里继续谈谈基本概念——卷积。

对于一张普通的图片我们人类需要进行识别，首先做的事情是不是判断出它有什么特征啊？这个是很关键的一步，例如下图是汽车的一张图片，那么我们是怎么样判断的呢？

首先我们是不是看它有轮子？它有车灯？前挡风玻璃？车门把手等等？，有了这些东西，好了那我们就可以判断他是个汽车

回顾我们人类的判断过程，最关键的一步就是对于特征的提取，而这里所说的卷积就是对于特征提取的一个方法。

我们从卷积的定义开始说起，很多人在接触卷积这个概念时, 会感到很奇怪. 我们知道卷积的定义是这样的：给定两个函数 $f(x)$ ， $g(x)$ ，定义卷积：

$h(x)=(f*g)(x)=\int_{-\infty }^{+\infty }f(s)g(x-s)ds$

也就是说，给两个函数 $f(x)$ 和 $g(x)$ ，我们把它卷积起来成为 $h(x)$ ，具体构造如上。它的物理意义大概可以理解为：系统某一时刻的输出是由多个输入共同作用（叠加）的结果。放在图像分析里， $f(x)$ 可以理解为原始像素点(source pixel)，所有的原始像素点叠加起来，就是原始图了； $g(x)$ 可以称为作用点，所有作用点合起来我们称为卷积核（Convolution kernel）；卷积核上所有作用点依次作用于原始像素点后（即乘起来），线性叠加的输出结果，即是最终卷积的输出，也是我们想要的结果。

对于图像的卷积处理，我们继续来看。每一张照片其实就是一个数字矩阵，只不过彩色照片每个像素点不是用0、1表示而是用更广的数字表示，这里为了简便就设定为黑白照片，像素点是由0、1组合。假设我们现在有一张图片image它对应的像素点是这样的：

现在我们需要有一个特征提取器，也叫卷积核，这个东西主要是将上面的图片针对于卷积核的特征提取出来，然后构建成为一个新的矩阵，这个新的矩阵就有输入图片image的特征。先假定我们有一个卷积核如下图所示：

对于它的提取过程——将image中大小和kernel大小相等部分的对应位置相乘，即

为了更好的理解这一过程，下面有一个GIF动态图片

上述过程结束之后，我们得到了一个Feature Map（原image图像通过kernel进行特征提取得到的结果），这个Feature Map只是其中的一个，当然我们可以设置许多的卷积核kernel，用于提取原图片不同的特征，最终得到许多Feature Map，这一部分就是原图片的“核心”，用于辨认原图片的什么特征。

从上面的卷积过程我们不难发现，每次经过卷积大小都会发生改变，那么我们该怎么样保证卷积的结果大小不变呢？这里补充一点——零填充，就是在原本的图像上增加像素点，每个像素点的值都是0。

【动手学计算机视觉】第十一讲：卷积层、池化层与填充 - 知乎

最后我们可以根据卷积的过程得到的Feature Map的图片大小与原图片的大小和卷积核的大小有关系，假设一张图片的大小为 $W_{1} \times H_{1}\times D_{1}$ ，卷积核的大小为 $F\times F$ ，步长为 $S$ ，总共有 $K$ 个卷积核，零填充的列数为 $P$ ，则可得到输出的Feature Map的大小为：

$W_{2}=(W_{1}-F+2P)/S+1$

$H_{2}=(H_{1}-F+2P)/S+1$

$D_{2}=K$

2. 池化

池化过程在一般卷积过程后。池化（pooling）的本质，其实就是采样。Pooling 对于输入的 Feature Map，选择某种方式对其进行降维压缩，以加快运算速度。采用较多的一种池化过程叫最大池化（Max Pooling），其具体操作过程如下：

池化过程类似于卷积过程，如上图所示，表示的就是对一个 4×4 feature map邻域内的值，用一个 2×2 的filter，步长为2进行“扫描”，选择最大值输出到下一层，这叫做 Max Pooling。

还有一种叫平均池化（Average Pooling），就是从以上取某个区域的最大值改为求这个区域的平均值，其具体操作过程如下：

如上图所示，表示的就是对一个 4×4 feature map邻域内的值，用一个 2×2 的filter，步长为2进行“扫描”，选择平均值输出到下一层，这叫做 Average Pooling。

三. CNN实现过程

1. 算法流程图

在这里对于传统全连接神经网络模型不详细赘述，有兴趣的请参考——文章，卷积神经网络一般由以下层实现

数据输入层/ Input layer
卷积计算层/ CONV layer
ReLU激励层 / ReLU layer
池化层 / Pooling layer
全连接层 / FC layer

对应的模型过程如下图1所示：

2. 输入层

这里我们主要是要明白整个CNN模型的输入数据是什么，众所周知，一张图片就是一个超大的矩阵。输入层主要是n×m×3 RGB图像，这不同于人工神经网络，人工神经网络的输入是n×1维的矢量。

3. 卷积层

之前我们学习了卷积的概念，这里补充一些想法，便于理解后文
3.1 为什么选择卷积？
有时候可能会问自己，为什么要首先使用卷积操作？为什么不从一开始就展开输入图像矩阵？在这里给出答案，如果这样做，我们最终会得到大量需要训练的参数，而且大多数人都没有能够以最快的方式解决计算成本高昂任务的能力。此外，由于卷积神经网络具有的参数会更少，因此就可以避免出现过拟合现象。

3.2 多个FeatureMap的卷积

在上文中，我提过一张图片的卷积操作，那个部分是卷积操作的基础，但是假设我们进行到卷积层2的话，又该怎么处理多个图片输入的卷积操作呢？

答：现在有多个featuremap输入，我们要对其进行卷积操作，之前的卷积操作只是针对于一张图片（一个输入），现在我们的输入有多个图片，我们假设现在需要进行卷积操作的图片为 $a_{j}\ \ \ \ (j=1,2,3...)$ ，我们的卷积核为 $K_{i} \ \ \ \ (i=1,2,3...)$ ，那么现在我们的卷积结果为：

$Z_{i}=\sum_{m}^{j=1}[conv(a_{j},K_{j})]$

卷积之后的数量大小和卷积核的数量大小一致。

4. 激活层

这一部分与之前写的BP神经网络激活函数的作用一致，于是就不再详谈，不过这里还是列出我在后面会用到的激活函数。Sigmoid函数是一个在生物学中常见的S型函数，也称为S型生长曲线。在深度学习中，由于其单增以及反函数单增等性质，Sigmoid函数常被用作神经网络的激活函数，将变量映射到[0,1]之间。

Sigmod函数：

Sigmod导函数：

图像：

5. 池化层

详见上文二. 2。

6. 全连接层

我们首先看到上面的图1，通过不断地卷积池化，可以将一个高维的图片降维成一个低维的图片...

需要补充...

二. CNN卷积神经网络的过程

1. 正向传播过程

所有数学推导都基于如下图2所示

正向传播过程比较简单，主要是按照上图2的过程一步一步计算即可。

输入层：

假设我们输入的一张L×W×H的图片（输入一个矩阵）。

卷积层1：

首先对于卷积层1，随机生成多个卷积核（大小与要求一致，相关概念参考——二. 1卷积）我们得到一个卷积集合