一、基本结构
CNN的大概模式可以总结为:卷积层+池化层+全连接层+激活函数
而一些比较大型的网络如VGG一般将CNN作为构成单元进行堆叠,而内部卷积核和池化也可以堆叠多个。各个部分的功能如下:
卷积:特征提取
池化:降维和防止过拟合
Flatten:将二维的特征数据拉平(展成一维)
全连接层:汇总得到的信息
激活函数:softmax(多分类);sigmoid(二分类)
二、具体组成
①卷积操作
用卷积核滑过输入,将卷积核对应位置的值相乘后求和,卷积核所在的区域为感受野
感受野:卷积核在输入上的投影,因为其每次只能看到一部分所以等同于部分连接
Ps.部分连接是相对于全连接而言的
在外部填充0被称为padding,用于防止边缘特征被忽略。
卷积的意义在于将较大的原始图像转换为较小的输出,每个卷积核都有一个对应的feature map,提现了对原图的特征提取。
多维卷积:如彩色图像的三维卷积等同于其三个颜色通道分别进行二维卷积。
更多细节请参见:卷积运算与卷积核DLChttps://blog.csdn.net/weixin_37878740/article/details/127916612
②池化
将一定区域内的值经过一定转换后输出一个值(来代替整个区域的值),根据计算方式不同分为:平均池化和最大池化;池化也称“下采样”。
池化的作用有:①减少参数量
②防止过拟合(保留数据的原始特征)
③为网络带来位移不变性(即图像一定范围的位移不影响计算结果,移除池化即可消除此性质)
③平坦(Flatten)
将二维的特征图展成一维的常向量(用以送给全连接层)
④全连接层
用于建立特征图与输出之间的映射。
⑤激活函数
参见:神经网络(十)激活函数DLChttps://blog.csdn.net/weixin_37878740/article/details/126658339