文章目录
- 卷积神经网络的应用领域
- 卷积的作用
- 卷积特征值的计算方法
- 得到特征图表示
- 步长与卷积核大小对结果的影响
- 边缘填充方法
卷积神经网络的应用领域
- 检测任务
- 分类与检索
- 超分辨率重构
- 医学任务
- 无人驾驶
- NVIDIA Tegra X1(显卡 GPU)
卷积的作用
卷积神经网络(cnn)与传统神经网络(nn)的区别:
传统神经网络是将像素点输入,例如333就是将27个像素点输入进去,而对于卷积来说就是直接输入三维空间333进去类似右边的一个空间结构。
整体架构:
- 输入层(也就是一张照片)
- 卷积层(提取特征)
- 池化层(压缩特征)
- 全连接层
卷积层通过先将32325分块,取其中的一块出来,再从中根据提取的像素点矩阵与w权重矩阵进行相乘得出相对应的特征值。
卷积特征值的计算方法
首先先理解一个概念:三颜色通道实际上就是将一张照片的图片实际上可以分成三张,比如RGB通道,实际上就是R通道的一张照片,G通道的一张照片,B通道的一张照片。
卷积内元素相乘,不同组相加,值得关注的是,仍需要加上b(偏置值)基本公式:
不同通道之间的数字直接进行相加。
得到特征图表示
卷积的结果是得到一张特征图:
即右边绿色的特征图,但是实际上我们传入的数据实际上是有多组数据的,也就是说我们最后得出的特征图也是有多份的,叠加在一起又是一个三位的矩阵。
具体的计算过程:
先进行分析:竖着的3个代表着三个颜色通道,然后右边:
这个代表着有两组特征图。具体的计算过程就是:
-5 = (01+01+01+1-1+2*-1+20+1-1+11+20)+其他的两个通道的相对应的值(一个是0一个是-3)+偏置值b(1)
上述就是第一个特征图的一行二列的一个元素的计算过程。其他的也相同。
然后由于有两个特征图,所以相同位置可以计算出两个不同的值,也就是最后得出的也就有两张图表。
步长与卷积核大小对结果的影响
实际上我们的卷积过程并不是只有一步,实际上我们是先将有的图如下图所示的32323的图片做一次6特征图的卷积,得到28286的三维矩阵,拿这个三维矩阵再次去做10特征图的卷积,得到242410的三维矩阵······这也就是堆叠的卷积层。
卷积层涉及的参数:
- 滑动窗口步长(即取窗口时下一组距离本组的距离)
- 卷积核尺寸(图为3*3的卷积核)
- 边缘填充(详见下)
- 卷积核个数(特征图个数)
边缘填充方法
可以看到+pad 1,实际上就是在外围的边界加上了一圈0,目的是为了缓解内部的贡献程度更大,外部的贡献程度更小的边界效应。