问题
简述CNN分类网络的演变脉络及各自的贡献与特点
综述
深度学习的浪潮就是从CNN开始的,它结构形态的变化也见证着这门技术的发展。现在涌进来学习深度学习的大部分人都是做计算机视觉的,因为这个门槛相对较低,业界数据集开源了很多,也比较直观,而且对硬件设备的要求也没语音那么大,导致现在就业竞争非常大。CV各种任务的网络结构变形更是日新月异,让人眼花缭乱,但是不管怎么变,基本都是基于卷积、池化和全连接这三件套。所以这篇文章主要是想回归一下最初CNN网络是怎么发展变化的。
LeNet-5
LeNet 被视为CNN的开山之作,是LeCun大神在1998年提出的,定义了基本组件:卷积、池化、全连接,俗称CPF三件套。主要用于手写数字识别10分类问题,被广泛应用在金融领域。LeNet的结构非常简单,如名字所示的那样,主要有5层(这里没有统计紧跟每个卷积层后的 2x2 池化层,如果加上池化层,应该是7层),包括:两层 5x5 卷积层和三层全连接层。下面便是LeNet-5架构示意图。
LeNet 的关键点与贡献:
- LeNet 是第一个将反向传播应用于实际应用的CNN架构,突然之间,深度学习不再只是一种理论。
- 定义了基本组