2012年发表
imagenet 一百二十万的图片 1000个种类
cv 对于刷榜 是非常在意的
AlexNet
有六千万的参数,和65000的神经元
为了减少过拟合 我们使用了dropout
很work 很有效 而且 这篇文章没有conclusion 只有 讨论
当他发现 从5个层里面去掉一个
performence会降低2个点 说明这个深度是很重要的,也有可能参数没有调好
其实从另外的角度来说 不仅是深度很重要 而且 宽度也很重要
在之前的深度学习中,我真的可以 能够 通过训练一个很大的NN,在没有标签的数据集上
把整个东西里面的内在结构提取出来
直到BERT 的兴起 (NLP) 把大家从有监督拉到了无监督的学习上去
但是这个AlexNet的最后 第二层输出的向量的高级语义信息非常好
最后 感谢 沐大老板哈哈