AlexNet学习笔记(2)

news2024/10/5 23:29:40

里面 有些东西 对于现在来说都是错误的

而且由大量的细节对于现在来说没有必要

而且是过度的enginnering

一篇论文的第一段通常是讲一则故事

我们在做什么研究 哪个方向 有什么东西然后为什么很重要

正则化 regularization好像没有那么重要,并不是最关键的

最关键的是 你神经网络的设计

设计得好 哪怕没有正则化 都可以出结果的

AlexNet第一段介绍了 大数据集的好处,从当初的cifar10  到2012那个时候的ImageNet

第二段作者表示想做大cnn ,CNN做大很容易但是 也会引发两个问题

1.过拟合

2.很难训练

在写作程度上,第二段有个问题 在当时CNN并不普及 半句话没有提别人的算法 

是一个很窄的角度

写的时候要提及别的方向 做一个稍微公平的introduction

第四段讲了 这篇paper的贡献contribution

1.train 了一个当时最大的网络 得到了一个很好的结果 

2.写了一个实现GPU上性能很好的 2d的卷积

3.新的,不常见的 特性来提升网络的性能和降低训练训练的时间

4.一些防止过拟合的方法

5.深度很重要,少了一层效果会差一些(现在看来不全对,深度和宽度一样重要 还有就是需要调好参数)

在数据集的最后一段有一个小细节

imagenet的图像分辨率不同大小并不是统一的

Alex就把每张图片变成256256

短边先减到256 长边按高宽比下降

长边不出意外会有多余 以中心为界能把两个边会给你裁掉

 不抽特征(sift) 原始上做的

之后的卖点也会是end to end

简单有效的东西是能够持久的

第三章 是整个网络的架构

relu 非线性的东西Hinton

 

tan h 和SIGMOD

饱和的非线性激活函数会比那些非饱和的要慢

用了relu训练的特别快

而且 Relu比较简单 

 

框表示每一层的输入输出这个数据的大小

有两个GPU

我就把 整个网络切开

不过 在第三层的时候 两格各自的输出都需要前面一层的输出结果

 这个时候2块GPU会通讯一次

很瘪的很宽的图片然后把它高宽慢慢的变小,但是深度的慢慢的增加
 

随着深度的增加 我把空间信息压缩

在过程中我们发现我们的通道数在慢慢的增加

注意哦 这理由选一个细节

这个channel是干嘛的 

这里的每个通道你可以当做是看待一种特定的模式

好像不说人话

一个channel 对应一个 feature

拿这个举例 这个model能够学到了图片中间的192种不同的模式

模式当做是一种知识吧 比如在识别猫的时候 猫的腿 猫的嘴巴 等等

而这个空间信息换来的是我们的语义信息越来越丰富

图像的底层特征、高层特征是什么,语义信息是什么意思_:)�东东要拼命的博客-CSDN博客_图像的低级特征往往是泛化的,如纹理,颜色等于什么

 我们在继续往后 就进入了全连接层

 每一个 搞一个2048的全连接

最后的结果拼回成一个4096的

224224*3的image 最后进入的分类层的时候就是一个 4096的一个向量

然后用一个 线性分类器去做链接

那也就是 可以理解为 你最后看到的没有任何图片信息了哈哈 

只能看到一堆数字 而这一对数字能够很好地学到图片的语义信息

你的工作要有一定的通用性 这句话对于当时来说是正确的

而当现在更大的模型出来之后 model parallel 又是一个很亮的点了

而第四节讲的是 如何降低过拟合

1.data augmentation

2.RGB的channel做一些改变(PCA主成分分析)

3.dropout(其实不是在做模型的融合,更多的是的L2正则项)没有dropout过拟合会非常严重,但是加了之后训练速度会慢上两倍

现在来看 dropout在attention和全连接上还是非常有用的

AlexNet 比较可学的点是 使用了sgd 随机梯度下降 

因为sgd的里面的噪音对我们的模型泛华能力是有帮助的

weightdecay 相当于L2regularization

偏移本质上如果你的数据平衡一些的话,初始化为0

现在会用cos来平滑的降低我们的学习率(红线)

 蓝色线为Alexnet中的学习率随训练轮数的变化

不过在这里 我想和大家分享一下第一学期跑分类网络遇到的两个准确率

一个是验证集的准确率 一个是测试集的准确率

验证集是可以拿来调参的 表示训练中的拟合程度

而测试集则代表着真正的detect的效果 

这里吴恩达大佬有做很好的解释 用了偏差和方差来描述欠拟合和过拟合

这里也告诉大家 不用太高的准确率或者精度 八九十就差不多了

在底层的神经元或者说前面的神经层学到的是一些局部的信息低级信息

比如说纹理和方向我在笔记的前面有引用过自己写的文章这里再贴出来

图像的底层特征、高层特征是什么,语义信息是什么意思_:)�东东要拼命的博客-CSDN博客_图像的低级特征往往是泛化的,如纹理,颜色等于什么而偏上一点的学到的是全局一点 头 脸动物 高级一点的

而至于这个NN的可解释性一直比较好的研究方向 

室友的师兄发了顶刊 羡慕 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/125819.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

前端监控系统的搭建

UI自动化测试库 puppeteer:https://zhuanlan.zhihu.com/p/524254998 - google出品 cypress - 据说比puppeteer好用 前端监控体系 性能监控 异常监控 行为监控:埋点体系 主动监控 被动监控 前端性能数据捕获: 打点方式,结…

pyqt5 QPainter绘制图形,并旋转

PyQt5 的绘图系统使用户可以在屏幕或打印设备上用相同的 API 绘图,QPainter 是用来进行 绘图操作的类,一般的绘图设备包括 QWidget、QPixmap、QImage 等,这些绘图设备为 QPainter 提供了一个“画布” QWidget 类是所有界面组件的基类&#xf…

【细节注入模型】

Detail-Injection-Model-Inspired Deep Fusion Network for Pansharpening (细节注入模型启发的深度融合网络全色锐化算法) 全色锐化是一种图像融合方法,其目的是将低空间分辨率的多光谱(MS)图像与高空间分辨率的全色…

FFmpeg学习笔记--FFplay简单过滤器、FFmpeg命令参数

目录 1--FFplay简单过滤器 2--FFmpeg命令参数 2-1 主要参数 2-1-1 -i设定输入流 2-1-2 -f设定输出格式 2-1-3 -ss设定开始时间 2-1-4 -t设定时间长度 2-1-5 代码实例 2-2 音频参数 2-2-1 -aframes设置输出的音频帧数 2-2-2 -b:a设置音频码率 2-2-3 -ar设置音频采样…

SVG 安全

一 任务目标 本篇文章的目的有:[ ] 了解 SVG 漏洞[ ] 了解 SVG 常见防护手段[ ] 搜寻 SVG 数据安全性校验和过滤的库[ ] 了解如何使用此类库来进行 SVG 上传防护[ ] 阅读源码,能明确讲述此类库做了什么如果对你有所帮助,不妨点赞、评论、收藏…

Windows系统安装Git教程

今天给大家介绍Windows系统安装Git命令。 一、Git版本控制工具简介 git是一个开源的分布式版本控制系统。所谓版本控制系统,是开发者最重要的工具之一,可以有效的解决版本的同步以及不同开发者之家的通信问题,提升协同开发的效率。版本控制…

JAVA数据类型及转换

一、数据类型 数据类型字节数byte字节型占用1个字节取值范围:-27 ~ 27-1-128~127short短整型占用2个字节取值范围:-215 ~ 215-1-32768~32767,在实际开发中使用较少int整型占用4个字节取值范围:-231 ~ 231-1-2147483648-214748364…

大道至简:数据库的终极未来

墨天轮2022年12月份的报告已经出炉,这一期的主题是:大道至简,自治为王。在公众号回复:下载 可以获得各期报告下载链接。数据库的终极未来是什么?这是行业里一直在探讨的命题,复杂但是也简单。大道至简01Or…

硬盘无法格式化怎么解决?数据丢失怎么恢复?

有时遇到一些特殊情况,需要我们对电脑磁盘进行格式化。但是硬盘无法格式化,这时我们应该怎么进行操作?你可以根据下面的操作,通过磁盘的创建权限,或者通过磁盘管理来进行格式化,一起来看看下面的简单操作&a…

威固的MOM,你的WOW 「 WOW 手武之道」威固巅峰技术交流赛圆满收官

近日,由全球特种材料公司伊士曼旗下汽车膜品牌威固(V-KOOL)举办的2022威固WOW手武之道技术交流会&PK赛,顺利收官。来自各地服务商的多位技师光芒尽显,展示贴装艺术,分别赢得广州站、南京站、郑州站及成…

WEB应用安全测试丨Acunetix功能简介

快速查找并修复使您的Web应用程序面临攻击风险的漏洞。享受更多的安心——无需花费更多有限的时间。 产品功能 发现与爬行 01、发现所有需要扫描的东西 Acunetix会自动创建所有网站、应用程序和API的列表,并使其保持新状态。 这意味着您不会留下未扫描且容易受到…

00后少年的心力之作(已开源) | heartt(心力算法)

心力之作: 综合性极强的文本摘要算法: heartt(心力算法) 大家好,我是 heartt 算法的作者。我今年 13 岁,是一名热爱编程的学习者。 今天,我要向大家介绍我的新算法:heartt。 00后少年的心力之作(已开源) | …

xxx 拘留室项目

1.项目介绍 本项目用于当地拘留室,定位:监控、值班系统,项目时间:十二月。 系统涉及人员:值班人员、拘留人员 设备:摄像头(海康)、门禁(中控安防)、声光报警…

特色功能(锐捷云桌面篇)

大家好,我是小杜。转眼居家办公已经一周多了,有没有小伙伴和小杜一样,感觉还是在公司上班好,进入状态快呢。现在的主要精力是业务上,处理完对应业务后,就开始了“快乐”的学习了。还是相信之前纯粹的学习时…

常见的5种数据分析方法有哪些?

看大家介绍了那么那么多的数据分析方法,但不同的数据分析方法使用场景不同,A常用的B不一定常用。 所以这篇只介绍5种基于逻辑层面的,几乎人人都会用的数据分析方法。 先来分享一下数据分析6大步骤: 按照这6个步骤,结合…

uni-app的条件编译

条件编译了解 前言: 由于本次业务有 PC 端H5 页面,还有 手机端的H5页面,不同的端,模块展示可能不同,但是大部分功能又是相同的。 如果通过简单的 if…else… 判断不同端,调用相应的 API 或 展示相应的模块…

设计模式——设计思想

设计模式——设计思想一、面向对象的四大特性:1、封装2、抽象3、继承4、多态二、抽象类和接口类1、抽象类和接口的语法特性2、抽象类和接口存在的意义3、抽象类和接口的应用场景4、抽象类和接口的区别三、面向对象编程与面向过程编程1、面向对象编程和面向对象编程语…

mac中nvm管理node

目录检查电脑上是否存在node卸载node安装nvm报错查看本机的ip地址修改host文件重新安装nvm - 报错重新安装nvm - 报错安装完成兼容性运行之前的项目 -> 报错运行之前的项目 -> 报错常用命令nvm安装之前若是电脑上存在node,要先将node卸载掉检查电脑上是否存在…

catia建模圆柱直齿轮和斜齿

1 圆弧近似方案 参考 7.1 直齿轮(简单)1_哔哩哔哩_bilibili 2 渐开线生成点--》生成样条曲线方案 参考 7.2渐开线齿廓直齿圆柱齿轮(1)_哔哩哔哩_bilibili xd基圆半径rb *sin(t*PI*1rad)-基圆半径rb *t*PI*cos(t*PI*1rad) yd基…

如何做好性能压测(一):压测环境的设计和搭建

本文是阿里巴巴 PTS 团队《Performance Test Together》系列专题分享,霍格沃兹测试学院经特别授权转载,也会结合学员实际需求组织大咖公开课主题分享,文末有福利! 性能压测,是保障服务可用性和稳定性过程中&#xff0c…