AlexNet网络结构详解

news2025/1/15 12:53:31

AlexNet论文地址:

https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

1、简介

AlexNet是2012年ISLVRC(ImageNet Large Scale Visual Recognition Challenge)竞赛的冠军网络,图像分类的正确率从70%提升到80%,是Hinton(反向传播发明人)和他的学生Alex一起设计的,从AlexNet在ISLVRC 2012夺冠后,深度学习开始迅速发展。

ISLVRC 2012

训练集:1281167张已经标注的图片

验证集:50000张已经标注的图片

测试集:100000张未标注的图片

2、亮点

  1. 首次利用GPU进行网络加速训练
    1. GPU训练和CPU训练区别就是GPU的并行运算能力比CPU强很多,GPU的速度是CPU的20-50倍。
  2. 使用了Relu作为激活函数,而不是传统的Sigmoid和tanh作为激活函数
    1. ReLU是一个比较狠的东西,通常网络在提取特征的时候,数值都是在-1到+1之间,如果你是负数,Relu的做法就是直接给你干没了,就是等于0,这和之前的sigmoid、Tanh大不一样,也就是说不好的特征直接不要了。就这一个点几乎就是对整个深度学习产生了一个彻底的改变
  3. 使用了LRN局部响应归一化
    1. 对局部神经元的活动创建竞争机制,使得其中响应比较大的值变得相对更大,并抑制其他反馈较小的神经元,增强了模型的泛化能力
  4. 在前面两层的全连接使用了Dropout
    1. 所谓Dropout就是直接随机杀死一些神经元,就是一些神经元的权重直接为0,相当于没有了。这个做法可以有效避免过拟合的产生
    2. Dropout和AlexNet都是由Alex的导师Hinton(2018图灵奖获得者)在2012年提出的,AlexNet是Alex和Hinton一起提出的
    3. Dropout论文地址

Dropout就是对一个数据集过度学习

 这个网络可以看成两个部分,因为作者当初是用两个GPU进行训练的,然后上下两个部分是一毛一样的

看第一个卷积

 

原始图像数据的维度是:(224,224,3)

输出维度:(55,55,96)

kernels:48*2 = 96

kernels_size:11

padding:[1,2]

stride:4

 图中没有给出池化的大小

池化

maxpool:1

kernel_size:3

padding:0

stride:2

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/885469.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《财讯》期刊简介及投稿要求

《财讯》杂志是经国家新闻出版总署批准,面向国内外公开发行的“全国综合性教育理论学术期刊 面向全国各级各类大、中专经济院校工作者;银行、经贸委、财政及行政管理人员,是作者科研、晋级等方面权威依据的优秀期刊。 主管单位:…

什么是冒烟测试?什么时候做冒烟测试?冒烟测试的用例哪儿来的?

什么是冒烟测试? 冒烟测试(Smoke Testing) 是软件测试中的一项基础测试,也称为构建验证测试(Build Verification Testing),通常用于确认新版本的软件是否可以进行基本的功能测试或者是否能够正…

常见期权策略类型有哪些?

这几天在做一个期权策略类型的整理分类,怎么解释期权策略,期权策略是现代金融市场中运用非常广泛、变化非常丰富、结构非常精妙的金融衍生产品;同时也是一种更为复杂也更为灵活的投资工具,下文介绍常见期权策略类型有哪些&#xf…

图片转换成pdf格式?这几种转换格式方法了解一下

图片转换成pdf格式?将图片转换成PDF格式的好处有很多。首先,PDF格式具有通用性,可以在几乎任何设备上查看。其次,PDF格式可以更好地保护文件,防止被篡改或者复制。此外,PDF格式还可以更好地压缩文件大小&am…

BitLocker已加密 - 解决方案

BitLocker介绍 Bitlocker 是 Windows 磁盘加密功能,旨在通过为整个卷提供加密来保护数据。 BitLocker 解决了因设备丢失、被盗或不适当解除授权而遭受数据盗窃或泄露的威胁。 BitLocker虽然增强了数据安全性,但也增加了用户的使用困难度,因为…

Ansys Zemax | 手机镜头设计 - 第 1 部分:光学设计

本文是 3 篇系列文章的一部分,该系列文章将讨论智能手机镜头模组设计的挑战,从概念、设计到制造和结构变形的分析。本文是三部分系列的第一部分,将专注于OpticStudio中镜头模组的设计、分析和可制造性评估。(联系我们获取文章附件…

【猿灰灰赠书活动 - 02期】- 【Java从入门到精通2023年7月最新(第7版)】

说明:博文为大家争取福利,与清华大学出版社合作进行送书活动 图书:《Java从入门到精通》 一、好书推荐 图书介绍 Java入门经典,95万Java程序员的入行选择。配备升级版Java开发资源库,在线大咖课在线答疑,学…

shell脚本之函数及数组

shell脚本之函数及数组 一函数1.1函数的作用1.2函数的基本格式1.3函数的注意事项1.4函数调用的方法1.5函数的返回值1.6函数的传参1.7在外部调用函数1.8函数变量的作用范围1.9函数的递归 二.数组2.1shell数组的定义2.2定义属组的方式2.3数组的数据类型2.4获取数组的数据列表2.5获…

回归预测 | MATLAB实现GRU门控循环单元多输入多输出

回归预测 | MATLAB实现GRU门控循环单元多输入多输出 目录 回归预测 | MATLAB实现GRU门控循环单元多输入多输出预测效果基本介绍程序设计往期精彩参考资料 预测效果 基本介绍 MATLAB实现GRU门控循环单元多输入多输出,数据为多输入多输出预测数据,输入10个…

2023电商销售额增幅全球第一!这个国家潜力正在爆发!

随着欧、美等跨境电商市场日趋饱和,拉美地区正逐渐成为全球电商投资的热点。这让该地区增长最强劲的电商市场——阿根廷——成为众多跨境卖家寻求增长与突破的新选择。 那么,阿根廷为什么是跨境卖家扩展电商业务的新机会?阿根廷电子商务市场…

ps变形怎么增加网格? PS怎么变形?

PS图片怎么变形:打开PS,找到需要处理的图片,复制图层,点选“编辑”—“变换”—“变形”,出现变形网格后,按需要操作就可以了。 PS是一款图片编辑的处理软件,它有很多的功能,在图形…

一百五十八、Kettle——Kettle各版本及其相关安装包分享(网盘链接,不需积分、不需验证码) 持续更新、持续分享

一、目的 最近因为kettle9.3的shim问题看了好多博客,都没有网盘分享。后来有一位博主分享了kettle9.2的shim安装包,已经很感谢他,但是是博客分享,下载还需要搞验证码下载码之类的。 kettle9.2的shim安装包下载好后,一…

基于LVQ神经网络的人脸朝向识别

1案例背景 1.1人脸识别概述 人脸识别作为一个复杂的模式识别问题,近年来受到了广泛的关注,识别领域的各种方法在这个问题上各显所长,而且发展出了许多新方法,大大丰富和拓宽了模式识别的方向。人脸识别、检测,跟踪、特征定位等技术近年来一直是研究的热点。人脸识别是人脸应用…

springboot结合shiro实战-身份认证

目录 环境搭建 配置shiro环境 总结 hello,大家好,我们写任何企业级项目基本都会需要做权限,权限包含身份认证和授权。 所谓身份认证,就是证明你是你。 所谓授权就是明白你登录之后能干什么。 现在,让我们用sprin…

根据一棵树的两种遍历构造二叉树

题目 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵树的中序遍历,请构造二叉树并返回其根节点。 示例 1: 输入: preorder [3,9,20,15,7], inorder [9,3,15,20,7] 输出: [3,9,20,null,null,…

【Java从0到1学习】09 正则表达式

1. 正则表达式概述 在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。 正则表达式,又称正规表示法、常规表示法&#xff…

js watermark实现水印效果

2023.8.15今天学习了如何给页面添加水印,效果如下: 1.创建watermark.js文件: import id from "element-ui/src/locale/lang/id";let watermark {} let setWatermark (str) > {let id 1.23452384164.123412415if (document.g…

智安网络|深入比较:Sass系统与源码系统的差异及选择指南

随着前端开发的快速发展,开发人员需要使用更高效和灵活的工具来处理样式表。在这个领域,Sass系统和源码系统是两个备受关注的选项。 Sass系统 Sass(Syntactically Awesome Style Sheets)是一种CSS预处理器,它扩展了CS…

管理类联考——逻辑——真题篇——按知识分类——汇总篇——一、形式逻辑——三段论——第一节——推结论

文章目录 第一节 三段论-推结论题-三段论-结构-推结论:所有A是B;所有B是C;得:所有A是C。(最简单的模型)真题(2011-27)-三段论-推结论真题(2011-28)-三段论-推…

react-router v6版本使用记录

1:首先安装依赖 最基本的使用,引入相关依赖,开箱即用 import { BrowserRouter, Link, Routes, Route } from "react-router-dom" import Home from "./home" import About from "./about"function App () {// …