新手入门深度学习 | 6-2:AlexNet(2012)详解

news2025/1/17 6:12:53
  • 🔗 运行环境:python3
  • 🚩 作者:K同学啊
  • 🥇 精选专栏:《深度学习100例》
  • 🔥 推荐专栏:《新手入门深度学习》
  • 📚 选自专栏:《Matplotlib教程》
  • 🧿 优秀专栏:《Python入门100题》
  • 本文选自专栏:🚀《新手入门深度学习》

AlexNet是引起卷积神经网络热潮的一个网络,产生于2012年,一直是神经网络中比较火热的网络之一,赢得了2012年ImageNet竞赛。AlexNet是更深的LeNet,采用ReLu激活函数和最大池化方法,由输入层、卷积层、池化层、全连接层、输出层构成,包含六千万个参数和65000个神经元,计算层有3个卷积层,3个全连接层,最终输出层为1000通道的Softmax。AlexNet利用了两块GPU进行计算,大大提高了运算效率,并且在ILSVRC-2012竞赛中获得了top-5测试的15.3% error rate,获得第二名的方法error rate为26.2%,相比具有很大差距,在学术界产生了巨大的影响力。

AlexNet网络结构简图如图1所示,包含输入层(Input)、输出层(Output)、5个卷积层(Convolutional layer,Conv)、3个池化层(Pooling layer)、3个全连接层(Fully connected layer,FC)。从对图像的处理过程来看,将图片统一处理成为224×224×3的大小作为输入,经过第一个卷积层进行卷积计算提取特征,其中卷积核大小为11×11×3,个数为96个;经过3×3的最大池化(Max pooling)后,输入到第二个卷积层,其中卷积核大小为5×5×48,共256个;下一层经过3×3的最大池化过程后,其输出进行三个连续卷积层计算,第三层卷积层内核大小3×3×256,共384个,第四层卷积层内核大小3×3×192,共384个,第五层卷积层内核大小3×3×192,共256个;再经过3×3的最大池化,以及三个连续的全连接层计算,最后输出1000类的图像识别结果。

图1 AlexNet结构简图

为使卷积神经网络应用到众多的非线性模型中,在卷积层中引入激活函数,对于神经网络的学习和理解复杂非线性函数有着重要意义。激活函数存在每个神经元的输出之后,在神经元输入数据通过加权求和后,经过激活函数计算进行输出。神经网络的学习过程是神经元参数根据期望结果不断更新的过程,这时要通过神经网络的反向传播来计算更新,激活函数对于神经网络的反向传播有着重要的意义。如果神经元没有被激活或者激活状态没有达到饱和,权重的更新速度会非常慢甚至停止。对神经网络的学习造成严重影响。

早期的激活函数有Sigmoid函数,Tanh函数,可以很好地压缩输出,但容易造成梯度消失问题。随着不断的理论积累,学术界发现ReLu函数,LeakyReLu函数等效果更好的激活函数,成为卷积神经网络的首选激活函数。

关于AlexNet实战内容请看文章:🔥【深度学习100例-卷积神经网络(AlexNet)手把手教学 | 第11天】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/731865.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

oracle新建库(表空间)表

文章目录 前言一、sqlplus登录二、表空间1.新建表空间2. 查看表空间3. 查看表空间和对应数据文件4.表空间增加数据文件5.删除单个数据文件(只有一个默认的会删除失败)6.删除表空间及数据文件(慎用) 三、创建新用户并指定表空间1.去掉前缀2.新建用户&…

C语言是一种通用的、面向过程的编程语言

具有以下特点: 简洁而高效:C语言的语法相对简单,同时提供了丰富的编程结构和功能,使得开发者能够用较少的代码实现复杂的任务。C语言的执行效率高,能够直接操作计算机硬件,提供了底层的控制和优化能力。 可…

时间序列预测 | Matlab基于极限梯度提升树XGBoost时间序列预测,XGBoost时间序列预测模型

文章目录 效果一览文章概述部分源码参考资料效果一览 文章概述 时间序列预测 | Matlab基于极限梯度提升树XGBoost时间序列预测,XGBoost时间序列预测模型 评价指标包括:MAE、RMSE和R2等,代码质量极高,方便学习和替换数据。要求2018版本及以上。 部分源码

后端开发常见技术场景

文章目录 1、单点登录这块怎么实现的1.1 概述1.2 JWT解决单点登录1.3 回答要点 2、权限认证是如何实现的2.1 概述2.2 RBAC权限模型2.3 回答要点 3、上传数据的安全性你们怎么控制?3.1 概述3.2 对称加密3.3 非对称加密3.4 回答要点 4、你负责项目的时候遇到了哪些比较…

【Ubuntu学习MySQL——导出数据报错ERROR1290】

将数据表 runoob_tbl 数据导出到 /tmp/runoob.txt 文件中出错: 这是因为mysql有个安全变量限制。可以通过以下语句查看设置的路径,然后将要导入到的文件名称改到此路径下即可。

现场工程师宝典-流式处理的异常现象以及提高吞吐能力的常见优化策略

流式处理区别于按包处理,指的是对处理者而言,面对的是逻辑上无头无尾的数据流。因此,在提取数据流中的包时,就需要遵循其内在的格式,进行头部捕获、提取、校验。然而,如果不考虑TCP等流式数据的异常情况&am…

视频怎么做成二维码?一招轻松制作二维码

怎么把视频做成二维码?现在用二维码来做载体存储视频,这种方法能够有效的减少内存占用,可以将视频储存在云端,他人只需要扫码就能够查看视频。下面来教大家一招关于视频二维码制作(音视频二维码制作-一键免费生成音视频…

Kafka传输数据到Spark Streaming通过编写程序java、scala程序实现操作

一、案例说明 现有一电商网站数据文件,名为buyer_favorite1,记录了用户对商品的收藏数据,数据以“\t”键分割,数据内容及数据格式如下: 二、前置准备工作 项目环境说明 Linux Ubuntu 16.04jdk-7u75-linux-x64scal…

(LFPAK56)BUK7Y7R0-40HX 40V、N 通道BUK9Y6R5-40HX表面贴装汽车用MOSFET器件

汽车用MOSFET将低压超级结技术与先进的封装设计相结合,以实现高性能和耐用性。Trench 9 MOSFET系列产品全部符合AEC-Q101标准,且超越了这一国际汽车级标准的要求,在包括温度循环 (TC)、耐高温栅极偏置 (HTGB)、耐高温反向偏置 (HTRB) 和断续工…

DBETR-1X/180G24K4M反馈型比例压力阀放大器

DBETR-1X/30G24K4M,DBETR-1X/315G24K4M,DBETR-1X/80G24K4M,DBETR-1X/180G24K4M,DBETR-1X/230G24K4M,DBETR-1X/350G24K4M比例溢流阀是一种遥控阀。其设计结构为座阀式直动溢流阀,搭配外置式比例放大器。 这…

挑选适合自己的英文原版书

很多人在阅读英文原版小说时感觉十分吃力,有很多生词或长难句。如何寻找适合自己英文阅读水平的书籍呢?下面推荐一种按蓝思值挑选英文原版书的方法。 首先根据自己的受教育程度,选择对应蓝思级别的英文书。如博士可以选择蓝思值为1300L的英文…

图神经网络:(图像分割)三维网格图像分割

文章说明: 1)参考资料:PYG的文档。文档超链。斯坦福大学的机器学习课程。课程超链。(要挂梯子)。博客原文。原文超链。(要挂梯子)。原文理论参考文献。提取码8848。 2)我在百度网盘上传这篇文章的jupyter notebook以及预训练模型。提取码8848. 3)博主水平…

qt信号与槽

信号与槽的概念: 1>信号:信号就是信号函数,可以是组件自身提供,也可以是用户自己定义,自定义时,需要类体的signals权限下进行定义,该函数是一个不完整的函数,只有声明&#xff0…

输入一个链表,输出该链表的倒数第 k 的结点

一、思路 假设 K 是 2,根据下面的图片可以看出,倒数第 K 个结点就是 45。 需要注意的前提是,K 不能是负数也不能是 0 并且也不能超过链表的结点个数,因为要保证 K 是在链表的范围里,才能找到 K,然后返回这…

【网络】TCP三次握手和四次挥手(感性理解)

目录 三次握手 文字描述三次握手过程 为什么是三次握手? 什么是SYN洪水? 连接和半连接队列 一次、两次握手行不行,四/五/六次握手行不行? 三次握手一定会成功吗? 三次握手的过程中可不可以携带数据 TCP中的IS…

模块化规范

常用模块化有两种规范,commonJS和ES6 一:两者区别 二:如何转义? 我们常遇到的使用场景是,在commonJS的模块里需要引入ES6规范的模块。这时就需要把ES6模块转译为commonJS规范的模块,否则报错 转义工具有…

javassist 02 implement interface

创建 interface package com.wsd;public interface AccountDao {int delete(); }利用 javassist 生产一个 类A, Class A implements AccountDao package com.wsd;import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifi…

mac桌面时钟 浮动 (python)

浮动时钟,多地时区 app store的都要钱,于是。。。。我们让chatgpt来实现一个吧: 数字: 代码: import sys import datetime import pytzfrom PyQt5.QtWidgets import QApplication, QMainWindow, QGraphicsView, QGr…

深度学习不同数据增广方法的选用分析

一般情况下,可以将数据扩增方法分为单数据变形、多数据混合、学习数据分布规律生成新数据和学习增广策略等4 类方法。以上顺序也在一定程度上反映了数据增广方法的发展历程。如果与Shorten和Khoshgoftaar的成果对照,就图像数据而言,基于数据变…

抖音矩阵源码搭建开发技术部署分析

目录 一、 什么是抖音矩阵?源码搭建开发注意事项? 1. 抖音矩阵概述 2. 源码搭建开发注意事项: 二、 使用步骤及开发代码展示 一、 什么是抖音矩阵?源码搭建开发注意事项? 1. 抖音矩阵概述 首先,抖音账…