AlexNet论文阅读

AlexNet论文阅读

news2025/4/19 10:29:05

开始之前的简介:这篇论文是王林蓉师姐推荐给我看的第一篇入门级别的cv领域的论文,也算是我入手研究生阶段的第一篇论文.我是打算先看看这一领域的论文,然后写的自己一点随笔.若有错误欢迎指正.

一. 专有词汇

非饱和神经元

dropout

饱和非线性,非饱和非线性

二. 论文结构

三. 核心框架

这张图片是这个论文的网络架构,它由八个学习层——五个卷积层,三个全全连接层组成

图1

四.本篇论文的创新方法

4.1激活函数

以往在CNN卷积神经网络里面见到的最多的激活函数是sigmoid 函数,但是出于对收敛速度的考虑,在这里作者却用的是ReLU函数.因为这些非饱和函数的收敛速度比饱和函数的收敛速度快得多.对于下图2,它显示了针对特定四层卷积网络，在CIFAR-10数据集上达到25%训练误差所需的迭代次数。这张图表明，如果我们使用传统的饱和神经元模型，我们将无法对如此大的神经网络进行实验。

具有ReLU的四层卷积神经网络（实线）在CIFAR-10上达到25%的训练错误率，比具有tanh神经元的等效网络（虚线）快六倍。每个网络的学习率都是独立选择的，以使训练尽可能快。

图2

4.2 多GPU训练

这里考虑到单个图片对于单个GPU太大,必将超出内存限制.所以将其拆分为两部分,图片上半部分由一个GPU训练,下半部分由一个GPU训练,并且只在某些网络层考虑他们俩的交互(通信).这里给我们提供了一个思路,当某张图片太大时,可以考虑并行训练用以弥补硬件不足,但是需要调整他们的交互.

4.3 局部响应归一化

首先讲一下归一化:归一化是将样本的特征值转换到同一量纲下把数据映射到[0,1]或者[-1, 1]区间内，是一种线性变换，是对向量X按照比例压缩再进行平移。

ReLU具有期望的性质，即它们不需要输入归一化来防止它们饱和。这里举一个反例，如：sigmoid函数当x1=100和x2=100000时，明明两者已经相差很大了，但是对应的y却相差不大，这里就是饱和现象。但是对于ReLU函数来讲x1=100，x2=100000时对应的y也有很大差距，故在此不需要进行归一化处理

局部响应归一化

定义 $a_{x,y}^{i}$ 为(x,y)处的

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1097301.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

10G SDH传输分析仪该如何选择

10G SDH传输分析仪该如何选择

TFN D450S 传输分析仪功能全面使用方便是通信人的不二选择

阅读更多...

深入了解企业税收违法信息API：实现智能风险评估

深入了解企业税收违法信息API：实现智能风险评估

引言企业税收违法是一项严重的经济犯罪，可能导致严重的法律后果和金融损失。为了帮助企业和金融机构识别并预防潜在的税收违法行为，智能风险评估变得至关重要。在这一领域，企业税收违法信息API发挥着重要的作用，提供了关键的数据…

阅读更多...

一图读懂「五度情报站」全盘视野，情报智取，先知先行，决策有道！

一图读懂「五度情报站」全盘视野，情报智取，先知先行，决策有道！

「五度情报站」是一款集企业情报监测、管理、分析等多功能于一体微信小程序，其依托全体量产业大数据及强大的数据治理能力，收录了商业、市场、竞争、企业、技术、金融等全类别情报信息，构建了面向用户的业务型标签体系，设计了实用…

阅读更多...

PyTorch深度学习实战（21）——从零开始实现Faster R-CNN目标检测

PyTorch深度学习实战（21）——从零开始实现Faster R-CNN目标检测

PyTorch深度学习实战（21）——从零开始实现Faster R-CNN目标检测 0. 前言1. Fast R-CNN 目标检测模型组成1.1 锚框1.2 区域提议网络1.3 分类和回归 2. 实现 R-CNN 目标检测2.1 数据处理2.2 模型构建2.3 模型训练与测试小结系列链接 0. 前言 Faster R-CN…

阅读更多...

手机抬手亮屏解锁，用到了哪些硬件？

手机抬手亮屏解锁，用到了哪些硬件？

随着时代发展，智能手机以丰富的功能及便利性，成为了人们必不可少的物品，其中人脸解锁功能是非常有用的功能，广受年轻人的喜爱，那么你知道她是如何实现吗？今天凡小亿带你们探索！ 手机抬手亮屏解锁…

阅读更多...

谨以此篇，纪念我2023年曲折的计算机保研之路

谨以此篇，纪念我2023年曲折的计算机保研之路

目录阶段一：迷茫阶段二：准备个人意愿保研材料准备套磁老师5.1日浙大线上编程测试5.8日浙大线上面试 —— 一面5.17日浙大线上面试——二面5.29日实验室面试结果5.27日南开线上面试6.20日华师电话面试阶段三：旅途北航CS（6.…

阅读更多...

ebpf的快速开发工具--libbpf-bootstrap

ebpf的快速开发工具--libbpf-bootstrap

基于ubuntu22.04-深入浅出 eBPF 基于ebpf的性能工具-bpftrace 基于ebpf的性能工具-bpftrace脚本语法基于ebpf的性能工具-bpftrace实战(内存泄漏) 什么是libbpf-bootstrap libbpf-bootstrap是一个开源项目，旨在帮助开发者快速启动和开发使用eBPF(Extended Berk…

阅读更多...

微服务拆分的思考

微服务拆分的思考

一、前言前面几篇文章介绍了微服务核心的两个组件：注册中心和网关，今天我们来思考一下微服务如何拆分，微服务拆分难度在于粒度和层次，粒度太大拆分的意义不大，粒度太小开发、调试、运维会有很多坑。二、微服务划分…

阅读更多...

【初识Linux】：常见指令（2）

【初识Linux】：常见指令（2）

朋友们、伙计们，我们又见面了，本期来给大家解读一下有关Linux的基础知识点，如果看完之后对你有一定的启发，那么请留下你的三连，祝大家心想事成！ C 语言专栏：C语言：从入门到精通数…

阅读更多...

为健康护航的小帮手，dido E55S Pro智能手表体验

为健康护航的小帮手，dido E55S Pro智能手表体验

现在很多年轻人每天都要长时间工作，没有时间锻炼身体，很容易导致各种健康隐患，工作效率也容易下降，非常有必要通过智能手表等工具，随时监测自己的健康状态。现在支持健康监测的智能手表非常多，用起来也简单…

阅读更多...

Java反射使用实例

Java反射使用实例

Java反射：解析类的秘密 Java反射是一项强大的功能，允许开发人员在运行时检查、操作和实例化类、方法、字段以及其他Java程序中的元素。这种能力赋予了Java语言更大的灵活性和动态性，但也需要慎重使用，因为它可能会导致性能问题和…

阅读更多...

[Halcon检测] 划痕检测之高斯导数提取

[Halcon检测] 划痕检测之高斯导数提取

📢博客主页：https://loewen.blog.csdn.net📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正！📢本文由丶布布原创，首发于 CSDN，转载注明出处🙉📢现…

阅读更多...

带你了解小程序的框架之谜

带你了解小程序的框架之谜

🏅我是默，一个在CSDN分享笔记的博主。📚📚 🌟在这里，我要推荐给大家我的专栏《微信小程序》。🎯🎯 🚀无论你是编程小白，还是有一定基础的程序员，…

阅读更多...

BUUCTF学习(6): 命令执行ip

BUUCTF学习(6): 命令执行ip

1、介绍 2、hackbar安装 BUUCTF学习(四): 文件包含tips-CSDN博客 ?ip127.0.0.1;ag;cat$IFS$9fla$a.php 空格过滤 $IFS$9 检查源代码结束

阅读更多...

ssm+vue的药品管理系统（有报告）。Javaee项目，ssm vue前后端分离项目。

ssm+vue的药品管理系统（有报告）。Javaee项目，ssm vue前后端分离项目。

演示视频： ssmvue的药品管理系统（有报告）。Javaee项目，ssm vue前后端分离项目。项目介绍： 采用M（model）V（view）C（controller）三层体系结构&…

阅读更多...

英语进阶指南：高效学习方法，提升英语水平 | 开源专题 No.35

英语进阶指南：高效学习方法，提升英语水平 | 开源专题 No.35

这些开源项目集合了英语学习与翻译工具，包括英语进阶指南、多功能翻译工具、面向程序员的英语学习指南和单词记忆软件。它们提供实用方法，覆盖多个学习方面，满足不同需求。无论您是英语初学者还是想进一步提升，这些资源都能助您轻…

阅读更多...

系列八、Redis的事务

系列八、Redis的事务

一、是什么可以一次执行多个命令，本质是一组命令的集合。一个事务中的所有命令都会序列化，按顺序地串行化执行而不会被其他命令插入，不允许加塞。二、能干嘛一个队列中，一次性、顺序性、排他性的执行一些列命令。三、怎么玩…

阅读更多...

3.Vue-在Vue框架中搭建路由

3.Vue-在Vue框架中搭建路由

题记以下是在vue框架中搭建路由的全过程，包括全部代码。创建路由如果你的文件中没有 router文件夹，可以使用以下命令创建： vue add router 注意：生成的路由文件会因为选择的自定义选项不同，而有所差异生成的代码…

阅读更多...

【ArcGIS Pro二次开发】(71)：添加图层名称和路径到字段

如题，这个工具的目的就是将图层的名称和路径添加到字段值中。有时候图层的名称和路径也是重要的信息，需要参与到字段的计算或是分析中，但是Arcgis Pro中没有一个方便的方法可以将其写入字段值，因此，就做了这么一个小…

阅读更多...

力扣第77题组合 c++ 回溯经典题注释加优化代码

力扣第77题组合 c++ 回溯经典题注释加优化代码

题目 77. 组合中等相关标签回溯给定两个整数 n 和 k，返回范围 [1, n] 中所有可能的 k 个数的组合。你可以按任何顺序返回答案。示例 1： 输入：n 4, k 2 输出： [[2,4],[3,4],[2,3],[1,2],[1,3],[1,4], ] 示例 2&a…

阅读更多...

推荐文章

最新文章