跟李沐学AI:AlexNet、VGG

news2025/1/31 2:46:53

目录

AlexNet架构

AlexNet总结

AlexNet实现

VGG块

VGG架构

VGG总结


AlexNet架构

输入图片为3x224x224维度;第一个卷积层核窗口大小为11x11,卷积层输出为96通道,步长为4;第一个最大池化层窗口大小为3x3,步长为2。

第二个卷积层核窗口大小为5x5,输出通道为256,填充为2。第二个最大池化层窗口大小为3x3,步长为2。

随后连续三个3x3,输出通道为384,填充为1的卷积层。接上一个窗口大小为3x3,步长为2的最大池化层。

随后是两个维度为4096的隐藏层和一个维度为1000的输出层。

同时,AlexNet的激活函数为ReLU,隐藏全连接层后加入的丢弃层,在训练时增强数据以增强模型泛化性。

AlexNet的第一个卷积层参数个数为3(通道数)*96(输出通道数)*11*11(核大小)=35K。

AlexNet总结

AlexNet是一个更大更深的LeNet

新加入了丢弃发、ReLU、最大池化层和数据增强

AlexNet引发了新一轮的神经网络热潮

AlexNet实现

net = nn.Sequential(
    nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1),
    nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nn.Conv2d(96, 256, kernel_size=5, padding=2),
    nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nn.Conv2d(256, 384, kernel_size=3, padding=1),
    nn.ReLU(),
    nn.Conv2d(384, 384, kernel_size=3, padding=1),
    nn.ReLU(),
    nn.Conv2d(384, 256, kernel_size=3, padding=1),
    nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nn.Flatten(),
    # 展平后大小为256 * 5 * 5,是上一层feature map的结果
    nn.Linear(6400, 4096),
    nn.Dropout(p=0.5),
    nn.Linear(4096, 4096),
    nn.Dropout(p=0.5),
    nn.Linear(4096, 10)
)

VGG块

AlexNet中存在三个连续的、相同的卷积层。VGG扩展了AlexNet的思路,可以堆叠n层m通道的3x3、填充为1卷积的卷积层,最后连接一个2x2、步幅为2的MaxPool。3x3窗口大小效果好于5x5。

VGG架构

多个VGG块后连接全连接层,不同次数的重复块得到不同架构。

VGG总结

VGG使用可重复使用的卷积快来构建深度卷积神经网络。

不同卷积块个数和超参数可以得到不同复杂度的变种。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1977556.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言项目实战FTP文件传输(windows网络编程基础)

文章目录 前言一、客户端和服务端介绍二、客户端和服务器之间进行通信的过程客户端和服务器建立通信的流程通信过程的示例图流程说明 三、客户端代码编写代码解释 四、服务端代码编写代码解释 总结 前言 本篇文章开始将带大家来学习FTP文件传输助手的项目实现,这个…

【51单片机仿真】基于51单片机设计的温湿度采集检测系统仿真源码文档视频——文末资料下载

演示 目录 1.系统功能 2.背景介绍 3.硬件电路设计 4.软件设计 4.1 主程序设计 4.2 温湿度采集模块程序设计 4.3 LCD显示屏程序设计 5.系统测试 6.结束语 源码、仿真、文档视频等资料下载链接 1.系统功能 该系统通过与AT89C51单片机、LCD1602显示屏和DHT11温湿度传感器…

makefile(1)

文章目录 概述简单Makefilemakefile三要素makefile:工作原理编译程序 小结 概述 makefile这个编译在c中很常见,看下操作系统,都是基于makefile编译的。来简单看下, 这个就不看了,每一个模块下都有一个对应的makefile…

前端:javaScript基础知识

一、输出语句 ①window.alert():弹出框 ②ducument.write():写入HTML输入 ③console.log():在浏览器控制台输出 二、声明变量 ①使用关键字var来声明变量 ②javaScript是一门弱类型语言,变量可以存放不同类型的值 ③变量需要遵…

【Python】字符串练习题及代码示例

1、使用while循环实现对字符串中每个字符进行输出。 代码示例: 2、请将代码实现如下进制的转换。 (1)v1675,请将v1转换为二进制。 代码: 注意:将十进制数转换为二进制数的方法是:bin(a),a是整型&#x…

使用 addRouteMiddleware 动态添加中间

title: 使用 addRouteMiddleware 动态添加中间 date: 2024/8/4 updated: 2024/8/4 author: cmdragon excerpt: 摘要:文章介绍了Nuxt3中addRouteMiddleware的使用方法,该功能允许开发者动态添加路由中间件,以实现诸如权限检查、动态重定向及…

html+css 实现hover双层按钮

前言:哈喽,大家好,今天给大家分享htmlcss 绚丽效果!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 文…

AI人工智能开发环境配置

AI人工智能 为什么使用Python来开发AI 人工智能被认为是未来的趋势技术。 已经有了许多应用程序。 因此,许多公司和研究人员都对此感兴趣。 但是这里出现的主要问题是,在哪种编程语言中可以开发这些 AI 应用程序? 有各种编程语言&#xff0c…

Stable Diffusion绘画 | 图生图-基础使用介绍—提示词反推

按默认设置直接出图 拖入图片值图生图框中,保持默认设置,直接生成图片,出图效果如下: 因为重绘幅度0.7,所出图片与原图有差异,但整体的框架构图与颜色与原图类似。 输入关键词后出图 在正向提示词中输入…

PMP–知识卡片--Scrum框架

定义 Scrum框架包含由产品负责人、开发团队、敏捷专家构成的Scrum团队,以及活动工件。框架中的每一个组件都服务于一个特定的目标,且是Scrum成功和运用的基本要素。 Scrum的规则将角色、活动和工件绑定在一起,管理它们之间的关系和交互。 …

JavaEE 第2节 线程安全知识铺垫1

目录 一、通过jconsole.exe查看线程状态的方法 二、Thread类的几种常见属性 三、线程状态 一、通过jconsole.exe查看线程状态的方法 通过jconsole查看线程状态非常实用的方式 只要你安装了jdk,大致按照这个目录就可以找到这个可执行程序: 然后双击这…

YOLOv10改进 | 注意力篇 | YOLOv10引入24年最新的上下文锚注意力机制(CAA),并构建C2f_CAA(适用于小目标检测)

1. CAA介绍 1.1 摘要:遥感图像中的目标检测面临着越来越多的挑战,包括目标尺度的变化和背景的多样性。先前的方法试图通过扩大骨干的空间感受野来解决这些挑战,无论是通过大核卷积还是扩张卷积。然而,前者通常会引入相当大的背景噪声,而后者则会产生过于稀疏的特征表示。…

[CTF]-PWN:ORW题型综合解析

经典ORW: 例题(极客大挑战 2019 Not Bad): 这里使用mmap函数创造了一个内存映射区域 从地址0x123000开始,大小位0x1000 权限为可写可执行(可读0x1,可写0x2,可执行0x3)…

Halcon 二维匹配

匹配:在训练图像中呈现一个所谓的模板。系统从这个模板中派生出一个模型,通过使用该模型来定位于搜索图像中的相似模板对象。此方法能够处理打光、杂乱、位置和旋转变换的图像。 匹配优点:鲁棒性和灵活性。匹配不需要对目标进行任何形式的分割…

50 选择结构

常见的选择结构有单分支选择结构、双分支选择结构、多分支选择结构及嵌套的分支结构,也可以构造跳转表来实现类似的逻辑。循环结构和异常处理结构中也可以实现带有 else 子句,可以看作特殊形式的选择结构。 所有的 Python 合法表达式都可以作为条件表达…

MySQL数据库入门:掌握数据管理的关键步骤!

前言 竹竹零将带您深入探索MySQL数据库的基础知识和实用技能,一同走进Java逻辑控制语句的 学习吧!!! 本节目标 数据库的操作:创建数据库、删除数据库常用数据类型表的操作:创建表、删除表 1. 数据库的操作…

跨域以及解决方案

禹神:一小时彻底搞懂跨域&解决方案_哔哩哔哩_bilibili该直播回放对跨域的多种解决方案进行了梳理,内容包括:分析同源策略、分析预检请求、跨域的多种解决方案(CORS、JSONP、代理)、同时也从后端人员角度梳理了各种…

计算机毕业设计选题推荐-学生作业管理系统-Java/Python项目实战

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

一次性下发100w的优惠券/短信/二维码,兼顾线程池参数可配置

1、场景需求分析 针对6.18,11.11这种场景,平台一次性发布500w张优惠券,或者对于锁单用户统一发下100w张确认信息,同时我们平时有抢购茅台的场景,京东一次性发布10w个验证码,主要是针对高并发多线程大数据批处理任务的场景,一般用于二维码、优惠券、邮件、短信等场景。 …

MyBatis的适用场合与优势

MyBatis的适用场合与优势 1、适用场合2、优势 💖The Begin💖点点关注,收藏不迷路💖 1、适用场合 SQL灵活控制: 适合需要精确控制SQL语句生成和执行的项目。 高性能需求: 对于性能要求高的系统,…