卷积神经网络全解:(AlexNet/VGG/ GoogleNet/LeNet/卷积/激活/池化/全连接)

news2025/1/16 5:04:50

CNN,卷积神经网络,Convolution Neural Network

卷积计算公式:

N = (W-F+2p)/s+1

1 经典网络

按照时间顺序

1.1 LeNet

LeNet是 Yann LeCun在1998年提出,用于解决手写数字识别的视觉任务。自那时起,CNN的最基本的架构就定下来了:卷积层、池化层、全连接层。

1.2 AlexNet

AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的,把CNN的基本原理应用到了很深很宽的网络中。

主要参数:AlexNet网络包含8层,其中前5层为卷积-池化层,后3层为全连接层;输入224×224×3的图像,第一卷积层用96个11×11×3的卷积核对进行滤波,步幅4像素;全连接的每层有4096个神经元,最后一个完全连接的层的输出被馈送到1000路SoftMax,它产生超过1000个类别标签的分布;整个网络共650000个神经元。

特点:

  • 使用ReLU作为激活函数,并验证其效果在较深的网络超过了Sigmoid,成功解决了Sigmoid在网络较深时的梯度弥散问题
  • 使用Dropout(丢弃学习)随机忽略一部分神经元防止过拟合
  • 在CNN中使用重叠的最大池化。此前CNN中普遍使用平均池化,AlexNet全部使用最大池化,避免平均池化的模糊化效果
  • 提出了LRN(Local Response Normalization,局部正规化)层,对局部神经元的活动创建竞争机制,使得其中响应比较大的值变得相对更大,并抑制其他反馈较小的神经元,增强了模型的泛化能力
  • 使用CUDA加速深度卷积网络的训练,利用GPU强大的并行计算能力,处理神经网络训练时大量的矩阵运算

1.3 VGG

  • 网络深度:16-19层
  • 5组卷积-池化,3个全连接
  • 三个全连接层,前两层都有4096通道,第三层共1000路及代表1000个标签类别;最后一层为softmax层
  • 所有卷积层有相同的配置,即卷积核大小为3x3,步长为1,填充为1

1.4 GoogleNet

2 网络结构

2.1 卷积层

通过卷积操作,进行特征提取和降维。

2.2 激活层

将前一层的输出,通过非线性的激活函数进行处理,用以模拟任意维度的函数,增强网络的表征能力。

常用的激活函数:

  1. 阶跃函数(用的较少)
  2. sigmoid函数:
    • 优点:平滑,易求导
    • 缺点:激活函数计算量大,反向传播求误差梯度时,求导涉及除法;反向传播时,很容易就会出现梯度消失的情况,从而无法完成深层网络的训练
    • 改善方案:归一化,用sk-learn函数处理
  3. tanh函数 常用于NLP,其他类似sigmiod函数
  4. Relu函数(常用),优点:
    • 更加有效率的梯度下降以及反向传播,避免了梯度爆炸和梯度消失问题
    • 计算过程简单
  5. softmax函数,特点:多分类模型适用

2.3 池化

也称子采样层或下采样层(Subsampling Layer),目的是缩小高、长方向上的空间的运算,以降低计算量,提高泛化能力。

计算方式:

  • Max池化:对于每个输入矩阵,我们将其切割成若干大小相等的正方形小块,对各个参与池化计算的区域取最大值,形成的新矩阵。在图像识别领域,主要使用Max池化
  • Average池化:对于每个输入矩阵,我们将其切割成若干大小相等的正方形小块,对各个参与池化计算的区域计算平均值

池化层特征:

  1. 没有要学习的参数。池化层和卷积层不同,没有要学习的参数。池化只是从目标区域中取最大值(或者平均值),所以不存在要学习的参数
  2. 通道数不发生变化。经过池化运算,输入数据和输出数据的通道数不会发生变化
  3.  对微小的位置变化具有鲁棒性(健壮)。输入数据发生微小偏差时,池化仍会返回相同的结果

 

2.4全连接层

这个网络层相当于多层感知机(Multi-Layer Perceptron,简称MLP),其在整个卷积神经网络中起到分类器的作用。

通过前面多个“卷积-激活-池化”层的反复处理,待处理的数据特性已有了显著提高:一方面,输入数据的维度已下降到可用传统的前馈全连接网络来处理了;另一方面,此时的全连接层输入的数据已不是“泥沙俱下、鱼龙混杂”,而是经过反复提纯过的结果,因此输出的分类品质要高得多。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/885298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

八大排序超详解(动图+源码)

💓博主个人主页:不是笨小孩👀 ⏩专栏分类:数据结构与算法👀 刷题专栏👀 C语言👀 🚚代码仓库:笨小孩的代码库👀 ⏩社区:不是笨小孩👀 🌹欢迎大家三连关注&…

高效提升工作效率,亚马逊云科技热门课程带你入门生成式AI

当前人工智能仍处于飞速发展阶段,作为当下最先进的科学技术之一,相信大家对AIGC关注已久。今天,引用亚马逊云科技最新发布的七项生成式AI新功能来跟大家聊聊近期的热门生成式AI! 有人说,生成式AI将带来充满创造性的新世…

AMEYA360:村田共模扼流线圈,针对车载应用的高频噪声

近年来,随着ADAS(高级驾驶辅助系统)精度的提高,汽车行业开始安装大量毫米波雷达、LiDAR等高速传感设备。如果噪声从外部进入这些设备,系统可能无法正常工作。相反,如果这些设备产生噪声,则可能会对其他设备产生不利影响…

mysql 02 数据库的约束

为防止错误的数据被插入到数据表,MySQL中定义了一些维护数据库完整性的规则;这些规则常称为表的约束。常见约束如下: 主键约束 主键约束即primary key用于唯一的标识表中的每一行。被标识为主键的数据在表中是唯一的且其值不能为空。这点类似…

ICT产教融合创新实训基地软件测试实训室建设方案

一 、系统概述 ICT产教融合创新,简单来说,就是信息与通信技术(ICT)与产业界、教育界的融合创新。这个概念强调了在现代社会中,信息技术与产业发展以及教育培训之间相互关联的重要性。 ICT产教融合创新的核心思想包括以…

【正点原子STM32连载】第十章 跑马灯实验 摘自【正点原子】APM32F407最小系统板使用指南

1)实验平台:正点原子stm32f103战舰开发板V4 2)平台购买地址:https://detail.tmall.com/item.htm?id609294757420 3)全套实验源码手册视频下载地址: http://www.openedv.com/thread-340252-1-1.html# 第十…

数字孪生技术对环境保护有哪些作用?

数字孪生技术在环境保护中的作用不容忽视,为我们创造了全新的可能性和解决方案。在追求可持续发展的今天,数字孪生以其独特的能力,正逐渐改变着环境保护的方式。 数字孪生技术首先在环境监测方面发挥了巨大作用。通过传感器和数据采集设备&a…

JVM整体回忆笔记

模块三 内存的分配 指针碰撞 空闲列表 分配内存的时候出现并发问题,几个线程同时抢同一块内存区域 CAS方法解决 本地线程分配缓冲(-XX:UseTLAB),jvm默认开启 对象的组成 对象头、实例数据、对齐填充(保证对象8个字节…

Sonar:Class variable fields should not have public accessibility

公有类变量字段不遵守封闭原则,主要有三个问题: 无法添加验证等附加行为。内部表示暴露在外,事后无法更改。成员值可能会在代码的任何地方发生变化,并且可能不符合程序员的假设。 通过使用私有属性和访问方法(set 和…

输出倒逼输入系列之 阻塞 or 等待?

操作系统线程状态 《趣谈Linux 操作系统》第12章节,讲到 进程的数据结构,其中涉及到任务状态,这里简单概述一下 首先在操作系统中,不管是进程还是线程,都统一是 任务的概念,它的数据结构 为 task_strcut。…

深度学习1:通过模型评价指标优化训练

P(Positive)表示预测为正样本,N(negative)表示预测为负样本,T(True)表示预测正确,F(False)表示预测错误。 TP:正样本预测正确的数量(正确检测) FP:负样本预测正确数量(误检测) TN…

Python入门--安装和环境配置

要开始使用Python,您需要先安装Python环境。下面是安装Python环境的简单步骤: 1.访问Python官网(https://www.python.org/),点击“下载”按钮。 2.选择适合您系统的版本下载,可选择Windows、macOS、Linux…

uniapp中map使用点聚合渲染marker覆盖物

效果如图: 一、什么是点聚合 当地图上需要展示的标记点 marker 过多时,可能会导致界面上 marker 出现压盖,展示不全,并导致整体性能变差。针对此类问题,推出点聚合能力。 点聚合官网教程 二、基本用法 template…

如何让CSDN学习成就个人能力六边形全是100分:解析个人能力雷达图的窍门

🌷🍁 博主猫头虎 带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 &a…

【Linux C】在sprintf中打印双引号

0x00 前言 最后更新日期:2023.8.16 0x01 在sprintf中打印双引号 在字符串中有双引号”的地方前面加上一个反斜杠“\”即可,例如: char szProQuery[256] {0}; char name[256] "XiaoMing"; sprintf(szProQuery,"%s said :…

使用druid连接池对配置文件密码进行加密

想让别人看不到你的数据库密码该怎么办呢&#xff1f;&#xff1f;&#xff1f; 1.建立maven项目添加依赖。 <dependencies><!-- com.mysql/mysql-connector-j --><dependency><groupId>com.mysql</groupId><artifactId>mysql-connector-j…

MyBatis速成

一、MyBatis简介 1、基本概念 MyBatis是一个持久层框架&#xff0c;用于简化JDBC开发。 表现层&#xff1a;页面展示&#xff1b; 业务层&#xff08;service&#xff09;&#xff1a;逻辑处理&#xff1b; 持久层&#xff08;dao&#xff09;&#xff1a;将数据保存到…

Access开发ERP简单主框架搭建

哈喽,哈喽,大家好! 今天我们接着来讲ERP,我们已经把理论知识与表结构讲完了,接下去我们开始讲最关键的业务部分的开发,这里也是大家最期待的。这里我们将会把系统分成几个部分来讲解,包括整个系统基本模块、基础信息、销售管理、采购管理、生产管理、仓库管理。今天的话…

微信小游戏投放量增长五倍,下半年买量能怎么玩?

App中运行小游戏的技术价值和业务价值都是显著的&#xff1a;通过小程序容器技术&#xff0c;承载多样化的小游戏运行在自有App内&#xff0c;实现跨平台的游戏资源共享&#xff0c;降低买量成本&#xff0c;此为「降本」。进一步的&#xff0c;在App内快速引入多小游戏应用&am…

载入内存,让程序运行起来

如果你的电脑上安装了QQ&#xff0c;你希望和好友聊天&#xff0c;会双击QQ图标&#xff0c;打开QQ软件&#xff0c;输入账号和密码&#xff0c;然后登录就可以了。 那么&#xff0c;QQ是怎么运行起来的呢&#xff1f; 首先&#xff0c;有一点你要明确&#xff0c;你安装的QQ软…