ccc-pytorch-卷积神经网络介绍(5)

news2024/12/28 3:17:21

文章目录

      • 一、卷积
      • 二、池化
      • 三、Batch Norm
      • 四、经典卷积网络简单介绍

一、卷积

卷积连续函数形式:
F ( x ) = ∫ f ( t ) g ( x − t ) d t F(x)=\int f(t)g(x-t)dt F(x)=f(t)g(xt)dt
物理意义是一个函数在另一个函数上的加权叠加。在2D卷积中指卷积核在数据矩阵中分割出的矩阵和卷积核相乘得到矩阵汇总的过程

卷积层参数:

  • 卷积核大小(Kernel Size):卷积的视野,通常为3x3、5x5
  • 步长(Stride):遍历图像时卷积核的移动的步长
  • 填充(Padding):处理样本边界方式。可以边界外完全不填充但会使输出特征图的尺寸小于输入特征图尺寸;另一种是对边界外进行填充再卷积,使输出特征图的与输入特征图的尺寸一致
  • 通道(Channel):卷积层的通道数(层数)

单通道卷积与多通道卷积(2D):

输出为2D的矩阵数据。每个通道都有对应的卷积核以及产生对应结果,将多个结果累加求和得到最终结果即可,它综合了各个通道上的信息,有多少个卷积核,就有多少个featuremap。如下用了2个&
img
动态图地址

二、池化

pooling是一般在卷积层后整合提取特征的作用,即增加特征整合度又防止无用参数增加时间复杂度。它的操作是指定而不是学习,一般有如下常见类型:

  • Max pooling:每块取最大的,提取更明显的特征(边缘)
    image-20230305160547110
  • AVE pooling:计算feature map的均值,提取更加平滑
  • SUM Pooling:本质同AVE

说到底还是一个特征选择,信息过滤的过程。就是损失一部分信息,这是一个和计算性能的妥协,随着运算速度的不断提高,有些网络都开始少用或者不用pooling层了

三、Batch Norm

假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障,Normalization 的目的是为了把输入转化成均值为 0 方差为 1 的数据,使得每层网络的输入保持相同分布,同时加快收敛速度和效果。其基本原理如下:

在这里插入图片描述
形象图:
在这里插入图片描述
注意事项:

  • β \beta β γ \gamma γ分别为平移参数和缩放参数 ,保证没次数据归一化后还有保留的有学习来的特征,加速训练
  • 测试时使用训练时计算好的mean和var
  • 其他相关norm方法:
    image-20230305171226655

四、经典卷积网络简单介绍

LeNet-5
卷积神经网络的开山之作,用于手写字识别。由1个输入层(通常不视为网络层次)、2个卷积层、2个池化层、3个全连接层组成(最后一个也作为输出层)
image-20230305193723321

层次名称类型输出大小核大小paddingstride卷积核个数
Input输入层32x32NoneNoneNone1
C1卷积层28x285x5016
S2下采样层14x142x2026
C3卷积层10x105x50116
S4下采样层5x52x20216
C5卷积层1x15x501120
F6全连接层84NoneNoneNoneNone
Output(全连接层)10NoneNoneNoneNone

AlexNet
2012年ISLVRC竞赛冠军设计,准确率提高了10%+。架构为5个卷积层和3个全连接层
image-20230305200922408
上图架构表示2个GPU分块计算,目前GPU显存足够,实际合并也不影响架构表示。由于后面出现模型层数都越来越多,就只介绍特点了:

  • 使用GPU进行加速,速度为使用CPU的50倍。2张GTX 580 训练一周(现在训练几个月都很正常咯)
  • 使用非线性的激活函数-ReLU(论文验证较深网络优于Sigmoid),解决梯度离散的问题
  • 全连接前两层中使用Dropout ,有效限制过拟合
  • 重叠池化,即padding>stride,可以使相邻像素之间交互和保留必要的联系
  • 网络层数的增加以及数据的增加

VGG16
VGG最大的贡献就是证明了卷积神经网络的深度增加和小卷积核的使用对网络的最终分类识别效果有很大的作用,这个可以很好的节省参数(3个3x3的卷积核效果与7x7的类似,但参数少很多)
image-20230305203436988
含有与参数的网络层一共16层,13个卷积层,5个池化层(不算网络层数),3个全连接层,特点如下:

  • 采用多个小卷积核代替较大的卷积核,减少计算量
  • 使用1x1的卷积,增加决策函数的非线性能力,更少的计算
  • 更深的网络结构。。

GoogLeNet

image-20230305211553351
特点如下:

  • Inception结构,融合不同尺度的特征信息。也采用1x1卷积核来降维减少参数再传递。

这里写图片描述
初代Inception结构如下:
在这里插入图片描述

  • 添加2个辅助分类器(提前输出)帮助训练,防止梯度爆炸和梯度消失
  • 不使用全连接层而使用平均池化层,减少模型参数

ResNet
解决了网路加深造成梯度爆炸和梯度消失的问题,主要想法来源VLAD和Highway Network,其重要思想的结构图如下:
image-20230305214154812
它提出了2种映射:恒等映射(identity mapping)x 和残差映射(residual mapping)F(x),加入后表示如下:
image-20230305214518629
这样实现了shortcut connections,如果网络已经达到最优,继续加深网络,residual mapping将变为0,只剩下identity mapping,这样理论上网络会一直处于最优状态,网络的性能也就不会随着深度增加而降低。
当层数更深为了降低参数数目可以采用下面这种改进结构:
image-20230305220021445
DenseNet
在ResNet上进行改进,每一个卷积层的输入为前面所有卷积层输出的,综合前面各环节得到的信息再决定当前层的行为
image-20230305225616001

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/392713.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PMP和软考高项集成,更应该考哪个呢?

要看你自己的偏向,要说考的话,我是觉得都值得考的,一个证一份技术嘛。 我给你稍微介绍一下,PMP都是美国PMI发起的考试,软考高项是国内的考试。PMP是项目管理证书,学习的内容是项目管理,包含大约…

研报精选230306

目录 【行业230306东亚前海证券】食品饮料行业2023年年度投资策略:复苏在途,蓄势待发【行业230306国金证券】基础化工行业研究:MDI价格上行,新一轮国企改革在即【行业230306中银证券】华为汽车产业链深度报告:三种合作…

k8s控制器

目录 一、控制器简介 二、控制器类型 1、RC和RS 2、Deployment 3、DaemonSet 4、Job 5、CronJob 6、StateFulSet 7、HPA 一、控制器简介 在kubernetes中,按照Pod的创建方式可以将其分为两类: 自主式:kubernetes直接创建出来的Pod,…

【Alamofire】【Swift】属性包装器注解@propertyWrapper

Alamofire 中的源码例子 import Foundationprivate protocol Lock {func lock()func unlock() }extension Lock {/// Executes a closure returning a value while acquiring the lock.////// - Parameter closure: The closure to run.////// - Returns: The value…

9.SpringSecurity核心过滤器-SecurityContextPersistenceFilter

SpringSecurity核心过滤器-SecurityContextPersistenceFilter 一、SpringSecurity中的核心组件 在SpringSecurity中的jar分为4个,作用分别为 jar作用spring-security-coreSpringSecurity的核心jar包,认证和授权的核心代码都在这里面spring-security-co…

Promise入门

Promise入门 Promise的基本概念 男女相爱了&#xff0c;女方向男方许下一个承诺怀孕new Promise&#xff0c;这是会产生两种结果怀上(resolve)和没怀上(reject)&#xff0c;resolve对应then&#xff0c;reject对应catch&#xff0c;无论是否怀上都会执行finally。 <script&…

【论文速递】CASE 2022 - EventGraph: 将事件抽取当作语义图解析任务

【论文速递】CASE 2022 - EventGraph: 将事件抽取当作语义图解析任务 【论文原文】&#xff1a;https://aclanthology.org/2022.case-1.2.pdf 【作者信息】&#xff1a;Huiling You, David Samuel, Samia Touileb, and Lilja vrelid 论文&#xff1a;https://aclanthology.o…

sql server 对比两个查询性能 ,理解Elapsed Time、CPU Time、Wait Time

分析 SET STATISTICS TIME ONyour sqlSET STATISTICS TIME OFF由上图分析: cpu time 是查询执行时占用的 cpu 时间。如果了解系统的多任务机制&#xff0c;就会知道系统会将整个 cpu 时间分为一个一个时间片&#xff0c;平均分配给运行的线程——一个线程在 cpu 上运行一段时间…

《PyTorch深度学习实践9》——卷积神经网络-高级篇(Advanced-Convolution Neural Network)

一、1∗11*11∗1卷积 由下面两张图&#xff0c;可以看出1∗11*11∗1卷积可以显著降低计算量。 通常1∗11*11∗1卷积还有以下功能&#xff1a; 一是用于信息聚合&#xff0c;同时增加非线性&#xff0c;1∗11*11∗1卷积可以看作是对所有通道的信息进行线性加权&…

Air101|Air103|Air105|Air780E|ESP32C3|ESP32S3|Air32F103开发板:概述及PinOut

1、合宙Air101&#xff08;芯片及开发板&#xff09; 合宙Air101是一款QFN32 封装&#xff0c;4mm x 4mm 大小的mcu。通用串口波特率&#xff0c;设置波特率为921600。 ​ 管脚映射表 GPIO编号 命名 默认功能及扩展功能 0 PA0 BOOT 1 PA1 I2C_SCL/ADC0 4 PA4 I2C_S…

前端必备技术之——AJAX

简介 AJAX 全称为 Asynchronous JavaScript And XML&#xff0c;就是异步的 JS 和 XML(现在已经基本被json取代)。通过 AJAX 可以在浏览器中向服务器发送异步请求&#xff0c;最大的优势&#xff1a;无刷新获取数据。AJAX 不是新的编程语言&#xff0c;而是一种将现有的标准组…

揭秘关键一环!数据安全服务大盘点

数据安全服务&#xff0c;数据安全体系建设的关键一环。通过数据安全服务解决数据安全建设难题&#xff0c;得到越来越多的重视。不久前&#xff0c;《工业和信息化部等十六部门关于促进数据安全产业发展的指导意见》发布&#xff0c;明确“壮大数据安全服务”&#xff0c;推进…

VScode 插件【配置】

写这篇博客的原因&#xff1a; vscode 很久以前的插件&#xff0c;忘记是干什么的了记录 vscode 好用的插件 插件介绍&#xff08;正文开始&#xff09; Auto Rename tag 开始/关闭标签内容 同步 Chinese (Simplified) VScode 中文化 CSS Peek 通过 html 代码查找到引用的样式…

Linux - 磁盘I/O性能评估

文章目录概述RAID文件系统与裸设备的对比磁盘I/O性能评判标准常用命令“sar –d”命令组合“iostat –d”命令组合“iostat –x”单独统计某个磁盘的I/O“vmstat –d”命令组合小结概述 RAID 可以根据应用的不同&#xff0c;选择不同的RAID方式 如果一个应用经常有大量的读操…

Flink(Java版)学习

一、Flink流处理简介 1.Flink 是什么 2.为什么要用 Flink 3.流处理的发展和演变 4.Flink 的主要特点 5.Flink vs Spark Streaming 二、快速上手 1.搭建maven工程 2.批处理WordCount 3.流处理WordCount 三、Flink部署 1.Standalone 模式 2.Yarn 模式 3.Kubernetes 部署 四、F…

PyTorch深度学习:60分钟入门

PyTorch深度学习&#xff1a;60分钟入门 本教程的目的: 更高层级地理解PyTorch的Tensor库以及神经网络。训练一个小的神经网络来对图像进行分类。 本教程以您拥有一定的numpy基础的前提下展开 Note: 务必确认您已经安装了 torch 和 torchvision 两个包。 这是一个基于Pytho…

Cannot resolve symbol ‘String‘或Cannot resolve symbol ‘System‘ ——IDEA

IDEA中运行报错&#xff0c;“Cannot resolve symbol ‘String‘”解决方案 ‘System‘解决 参考一&#xff1a;(31条消息) IDEA2021 提示“Cannot resolve symbol ‘String‘”解决方案_idea无法解析符号string_YT20233的博客-CSDN博客https://blog.csdn.net/CNMBZY/article…

docker 的安装与卸载

一 卸载旧版本的 Docker 1.列出系统中已安装的docker包 yum list installed | grep docker 示例 2.卸载docker yum -y remove docker-ce-cli.x86_64 yum -y remove docker-ce.x86_64 yum -y remove containerd.io 示例 二 Docker的安装 1.安装 Docker 所需的依赖&#…

虹科方案| 助力高性能视频存储解决方案-1

虹科电子科技有限公司是ATTO技术公司在中国的官方合作伙伴。依附于我们十多年的客户积累和方案提供经验&#xff0c;虹科与 ATTO共同致力于为数据密集型计算环境提供网络和存储连接以及基础架构解决方案&#xff0c;为客户提供更高性能的产品与服务。无论您的工作流程面临何种挑…

分页插件——PageHelper

文章目录1 分页查询——分页插件&#xff08;PageHelper&#xff09;1.1 概述1.2 代码实现1.2.1 在pom.xml引入依赖1.2.2 Mapper数据访问层实现1.2.3 Service业务逻辑层实现1.2.4 postman测试试2 带条件的分页查询——分页插件&#xff08;PageHelper&#xff09;2.1 需求2.2 代…