Lecture5:卷积层、池化层、全连接层

news2025/1/10 14:33:25

目录

1.卷积层、池化层、全连接层

1.1 全连接层

1.2 卷积层 

1.3 池化层


1.卷积层、池化层、全连接层

1.1 全连接层

        对全连接层而言,我们要做的就是在这些向量上进行操作,比如我们有一张RGB-D图片,它的大小为32*32*3,我们将所有像素展开,就可以得到一个3072维的向量。我们将这个向量和训练出的权重矩阵W10\times 3072相乘,然后就可以得到10个值,通过激活,我们得到了这一层的输出值。

1.2 卷积层 

        卷积层与全连接层的主要差别是它就可以保全空间结构,用一张我们之前用过的32\times 32 \times 3的图片,而不是将它展成一个长向量,我们可以保持图片的结构。我们的权重也换成了一些小的卷积核(感受野),例子中是5\times 5\times 3的大小,我们将这个卷积核在图像上移动计算出每一个空间定位时的点积结果。

        注意:这里的卷积核w是一个5\times 5\times 3的向量去和图像中的5\times 5\times 3区域进行点乘,然后加上一个偏置项。

        那么我们如何滑动卷积核并遍历所有空间位置呢?
        将这个卷积核从图片左上方的边角处开始并且让卷积核遍历输入的所有像素点,在每一个位置,我们都进行点积运算,每一次运算都会在我们输出激活映射中产生一个值。之后我们再继续滑动卷积核,最简单的方式是一个像素一个像素地滑动,我们持续地进行这样操作并相应的填满我们的输出激活映射,如下图:

        如果利用一个卷积核,输入的是一个32\times32\times3的图像,3表示通道,我们用一个    5\times 5\times 3的卷积核对图像进行卷积,最终得到了一个28 \times 28 \times 1的图像,我们先忽略这是怎么得到的。

        那么如果当我们在处理一个卷积层时我们希望用到多种卷积核,因为每一个卷积核可以从输入中提取不一样的特征(得到一种特殊的模式或概念),所以我们会有一组卷积核,这里还选择5\times 5\times 3的卷积核,如下图,这时我们最终得到了一个28 \times 28 \times 2的图像:

         因此,卷积核可以起到提取特征的作用,同时,有多少卷积核输出的图像就有多少通道:

         到此,我们总结一下在卷积神经网络中我们是如何使用这些卷积层的:GonvNet基本上是由多个卷积层组成的一个序列,它们依次堆叠就像我们之前在神经网络中那样堆叠简单的线性层一样,之后我们将用激活函数对其进行逐一处理,比方说一个ReLU激活函数,如下图:

         现在让我们看看32\times32\times3是怎样通过一个5\times 5\times 3的卷积核得到一个28 \times 28 \times 1的输出:

        为了方便理解,我们假设是7 \times 7的输入,我们有一个3\times3的卷积核,最终得到了5\times5的输出。这是因为滑动卷积核,只能水平或垂直移动五次。

        我们之前都是假定步长为1,那么步长为2会是怎样呢?只能滑动三次,因此最终得到了一个3\times3的输出。

         那如果步长为3呢?我们发现它只滑动了1次,且右面有没有拟合过的点,也就是说当采用步长3的时候和既有图像不能很好地拟合,说明这是行不通的。我们不会这样去做卷积,因为它会导致不对称的输出。

        那让我们总结一下输出尺寸如何确定吧:

\frac{(N-F)}{stride}+1

        其中,N是图片大小,F是卷积核大小,stride是步长。向下取整。 

        同时为了处理步长为3的卷积核不可行的问题,我们提出了零填充,即用0来填充像素矩阵,如下:

        那么现在输出大小会变成3\times3!当然,零填充只是一种方式,我们可以采用边缘扩充或者扩散的方法来填充边缘值。

        为什么要填充呢?因为我们通过卷积得到的像素图片的大小越来越小,这不是我们想要的,设想你有一个不错的深度网络,你的激活映射迅速缩得非常小这样是不好的。因为这会损失一些信息,你只能用很少的值来表示你的原始图像。同时当图片变得更小关于图像边角的信息也会丢掉更多。

        让我们手动计算下面一个例子:

         这里给出改进后的加入填充的公式:

output= \left \lfloor \frac{(N-F+2\times padding)}{stride}+1 \right \rfloor

         因此对于一层来说输出的大小为32\times32,但是我们用了10个卷积核,因此输出图像的通道大小为10,最后我们通过这层卷积输出的图片大小为32\times32\times10

        那么这一卷积层的参数是多少呢?

(col * vol+bias)*kernel = (5\times 5\times 3 + 1)\times 10 =760

         同样,我们可以做1\times1卷积改变深度,并且还能在后面加入激活函数:

1.3 池化层

        池化层所做的就是让所生成的表示更小自更容易控制(下采样)。且我们不会做深度方面的池化处理,因此输入的深度和输出的深度是一样的。
        最常见的方法是最大池化法,在这个例子当中池化层也有一个卷积核的大小,并且池化层的大小和我们所要池化处理的区域大小是相同的,在这个例子中,如果我们使用2\times2的滤波器并且我们设置步长为2,我们让这个卷积核滑过整个输入部分,不过我们不进行卷积操作,而是在所在图像区域提取输入的最大值,如下:

        需要补充的是,①关于步长的选择,池化层通常让卷积核没有任何重叠,只用一个数值表示一块区域;②为什么选择最大池化而不选择平均池化或者其他的池化方法:用的最多...

 ③池化层能进行填充吗?一般不在池化层填0,因为池化层只做降采样这样就不会导致卷积核扫过边缘时有一部分超出了输入的范围,这样池化时就不需要担心这样的问题。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/75428.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue3 几款值得推荐的UI组件库

推荐几个比较流行的VUE3 UI框架,同时提供出色的开发人员体验,合理利用,又或者学习借鉴都是不错的选择,排名不分先后。 Ant Design Vue 官方网站:https://2x.antdv.com/components/overview/ Ant Design Vue 是一个非…

PingCAP 成为中国唯一入选 Forrester Wave 数据库厂商,被评为卓越表现者

2022 年 12 月 6 日,国际权威研究机构 Forrester 发布了「Forrester Wave™: Translytical Data Platforms, Q4 2022 」报告,企业级开源分布式数据库厂商 PingCAP 作为中国唯一入围的数据库厂商,首次参评该报告即获评“卓越表现者&#xff08…

微服务框架 SpringCloud微服务架构 29 ES 集群 29.3 集群职责及脑裂

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 SpringCloud微服务架构 文章目录微服务框架SpringCloud微服务架构29 ES 集群29.3 集群职责及脑裂29.3.1 ES 集群的节点角色29.3.2 ES集群的分…

RAID图解

RAID图解什么是RAID各种 RAID 详解RAID 0RAID 1RAID 2(已淘汰)RAID 3RAID 4RAID 5RAID 6RAID 7RAID 01RAID 10RAID 10和RAID 01有何区别?实操教程其他问题最近在涉及到服务器安装系统这块才了解到RAID这个知识点,上网了解该知识&a…

Nginx 动静分离相关配置解析

Nginx 动静分离相关配置解析 本篇主要介绍nginx 动静分离相关配置解析 概述 动静分离是让动态网站里的动态网页根据一定规则把不变的资源和经常变的资源区分开来,动静资源做好了拆分以后,我们就可以根据静态资源的特点将其做缓存操作,这就是…

基于jsp+mysql+ssm智慧仓库进销存系统-计算机毕业设计

项目介绍 企业仓库库存系统的设计在SSM的框架下,采用JAVA编程语言和JSP技术,,并使用Mysql作为系统的数据库。该系统设计了强大的功能模块,考虑了企业库存管理的各个方面。这些主要功能模块分别是系统用户管理、用户信息管理、商品…

CUDNN与CUDA的踩坑与记录

CUDNN与CUDA的踩坑与记录 CUDA的安装 nvidia-smi看显卡驱动能够安装的最高版本的CUDA下载CUDA–>点击安装过程去掉显卡驱动安装完成的结果如下:Summary Driver: Not Selected Toolkit: Installed in /usr/local/cuda-10.2/ Samples: Installed in /home/g…

【世界杯中的安全思考】工控设备

目录 1、总述 2、半自动越位技术:人工智能辅助裁判 3、卡塔尔的智能道路 4、体育场的冷却技术 5、医疗援助的可穿戴设备 6、实时导航 7、照明系统 8、感官观察室 1、总述 从世界杯带来的科技感,可以看出大到球场,小到足球,…

厨房装修竟然有这么多你不知道的事

每个家庭的厨房大小、形状不同,厨房的建筑结构在房子中往往也是比较复杂的,橱柜等设施如何安置,都要因地制宜,很难说怎样做最好。但这并不意味着厨房的布局没有规律可循。在规划厨房布局时,最简单的办法就是按照做饭的…

微服务框架 SpringCloud微服务架构 29 ES 集群 29.1 集群结构介绍

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 SpringCloud微服务架构 文章目录微服务框架SpringCloud微服务架构29 ES 集群29.1 集群结构介绍29.1.1 ES集群结构29 ES 集群 29.1 集群结构…

银行软件测试简历模板,找工作的小伙伴看过来了

目录 个人简历 教育背景 工作经历 自我评价 专业技能 总结 重点:配套学习资料和视频教学 个人简历 姓  名: 性  别: 学  历: 经  验: 手  机: 邮  箱: 政治面貌&#…

水滴公司Q3财报引股价增长,保险业复苏“第一枪”打响了?

2020年以来,保险行业整体都笼罩在发展失速的低迷中。 2020年,在保险中介监管信息系统执业登记的保险销售从业人员有971.2万人,而2022年6月,这项数据为570.7万人,接近腰斩。公开数据显示,2022前三季度&…

DDR4时序标准规范(二)

DDR4时序标准规范编码模式寄存器(MRx)模式寄存器0(MR0)CAS延迟测试模式TM写恢复(WR)/读预充DLL(延时锁相环)复位模式寄存器1(MR1)DLL(延时锁相环)使能/禁用ODT RTT(标称)值AL(附加延迟)写入均衡终端数据选通(TDQS)模式寄存器2(MR2)CAS写延迟低功耗自动自…

在ros中创建yolov5-onnxruntime功能包

文章目录 工作目录依赖库ROS其他依赖库Yolov5-onnxruntimeCMakeLists.txt编译可能存在的问题工作目录 在vscode中新建功能包apple_detect 依赖库 ROS cv_bridgegeometry_msgsimage_transportmessage_generationroscpprospysensor_msgsstd_msgs其他依赖库 opencv4.6.0onnxru…

计算机毕业设计ssm+vue基本微信小程序的心理咨询服务系统 uniapp 小程序

项目介绍 随着计算机技术的发展,带来社会各行业的进步,信息化逐渐运用到人们的生活中。传统模式的会员心理健康管理满足不了现代人的生活追求,服务质量、服务速度,之前的很多网站由于功能、或者框架设计等原因,无法完美的展现它的特色,优势,浪费了很多资源。使用管理系统进行管…

绿色荧光试剂210236-90-1,Fitc-TSA,Fluorescein TSA,Fitc-Tyramide荧光素酪胺

试剂基团反应特点(Reagent group reaction characteristics): Fluorescein Tyramide(荧光素酪胺)是一种绿色荧光试剂,广泛用于 IHC、ICC、FISH 和多色 FISH 中的酪胺信号放大 (TSA)。 HRP 催化多个酪胺分子…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java垃圾回收系统j16l0

这个选题的话其实有很多的,就看你自己能接受怎么样的,比如可以做网站类、系统类、小程序类、安卓app、大数据类等等,这个也要看你个人能力和技术问题,如果技术小白或者有一点点基础的话建议选择网站类和系统类的,如果有…

用HTML+CSS做一个漂亮简单大学生校园班级网页

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

数据时代,漫谈数据建模

不管什么样的模型都可以理解为一种预设,比如像一张大宽表,它的维度和指标在大宽表中就是固定的,只是维度列多一些,指标多一些,给了用户更多的一种组合维度和指标的可能,并不是说就没有模型的概念。 在理解…

Python实战案例,PyQt5模块,实现疫情信息快速查看工具(附源码)

前言 今天给大家介绍的是Python疫情信息快速查看工具,在这里给需要的小伙伴们代码,并且给出一点小心得。 PyQt概述 PyQt5是Qt框架的Python语言实现,由Riverbank Computing开发,是最强大的GUI库之一。PyQt提供了一个设计良好的窗…