【小白深度学习入门】【3】卷积层中的Padding填充详解:作用、类型、优缺点

news2024/9/28 13:24:34

《博主简介》

小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。
👍感谢小伙伴们点赞、关注!

《------往期经典推荐------》

一、AI应用软件开发实战专栏【链接】

项目名称项目名称
1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】
3.【手势识别系统开发】4.【人脸面部活体检测系统开发】
5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】
7.【YOLOv8多目标识别与自动标注软件开发】8.【基于YOLOv8深度学习的行人跌倒检测系统】
9.【基于YOLOv8深度学习的PCB板缺陷检测系统】10.【基于YOLOv8深度学习的生活垃圾分类目标检测系统】
11.【基于YOLOv8深度学习的安全帽目标检测系统】12.【基于YOLOv8深度学习的120种犬类检测与识别系统】
13.【基于YOLOv8深度学习的路面坑洞检测系统】14.【基于YOLOv8深度学习的火焰烟雾检测系统】
15.【基于YOLOv8深度学习的钢材表面缺陷检测系统】16.【基于YOLOv8深度学习的舰船目标分类检测系统】
17.【基于YOLOv8深度学习的西红柿成熟度检测系统】18.【基于YOLOv8深度学习的血细胞检测与计数系统】
19.【基于YOLOv8深度学习的吸烟/抽烟行为检测系统】20.【基于YOLOv8深度学习的水稻害虫检测与识别系统】
21.【基于YOLOv8深度学习的高精度车辆行人检测与计数系统】22.【基于YOLOv8深度学习的路面标志线检测与识别系统】
23.【基于YOLOv8深度学习的智能小麦害虫检测识别系统】24.【基于YOLOv8深度学习的智能玉米害虫检测识别系统】
25.【基于YOLOv8深度学习的200种鸟类智能检测与识别系统】26.【基于YOLOv8深度学习的45种交通标志智能检测与识别系统】
27.【基于YOLOv8深度学习的人脸面部表情识别系统】28.【基于YOLOv8深度学习的苹果叶片病害智能诊断系统】
29.【基于YOLOv8深度学习的智能肺炎诊断系统】30.【基于YOLOv8深度学习的葡萄簇目标检测系统】
31.【基于YOLOv8深度学习的100种中草药智能识别系统】32.【基于YOLOv8深度学习的102种花卉智能识别系统】
33.【基于YOLOv8深度学习的100种蝴蝶智能识别系统】34.【基于YOLOv8深度学习的水稻叶片病害智能诊断系统】
35.【基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统】36.【基于YOLOv8深度学习的智能草莓病害检测与分割系统】
37.【基于YOLOv8深度学习的复杂场景下船舶目标检测系统】38.【基于YOLOv8深度学习的农作物幼苗与杂草检测系统】
39.【基于YOLOv8深度学习的智能道路裂缝检测与分析系统】40.【基于YOLOv8深度学习的葡萄病害智能诊断与防治系统】
41.【基于YOLOv8深度学习的遥感地理空间物体检测系统】42.【基于YOLOv8深度学习的无人机视角地面物体检测系统】
43.【基于YOLOv8深度学习的木薯病害智能诊断与防治系统】44.【基于YOLOv8深度学习的野外火焰烟雾检测系统】
45.【基于YOLOv8深度学习的脑肿瘤智能检测系统】46.【基于YOLOv8深度学习的玉米叶片病害智能诊断与防治系统】
47.【基于YOLOv8深度学习的橙子病害智能诊断与防治系统】48.【车辆检测追踪与流量计数系统】
49.【行人检测追踪与双向流量计数系统】50.【基于YOLOv8深度学习的反光衣检测与预警系统】
51.【危险区域人员闯入检测与报警系统】52.【高密度人脸智能检测与统计系统】
53.【CT扫描图像肾结石智能检测系统】54.【水果智能检测系统】
55.【水果质量好坏智能检测系统】56.【蔬菜目标检测与识别系统】
57.【非机动车驾驶员头盔检测系统】58.【太阳能电池板检测与分析系统】
59.【工业螺栓螺母检测】60.【金属焊缝缺陷检测系统】
61.【链条缺陷检测与识别系统】62.【交通信号灯检测识别】

二、机器学习实战专栏【链接】,已更新31期,欢迎关注,持续更新中~~
三、深度学习【Pytorch】专栏【链接】
四、【Stable Diffusion绘画系列】专栏【链接】
五、YOLOv8改进专栏【链接】持续更新中~~
六、YOLO性能对比专栏【链接】,持续更新中~

《------正文------》

目录

    • 引言
    • 什么是Padding填充
    • 无填充卷积层的问题
    • 填充对输入图像的影响
    • 填充的优缺点
      • 卷积层中填充的优点
      • 卷积层中填充的缺点

引言

在卷积过程中,输出特征图的大小由输入特征图的大小、卷积核的大小和步幅决定。如果我们简单地在输入特征图上应用卷积核,那么输出特征图将小于输入。这可能导致输入特征图边界处的信息丢失。为了保留边界信息,我们使用填充。

什么是Padding填充

填充是一种用于在对特征图进行卷积操作之后保持输入图像空间维度的技术。填充涉及在卷积之前在输入特征图的边界周围添加额外的像素。

这可以通过两种方式完成:

  • 有效填充:指在输入数据外围不添加任何填充,只使用原始数据进行卷积操作,输出的特征图尺寸会小于输入数据的尺寸。当我们想要减少特征图的空间维度时,这很有用。
  • 相同填充:指在输入数据外围添加一定数量的0值元素,使得输出的特征图尺寸与输入数据的尺寸相同。当我们想要保留特征图的空间维度时,这很有用。

要添加用于填充的像素数量可以基于内核的大小和特征图大小的期望输出来计算。最常见的填充值是零填充,它涉及向输入特征图的边界添加零。

填充可以帮助减少输入特征图边界处的信息丢失,并可以提高模型的性能。然而,它也增加了卷积运算的计算成本。总的来说,填充是CNN中的一项重要技术,有助于保留特征图的空间维度,并可以提高模型的性能。

无填充卷积层的问题

  • 对于灰度(n x n)图像和(f x f)滤波器/卷积核,由卷积运算产生的图像的维度是(n-f + 1)x(n-f + 1)。
    例如,对于(8 x 8)图像和(3 x 3)滤波器,卷积运算后的输出大小为(6 x 6)。因此,每次执行卷积操作时,图像都会缩小。这对图像缩小到零之前可以执行此类操作的次数设置了上限,从而阻止我们构建更深层次的网络。
  • 此外,角落和边缘上的像素比中间的像素使用得少得多。
    例如:下图中像素A仅在一次卷积操作中被触摸,像素B在3次卷积操作中被触摸,而像素C在9次卷积操作中被触摸。一般来说,中间的像素比角落和边缘上的像素使用得更频繁。因此,关于图像的边界的信息不能像中间的信息那样被保留。

卷积神经网络中的填充

填充对输入图像的影响

填充只是一个向输入图像添加零层的过程,以便通过对输入图像的更改,来避免上述问题。

在这里插入图片描述

填充可防止输入图像缩小。

n X n的大小图像输入,图像输出大小为(n +2p- f + 1)x(n +2p- f + 1)

p=添加到图像边界的零层的数量,

f = 卷积核的大小

例如,通过向(8 x 8)图像添加 一层填充(p=1) 并使用(3 x 3)过滤器,我们将在执行卷积操作后获得(8 x 8)输出。

如果是(5 X 5 )的卷积核大小,要保持相同的特征图尺寸输入与输出大小一致,则需要2层填充(p=2)

这通过将原始图像的边界处的像素带入填充图像的中间来增加它们的贡献。因此,保留了边界信息以及图像中间的信息。

除了零填充之外,还可以使用其他类型的填充,例如反射填充和复制填充。反射填充涉及沿输入特征图的边界沿着反射输入特征图,而复制填充涉及沿输入特征图的边界沿着复制输入特征图的像素。

填充类型的选择取决于模型的特定要求和手头的任务。一般来说,当我们想要保留特征图的空间维度时,相同的填充是首选的,而当我们想要减少特征图的空间维度时,有效的填充是首选的。

填充的优缺点

卷积层中填充的优点

  1. 保留空间信息:填充有助于保留特征图的空间维度,这在许多图像处理任务中非常重要。在没有填充的情况下,特征图的空间维度将在每次卷积操作之后减小,这可能导致输入特征图的边界处的重要信息的丢失。
  2. 改进的模型性能:填充可以通过减少输入特征图边界处的信息丢失来帮助提高模型的性能。这可以导致更好的准确性和更高的预测分数。
  3. 灵活性:填充的使用提供了选择内核大小和步幅的灵活性。它可以允许使用更大的内核和/或步幅,而不会丢失重要的空间信息。

卷积层中填充的缺点

  1. 增加计算成本:填充涉及向输入特征图添加额外的像素,这增加了卷积运算的计算成本。这可能导致更长的训练时间和更慢的推理时间。
  2. 增加的内存使用:使用填充会增加模型的内存使用,这在资源受限的环境中可能是一个问题。
  3. 总的来说,在大多数情况下,卷积层中填充的优点大于缺点,因为它可以帮助保留空间信息,提高模型性能,并提供选择内核大小和步幅的灵活性。然而,在设计卷积神经网络时,应考虑增加的计算成本和内存使用。

好了,这篇文章就介绍到这里,喜欢的小伙伴感谢给点个赞和关注,更多精彩内容持续更新~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2088385.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

oceanbase 常用视图查询记录

测试环境:1-1-1 OceanBase 企业版3.2.4.4 查看租户的 Context 和 Modudle 内存 SELECT tenant_id, svr_ip, ctx_id, ctx_name, mod_name, count, round(HOLD / 1024 / 1024, 2) hold_mb, round(used / 1024 / 1024, 2) used_mb FROM oceanbase.__all_virtual_memory…

noge-gyp构建项目踩坑记录

开发环境 系统: win11 node: 19.7.0 npm: 8.3.2 node-gyp: 10.0.2可以不使用windows-build-tools来安装构建工具,手动进行安装 我这边用windows-build-tools安装时候会提示 process.env only accepts a configurable, writable, and enumerable data descriptor. 查了资料后…

设计者模式之访问者模式

1.访问者模式概述 允许你在不改变对象结构中的元素类的前提下,向对象结构中的元素增加新的行为。这种模式将数据结构与作用于结构上的操作分离,从而使得我们可以独立地改变数据结构和操作。 2.访问者模式的组成部分 1)Visitor(访…

Mysql基础练习题 595.大的国家 (力扣)

如果一个国家满足下述两个条件之一,则认为该国是 大国 : 面积至少为 300 万平方公里(即,3000000 km2),或者 人口至少为 2500 万(即 25000000) 编写解决方案找出 大国 的国家名称、…

可视耳勺有没有实用性?揭露五大隐患套路!

随着科技的进步,很多人着重关注自己的个护健康,传统挖耳勺的盲目操作引起鼓膜受损的操作屡见不鲜,很多人摈弃传统挖耳勺,选择了更加直观挖耳的可视耳勺,它能通过高清内窥镜进入耳朵实时反映耳道的情况,受到…

无人机飞手执照,合法飞行不得不考的证

无人机飞手执照(也称为民用无人驾驶航空器系统驾驶员合格证或遥控航空模型飞行员执照)在特定情况下是合法飞行所必需的。以下是关于无人机飞手执照的详细解答: 一、无人机飞手执照的必要性 1. 法规要求:根据《民用无人驾驶航空器…

【安当产品应用案例100集】013-安当透明加密组件实现企业网盘数据安全存储

企业数据存储是企业运营中一个复杂关键的过程,它涉及多个方面,包括选择合适的存储解决方案、实施数据备份与恢复策略、确保数据安全以及优化存储性能等。 本案例中,我们将以企业网盘文件存储和共享为例,介绍一下办公场景和出差场…

html2canvas、pdf-lib、file-saver将html页面导出成pdf

html2canvas、pdf-lib、file-saver将html页面导出成pdf 项目背景 需要根据用户的账号信息,生成一个pdf报告发给客户,要求报告包含echart饼图、走势图等。 方案 使用html2canvas,将页面转成图片,再通过pdf-lib将图片转成pdf文件…

食家巷一窝丝:匠心传承的美味传奇

在美食的广袤天地中,有一种独特的存在 —— 食家巷一窝丝。它不仅仅是一道美食,更是一种文化的传承,一段历史的记忆。食家巷一窝丝,以其精湛的制作工艺和独特的口感令人陶醉。每一根丝都细如发丝,均匀整齐,…

基于CW2217B的库仑计硬件设计

一、CW2217简介: CW2217B是一款适用于穿戴设备的超低功耗锂电池电量计芯片。芯片监测电池在充放电状态下的电压,电流和温度,运行专利“FastCali”电量计算法,结合电池建模信息,可准确计算电池的剩余电量。CW2217B适用于包括锂锰,锂钴和聚合物等多种类型的锂电池应用。 …

fastadmin 列表显示渲染图片

想把地址显示成图片 在对应的js文件里加上这句话 formatter: Table.api.formatter.image 如果想点击图片列可以看图片的大图,则需要加上 events: Table.api.events.image 效果 Table.api.formatter Table.api.formatter封装了许多FastAdmin表格列表中常用的单元…

从入门到精通:TEMU商家如何利用自养号测评打造爆款

TEMU平台以其独特的魅力和无限潜力,吸引着众多商家竞相入驻。然而,面对激烈的市场竞争,如何快速提高销量,成为摆在每位商家面前的重大课题。本文将深入剖析一种高效且具策略性的方法——精细化自养号测评,帮助TEMU商家…

比较器(过零/非过零检测+噪声的影响+滞回+输出限幅+窗口比较器)

2024-8-30,星期五,7:25,天气:晴,心情:晴。今天周五啦,终于可以休息了,也祝大家周末快乐,玩的开心!。 今天开始了第八章基本运算放大器电路的学习&#xff0c…

Python计算机视觉 第6章-图像聚类

Python计算机视觉 第6章-图像聚类 6.1 K-means聚类 K-means 聚类 是一种常用的无监督学习算法,用于将数据集划分为 ( K ) 个簇。 算法步骤 选择 ( K ) 个初始簇中心(可以是随机选择或其他启发式方法)。将每个数据点分配到距离其最近的簇…

排查C++程序CPU异常占用方法

如果服务器资源允许可以考虑一些CPU资源占用工具,例如Perf、SystemTap。 服务器资源不允许的情况下可以使用GDB调试。 步骤如下: 1、使用top查看CPU高占用的程序,记下它的进程ID; 2、多线程服务排查时,需要排查对应…

案例分享 | Digimat应用于金属材料的仿真

Digimat——应用于金属材料的仿真 Digimat是一款专注于多尺度复合材料非线性材料本构预测和材料建模的商用软件包。Digimat能够帮助用户预测多相材料的宏观性能,支持的材料范围涉及包含连续纤维、长纤维、短纤维、纤维编织、晶须、颗粒、片层等所有增强相和包括树脂…

代理IP设置白名单:让你的网络更安全高效

在网络世界中,代理IP不仅能帮助我们提升网络速度、保护隐私,还能通过设置白名单来进一步增强网络的安全性和稳定性。本文将详细介绍代理IP设置白名单的方法和注意事项,让你在使用代理IP时更加得心应手。 什么是代理IP白名单? 代…

11款主流图纸加密软件盘点,图纸加密软件大盘点

在数字化时代,图纸作为企业核心知识产权的重要组成部分,其安全保护显得尤为重要。随着技术的发展,越来越多的图纸加密软件应运而生,为企业提供了多样化的安全解决方案。以下是11款主流图纸加密软件的详细介绍,它们各自…

Linux基础知识(一、什么是Linux)

一、Linux之父——林纳斯本纳第克特托瓦兹(Linus Benedict Torvalds) Linux操作系统最初是在1991年10月份由芬兰赫尔辛基大学的在校生Linus Torvalds所发布,最初被发布的LINUX0.02版本因其高质量的代码与开放源代码,迅速引起了一大批黑客的加…

空间旋转与四元数

参考资料:https://krasjet.github.io/quaternion/quaternion.pdf 一、二维空间与复数 已知复数 z a b i zabi zabi,我们规定其向量表示形式为 [ a b ] \left [ \begin{matrix}a\\b\end{matrix}\right ] [ab​]。我们可以将其看成是复数域的两个基底 {…