深度学习入门基础CNN系列——填充(padding)与步幅(stride)

news2025/1/14 18:23:03

填充(padding)

在这里插入图片描述
在上图中,输入图片尺寸为 3 × 3 3\times3 3×3,输出图片尺寸为 2 × 2 2\times2 2×2,经过一次卷积之后,图片尺寸为 2 × 2 2\times2 2×2,经过一次卷积之后,图片尺寸变小。卷积输出特征图的尺寸计算方法如下(卷积核的高和宽分别为 k h 和 k w k_h和k_w khkw):
H o u t = H − k h + 1 W o u t = W − k w + 1 H_{out}=H-k_h+1\\ W_{out}=W-k_w+1 Hout=Hkh+1Wout=Wkw+1
如果输入尺寸为4,卷积核大小为3时,输出尺寸为 4 − 3 + 1 = 2 4-3+1=2 43+1=2。读者可以自行检查当输入图片和卷积核为其他尺寸时,上述计算式是否成立。当卷积核尺寸大于1时,输出特征图的尺寸会小于输入图片尺寸。如果经过多次卷积,输出图片尺寸会不断减小。为了避免卷积之后图片尺寸变小,通常会在图片的外围进行填充(padding),如下图所示
在这里插入图片描述

  • 如图(a)所示:填充的大小为1,填充值为0。填充之后,输入图片尺寸从 4 × 4 4\times4 4×4变成了 6 × 6 6\times6 6×6,使用 3 × 3 3\times3 3×3的卷积核,输出图片尺寸为 4 × 4 4\times4 4×4
  • 如图(b)所示:填充的大小为2,填充值为0。填充之后,输入图片尺寸从 4 × 4 4\times4 4×4变成了 8 × 8 8\times8 8×8,使用 3 × 3 3\times3 3×3的卷积核,输出图片尺寸为 6 × 6 6\times6 6×6

如果在图片高度方向,在第一行之前填充 p h 1 p_{h1} ph1行,在最后一行之后填充 p h 2 p_{h2} ph2行;在图片的宽度方向,在第1列之前填充 p w 1 p_{w1} pw1列,在最后1列之后填充 p w 2 p_{w2} pw2列;则填充之后的图片尺寸为 ( H + p h 1 + p h 2 ) × ( W + p w 1 + p w 2 ) (H+p_{h1}+p_{h2})\times (W+p_{w1}+p_{w2}) (H+ph1+ph2)×(W+pw1+pw2)。经过大小为 k h × k w k_h\times k_w kh×kw的卷积核操作之后,输出图片的尺寸为:
H o u t = H + p h 1 + p h 2 − k h + 1 W o u t = W + p w 1 + p w 2 − k w + 1 H_{out}=H+p_{h1}+p_{h2}-k_h+1\\ W_{out}=W+p_{w1}+p_{w2}-k_w+1 Hout=H+ph1+ph2kh+1Wout=W+pw1+pw2kw+1
在卷积计算过程中,通常会在高度或宽度的两侧采取等量填充,即 p h 1 = p h 2 = p h , p w 1 = p w 2 = p w p_{h1}=p_{h2}=p_h,p_{w1}=p_{w2}=p_w ph1=ph2=ph,pw1=pw2=pw,所以上面的公式就变为了:
H o u t = H + 2 p h − k h + 1 W o u t = W + 2 p w − k w + 1 H_{out}=H+2p_h-k_h+1\\ W_{out}=W+2p_w-k_w+1 Hout=H+2phkh+1Wout=W+2pwkw+1
卷积核大小通常使用1,3,5,7这样的奇数,如果使用的填充大小为 p h = ( k h − 1 ) / 2 , p w = ( k w − 1 ) / 2 p_h=(k_h-1)/2,p_w=(k_w-1)/2 ph=(kh1)/2,pw=(kw1)/2,则卷积之后图像尺寸不变。
例如当卷积核大小为3时,padding大小为1,卷积之后图像尺寸不变,与图(a)一样;同理,如果卷积核大小为5,padding大小为2,也能保持图像尺寸不变。

步幅(stride)

Alt
上图中卷积核每次滑动一个像素点,这是步幅为1的特殊情况,下面两张图是步幅为2的卷积过程,卷积核在图片上移动时,每次移动大小为2个像素点。
Alt
在这里插入图片描述
以第二张静态图为例子:
当宽和高的步幅分别为 s h 和 s w s_h和s_w shsw时,输出特征图尺寸的计算公式是:
H o u t = H + 2 p h − k h s h + 1 W o u t = W + 2 p w − k w s w + 1 H_{out}=\frac{H+2p_{h}-k_h}{s_h}+1\\ W_{out}=\frac{W+2p_w-k_w}{s_w}+1 Hout=shH+2phkh+1Wout=swW+2pwkw+1
假设输入图片尺寸时 H × W = 100 × 100 H\times W=100\times100 H×W=100×100,卷积核大小为 k h × k w = 3 × 3 k_h\times k_w=3\times3 kh×kw=3×3,填充 p h = p w = 1 p_h=p_w=1 ph=pw=1,步幅为 s h = s w = 2 s_h=s_w=2 sh=sw=2,则输出特征图的尺寸为:
H o u t = 100 + 2 − 3 2 + 1 = 50 W o u t = 100 + 2 − 3 2 + 1 = 50 H_{out}=\frac{100+2-3}{2}+1=50\\ W_{out}=\frac{100+2-3}{2}+1=50 Hout=2100+23+1=50Wout=2100+23+1=50

总结:

1。卷积输出特征图的尺寸计算方法如下(卷积核的高和宽分别为 k h 和 k w k_h和k_w khkw): H o u t = H − k h + 1 W o u t = W − k w + 1 H_{out}=H-k_h+1\\ W_{out}=W-k_w+1 Hout=Hkh+1Wout=Wkw+1
2。当宽和高的步幅分别为 s h 和 s w s_h和s_w shsw时,输出特征图尺寸的计算公式是:
H o u t = H + 2 p h − k h s h + 1 W o u t = W + 2 p w − k w s w + 1 H_{out}=\frac{H+2p_{h}-k_h}{s_h}+1\\ W_{out}=\frac{W+2p_w-k_w}{s_w}+1 Hout=shH+2phkh+1Wout=swW+2pwkw+1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/169521.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

el-table表头添加勾选框

el-table表头添加勾选框嘚吧嘚实现嘚吧嘚 table的行勾选是比较常规的操作,但是有的时候就有各种奇葩的需求蹦出来。😭 比如最近有一个需求,不仅需要勾选行,还需要勾选列,其实我心中有了一万头可爱的小羊驼&#xff0c…

NISP三级证书含金量如何

国家信息安全水平测试(NationalInformationSecurityTestProgram,通称NISP),是通过中国信息安全测评中心执行塑造我国网络空间安全优秀人才的一个项目。 为培养大量出色的实践型网络安全人才,中国信息安全测评中心上线…

SpringCloud Alibaba微服务 -- Seata的原理和使用

文章目录一、认识Seata1.1 Seata 是什么?1.2 了解AT、TCC、SAGA事务模式?AT 模式前提整体机制如何实现写隔离如何实现读隔离TCC 模式Saga 模式Saga 模式适用场景Saga 模式优势Saga 模式缺点二、Seata安装2.1 下载2.2 创建所需数据表2.2.1 创建 分支表、全局表、锁表2.2.2 创建…

Qt OpenGL(10)光照模型基础

文章目录物体的光照模型立方体坐标构建立方体的6个面代码框架widget.cpp顶点着色器片元着色器Ambient 环境光Diffuse 漫反色法向量计算漫反射分量Specular Highlight镜面高光计算镜面反射分量补充:半程向量的使用物体的光照模型 出于性能的原因,一般使用…

思科Cisco交换机的基本命令

一、设备的工作模式1、用户模式Switch>可以查看交换机的基本简单信息,且不能做任何修改配置!2、特权模式Switch> enable Switch#可以查看所有配置,且不能修改配置!3、全局配置模式switch# configure terminal switch(config…

Redis基础——SpringDataRedis快速入门

文章目录1. SpringDataRedis介绍2. SpringDataRedis快速入门2.1 SpringDataRedis的使用步骤1. SpringDataRedis介绍 SpringData是Spring中数据操作的模块,包含对各种数据库的集成,其中对Redis的集成模块就叫做SpringDataRedis 官方网址 提供了对不同Redi…

参加猿代码超算实习生计划靠谱吗?

猿代码近期推出了超级实习生计划,相比市面上同类型实习类产品,超算实习生计划服务群体范围更小一些,主要服务于有志于从事芯片行业的大学生们,专做芯片赛道实习就业产品。那么至今为止有人参加过猿代码超算实习生计划吗?这个产品…

〖产品思维训练白宝书 - 核心竞争力篇①〗- 产品经理 的核心竞争力解读

大家好,我是 哈士奇 ,一位工作了十年的"技术混子", 致力于为开发者赋能的UP主, 目前正在运营着 TFS_CLUB社区。 💬 人生格言:优于别人,并不高贵,真正的高贵应该是优于过去的自己。💬 &#x1f4e…

Top 命令中的 Irix 模式与 Solaris 模式(解释单个进程cpu占比为何会超过100%?)

文章目录 背景top cpu 栏位说明Solaris 模式Irix ModeTOP -H切换线程总结背景 关于top命令用了很久了,但是一直对单进程占用cpu占比为何会超过100%认识不够深刻。 top cpu 栏位说明 1. %CPU -- CPU UsageThe tasks share of the elapsed CPU time since the last screen…

深度学习入门基础CNN系列——卷积计算

卷积计算 卷积是数学分析中的一种积分变换的方法,在图像处理中采用的是卷积的离散形式。这里需要说明的是,在卷积神经网络中,卷积层的实现方式实际上是数学中定义的互相关 (cross-correlation)运算,与数学…

【项目实战】package.json你需要了解内容

package.json文件^和~区别 在项目开发中常引用npm包,那么package.json文件^和~区别是什么? ^意思是将当前库的版本更新到第一个数字, 例:"^4.1.0"是库会更新到4.X.X的最新版本,但不会更新到5.X.X版本。~意…

基于卷积深度神经网络的句子单子关系分类(附完整版代码)

基于卷积深度神经网络的关系分类 直接先上结果: 用于关系分类的最先进的方法主要基于统计机器学习,并且它们的性能很大程度上取决于提取的特征的质量。提取的特征通常来自预先存在的自然语言处理(NLP)系统的输出,这导致错误在现有工具中的传播和阻碍这些系统的性能。在本文…

计算机网络学习笔记(四)网络层 - 数据层面

文章目录网络层概述1.转发和路由选择2.网络服务模型网际协议1.IPv4(1) IPv4数据报格式(2)IPv4数据报分片(3)IPv4编址2.IPv6(1) IPv6数据报格式(2)IPv4迁移到IPv6网络层概述 1.转发和路由选择 网络层的作用…

【虹科回顾】2022网络安全精选内容回顾

“我们身上最有价值的东西, 不是证书和技能, 而是过去一切经历的总和。” 2022年已落幕,过去再也不会重来,无论是怎样的一年,都是我们自己生命中特别的一年。 2023年已来,我无法给您提供证书或者技能&a…

Jupyter Lab 的 10 个有用技巧

JupyterLab是 Jupyter Notebook「新」界面。它包含了jupyter notebook的所有功能,并升级增加了很多功能。它最大的更新是模块化的界面,可以在同一个窗口以标签的形式同时打开好几个文档,同时插件管理非常强大,使用起来要比jupyter…

el-date-picker实现通过其他方式触发日期选择器

el-date-picker 目前只能通过点击input输入框触发日期选择器,项目中需要通过其他方式触发日期选择器同时把input输入框去掉,如点击按钮 该模块由于后端接口数据传输限制 在前面文章里做了些许改动。 需求左右切换 可以快速找到年份,于是添加…

大数据技术架构(组件)——Hive:环境准备3

1.0.2、服务启动在搭建Hadoop的环节中,已经将Hadoop服务启动了,这里将Hive Metastore服务启动hive --service metastore1.0.2.1、服务端启动Debug模式为了方便学习,大家可以在IDEA中打开Terminal,开启debug模式和metastore服务启动…

C++设计模式实践——线上购物系统

一、系统的主要目标与功能 在本次设计中,考虑到目前疫情反复不断,为了方便群众,超市都推出在线购物并有配送员送货,于是我设计了一个超市在线网上购物送货的系统,这个系统的主要目标是帮助人们在家里购买自己需要的套…

Rust 学习笔记

参考自Rust 程序设计语言 简体中文版 1. Hello world 2. Cargo(Rust 的构建系统和包管理器) 使用 Cargo 创建项目 Cargo 配置文件 Cargo 目录结构 构建并运行 Cargo 项目 发布(release)构建 Cargo 常用命令 cargo build&#xf…

【青训营】Go的测试

Go的测试 测试主要包括:回归测试、集成测试、单元测试 一、单元测试 其中测试单元可以是函数,也可以是模块 规则: 1.所有测试文件都以_test.go结尾 2.测试函数命名规范:func TestXxx(*Testing.T) 3.初始化逻辑需要放置在TestMain中 以下是…