1.6什么是“空洞卷积”?简述空洞卷积的设计思路

news2024/11/16 0:05:38

1.6 简述空洞卷积的设计思路

  • 背景:在语义分割(Semantic Segmentation)任务中,一般需要先缩小特征图尺寸,做信息聚合;

    然后再复原到之前的尺寸,最终返回与原始图像尺寸相同的分割结果图。

  • 问题:常见的语义分割模型,如全卷积网络(Fully Convolutional Networks,FCN),一般采用池化操作(pooling)来扩大特征图的感受野,但这同时会降低特征图的分辨率,丢失一些信息(如内部数据结构、空间层级信息等),导致后续的上采样操作(如转置卷积)无法还原一些细节,从而限制最终分割精度的提升。

  • 解决:如何不通过池化等下采样操作就能扩大感受野呢?空洞卷积应运而生。

  • 概念:顾名思义,空洞卷积就是在标准的,以增加卷积核的感受野

    空洞卷积引入了**扩张率(dilation rate)**这个超参数来指定相邻采样点之间的间隔:扩张率为r的空洞卷积,卷积核上相邻数据点之间有r-1个空洞,如图1.7所示(图中有绿点的方格表示有效的采样点,黄色方格为空洞)。
    在这里插入图片描述

  • 计算空洞卷积核尺寸

标准卷积核尺寸对应的扩张率为r的空洞卷积核尺寸
k w × k h {k_w} \times {k_h} kw×kh k e + ( r − 1 ) ( k e − 1 ) , e ∈ { w , h } {k_e} + (r - 1)({k_e} - 1),e \in \{ w,h\} ke+(r1)(ke1),e{w,h}
特别地,扩张率为1的空洞卷积实际上就是普通卷积(没有空洞)。
  • 计算空洞卷积感受野

空洞卷积感受野的计算,与普通卷积感受野的计算方式基本一致,只是将其中的卷积核尺寸替换为扩张后的卷积核尺寸(即包括空洞在内)。

普通卷积感受野的计算:详见 https://blog.csdn.net/seasonsyy/article/details/132816967

感受野计算公式:
F ( i ) = ( F ( i + 1 ) − 1 ) × S t r i d e + K s i z e F(i)=(F(i+1)−1)×Stride+Ksize F(i)=(F(i+1)1)×Stride+Ksize

以图1.7为例,假设依次用图(a)、(b)、©中的空洞卷积来搭建三层神经网络:

stride=1

第三层是图1.7(a)中的空洞卷积,扩张后的卷积核尺寸为3×3;

第二层是图1.7(b)中r=2的空洞卷积,扩张后的卷积核尺寸为5×5;

第一层是图1.7©中r=4的空洞卷积,扩张后的卷积核尺寸为9×9。

根据感受野公式:
F ( i ) = ( F ( i + 1 ) − 1 ) × S t r i d e + K s i z e F(i)=(F(i+1)−1)×Stride+Ksize F(i)=(F(i+1)1)×Stride+Ksize

感受野计算感受野大小
(如图1.7中黄色阴影部分所示)
第三层F(3)=3×33×3
第二层F(2)=(F(3)-1)×1+5=77×7
第一层F(1)=(F(2)-1)×1+9=1515×15

由此可以看出,空洞卷积利用空洞结构扩大了卷积核尺寸,不经过下采样操作即可增大感受野,同时还能保留输入数据的内部结构。

参考文献:

《百面深度学习》 诸葛越 江云胜主编

出版社:人民邮电出版社(北京)

ISBN:978-7-115-53097-4

2020年7月第1版(2020年7月北京第二次印刷)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1508896.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

游戏开发中的坑之十三 Lut贴图相关问题

1.网上下载的或者游戏截帧得到的Lut贴图贴上之后可能效果如下,需要在PS里垂直方向反转一下贴图。 2.相关设置: (1)取消勾选sRGB; (2)像素为1024x32或者512x16; (3&#…

利驰新品SuperBox配电箱设计软件专属特惠!

SuperBox是一款由利驰软件专业的技术、产品工程师多次深入用户现场,与用户紧密合作完成配电箱项目的报价、设计和出图,历时三年精心打磨出的专业配电箱设计软件。软件功能涵盖报价、设计、生产三大环节,同时打通了利驰报价软件ExWinner&#…

pdf也可以制作成可翻页的电子书吗?

​当然可以!PDF文件可以通过一些工具和软件转换成可翻页的电子书。这种转换通常需要将PDF文件中的页面重新排列和格式化,以便它们可以像书籍一样翻页。一些流行的工具包括Adobe Acrobat、PDF转换器等 如果需要将大量PDF文件转换为电子书,可以…

mybatisplus的条件构造器

条件构造器wrapper,主要用于构造sql语句的where条件,他更擅长这个,但也可以用于构造其他类型的条件,比如order by、group by等。 条件构造器的使用经验: 基于QueryWrapper的查询 练习1. void testQueryWrapper(){Q…

Linux最小系统安装无法查看IP地址

1,出现原因 服务器重启完成之后,我们可以通过linux的指令 ip addr 来查询Linux系统的IP地址,具体信息如下: 从图中我们可以看到,并没有获取到linux系统的IP地址,这是为什么呢?这是由于启动服务器时未加载网…

深度学习Top10算法

自2006年深度学习概念被提出以来,20年快过去了,深度学习作为人工智能领域的一场革命,已经催生了许多具有影响力的算法。以下是深度学习top10算法,它们在创新性、应用价值和影响力方面都具有重要的地位。 1、深度神经网络&#xf…

超大规模-近场

这里先了解基站到用户的,无RIS的近场模型 超大规模智能反射面辅助的近场移动通信研究 (论文题目) (期刊)无线电通信技术 系统:BS-RIS-UE,两个阶段都是近场 模型:球面波传播模型&…

【字典合集】SecLists-更全面的渗透测试字典 v2024.1

下路路径 SecLists-更全面的渗透测试字典 v2024.1 简介 SecLists 是一个致力于收集各种安全字典的开源项目。这些字典包括但不限于:密码字典、用户名字典、网络扫描结果、漏洞利用载荷、web shells、可用于渗透测试的Payloads、以及其他各种安全相关的字典。 这…

检测虚拟机环境的常见技术

下面列出检测 VMware 虚拟机的常见技术&#xff1a; #include <iostream> #include <windows.h> #include <sysinfoapi.h> #include <comdef.h> #include <Wbemidl.h> #include <ShlObj.h> #include <LM.h> #include <TlHelp32.…

第16章——西瓜书强化学习

在强化学习中&#xff0c;智能体通过与环境的交互来学习如何做出决策。在每个时间步&#xff0c;智能体观察当前的环境状态&#xff0c;并根据其策略选择一个动作。环境会对智能体的动作做出响应&#xff0c;并给出一个奖励信号&#xff08;reward&#xff09;&#xff0c;该信…

2024 PhpStorm激活,分享几个PhpStorm激活的方案

文章目录 PhpStorm 公司简介我这边使用PhpStorm的理由PhpStorm 2023.3 最新变化AI Assistant 预览阶段结束 正式版基于 LLM 的代码补全测试代码生成编辑器内代码生成控制台中基于 AI 的错误解释 Pest 更新PHP 8.3 支持#[\Override] 特性新的 json_validate() 函数类型化类常量弃…

Java - 探究Java优雅退出的两种机制

文章目录 概述Java优雅停机_ ShutdownHook 机制步骤Code Java优雅停机_ 信号量机制SignalHandler 工作原理使用步骤Linux支持的信号量根据操作系统选择信号量Code 注意事项 概述 在Linux上通过kill -9 pid方式强制终止进程的副作用&#xff0c;这种方式虽然简单高效&#xff0…

git代码回退

对于代码的回退主要有 git reset 、git revert 1.git reset git reset commitId --soft&#xff1a;回退当前代码仓库到指定提交commitId&#xff0c;当前HEAD和commitId之间的修改会保留&#xff0c;这些修改会在暂存区。就是保留了add的状态git reset commitId --hard&…

WPF —— TextBlock、LineBreak RadioButton控件详解

一:TextBlock 1&#xff1a;TextBlock 简介 <LineBreak/> 换行 显示文本 标签内容和content属性共存 2、TextBlock 常用的属性 Foreground&#xff1a;TextBlock的文本内容的颜色。 Background&#xff1a;背景&#xff0c;获取或设置要用于填充内容区域背景的 Brush…

2-LINUX--Linux 系统文件类型与文件权限

一.文件类型 Linux 下所有的东西都可以看做文件&#xff0c;Linux 将文件分为以下几种类型&#xff1a; 1. 普通文件 ‘-’ 2. 目录文件 ‘d’ 3. 管道文件 ‘p’ 4. 链接文件 ‘l’ 5. 设备文件&#xff08;块设备 ’b’ 、字符设备 ‘c’&#xff09; 6. 套接字…

二叉搜索树题目:前序遍历构造二叉搜索树

文章目录 题目标题和出处难度题目描述要求示例数据范围 解法一思路和算法代码复杂度分析 解法二思路和算法代码复杂度分析 解法三思路和算法代码复杂度分析 解法四思路和算法代码复杂度分析 题目 标题和出处 标题&#xff1a;前序遍历构造二叉搜索树 出处&#xff1a;1008. …

2024年春招程序员个人简历范本(精选5篇|附模板)

HR浏览一份简历也就25秒左右,如果你连「好简历」都没有,怎么能找到好工作呢? 如果你不懂得如何在简历上展示自己,或者觉得怎么改简历都不出彩,那请你一定仔细读完。 Java开发工程师简历范本> 性别 男 年龄 24 学历 本科 张三 专业 计算机科学与技术 毕业院校 …

Python3虚拟环境之pipenv

pipenv是python官方推荐的包管理工具&#xff0c;集成了virtualenv, pip和pyenv三者的功能。集合了所有的包管理工具的长处&#xff0c;自动为项目创建和管理虚拟环境。 安装 pip install pipenv在Pycharm中使用 修改Pipfile的安装源参数url&#xff0c;改为https://pypi.tun…

20240309web前端_第一周作业_古诗词

作业三&#xff1a;古诗词 成果展示&#xff1a; 完整代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0&q…

BUUCTF---easyre1

1.记录一下第一次做逆向题目 2.题目描述&#xff0c;下载附件 3.解压之后是一个可执行文件&#xff0c;先用PE查看是否有壳 4.没有壳&#xff0c;接下来用ida打开&#xff0c;直接拖进ida即可&#xff0c;接下来使用快捷键fnshiftf12查看字符&#xff0c;若是没有出现搜索框&a…