语义分割学习笔记(四)膨胀卷积

news2025/2/26 17:54:30

推荐课程:

1.膨胀卷积_哔哩哔哩_bilibili(膨胀卷积原理讲的很清楚)

2.膨胀卷积(Dilated convolution)详解(gradding effect问题和解决方法讲的很清楚)

感谢博主霹雳吧啦Wz  / 太阳花的小绿豆和Enzo_Mi提供视频讲解和源码支持,真乃神人也!

目录

1.为什么使用膨胀卷积?

2. 膨胀卷积是什么?

3.膨胀卷积的参数设置

4.膨胀卷积的缺点:网格效应gradding effect


膨胀卷积(Dilated convolution),也叫空洞卷积(Atrous convolution)。

作用:1. 增大感受野 2. 保持原输入特征图W、H。

1.为什么使用膨胀卷积?

使用最大池化(max_pooling)会降低输入特征图的高度和宽度,其次通过最大池化会丢失一些特征图的细节信息以及丢失一些比较小的目标,这些丢失的目标无法通过上采样还原,那么会导致语义分割效果不理想。

感受野是指卷积神经网络中每个输出特征图的每个像素点对应输入图像的区域大小。

但是如果去除池化层,会导致感受野变小而使用膨胀卷积既可以增大感受野又可以保持原图像长和宽大小不变。但是膨胀卷积并不是万能的,它存在gradding effect的问题。

2. 膨胀卷积是什么?

(k为卷积核大小,r为膨胀率dilation rate,p为填充,s为步长。膨胀率是卷积核的每个像素点在输入图像上的间隔大小。普通卷积的膨胀率为1,图中膨胀卷积的膨胀率为2。)

由上图可见,使用膨胀卷积输出特征图的每个像素点对应输入图像的区域更大,意味着感受野也更大。如上图,普通卷积输出特征图的每个像素点对应输入图像的区域为3x3,膨胀卷积对应区域为5x5。

3.膨胀卷积的参数设置

  •  in_channels (int) – 输入通道数

  • out_channels (int) – 输出通道数

  • kernel_size (int or tuple) – 卷积核大小

  • stride (int or tuple, optional) – 步幅。 默认为 1

  • padding (int or tuple, optional) – 填充。 默认为 0

  • output_padding (int or tuple, optional) – 额外的填充在输出。 默认为 0

  • groups (int, optional) – 是否使用组卷积。 默认为 1

  • bias (bool, optional) – 是否在输出上添加偏执. 默认为 True

  • dilation (int or tuple, optional) – 是否使用膨胀卷积、空洞卷积。 默认为 1

 如上图所示,膨胀卷积希望输出特征值与原图大小一致,不能再令padding=1。

4.膨胀卷积的缺点:网格效应gradding effect

由于膨胀卷积是一种稀疏的采样方式,当多个膨胀卷积叠加时,有些像素根本没有被利用到,会损失信息的连续性与相关性,进而影响分割、检测等要求较高的任务。

如图所示,经过了四次的膨胀卷积,每次的膨胀卷积膨胀率设为2,在layer4中保留的layer1(原图像)的像素值中间会产生许多缝隙(数字的大小是利用的次数),进而会造成信息的连续性的损失。

解决方法:关于设计解决空洞卷积中‘gridding effect‘问题的几个原则(简单易懂)_小林学编程的博客-CSDN博客让读者在运用空洞卷积时,不再出现‘gridding effect’的问题!!!https://blog.csdn.net/weixin_57643648/article/details/122790230?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168394435516800213042207%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168394435516800213042207&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~baidu_landing_v2~default-1-122790230-null-null.142%5Ev87%5Einsert_down1,239%5Ev2%5Einsert_chatgpt&utm_term=gradding%20effect&spm=1018.2226.3001.4187

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/520694.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ OpenCV编译安装教程

文章目录 环境说明Cmake编译配置编译前配置编译选项开始正式编译安装 编写代码测试参考文章 环境说明 win10 MinGW64 Cmake 下载mingw64 (版本:12.1.0 posix-seh) 下载Cmake (版本3.17.5) 注:mingw64和cmake下载安装完成后记得把bin目录添加到【环境…

Video Grounding

一些工作能够检测包含特定动作的视频片段,一般称 为动作检测(action detection)或视频中的时序动作定位(Temporal Action Grounding in Videos,TAGV) 然而, TAGV 受限于预先定义的动作类别集合…

基于html+css的图展示57

准备项目 项目开发工具 Visual Studio Code 1.44.2 版本: 1.44.2 提交: ff915844119ce9485abfe8aa9076ec76b5300ddd 日期: 2020-04-16T16:36:23.138Z Electron: 7.1.11 Chrome: 78.0.3904.130 Node.js: 12.8.1 V8: 7.8.279.23-electron.0 OS: Windows_NT x64 10.0.19044 项目…

母亲节:向世界上最伟大的母爱致敬

在这世间众多的亲情关系中,有一种关系无与伦比,毫不费力地凌驾于其他任何已知的地球关系之上。这种非凡的关系就是母亲与子女之间的关系。 母亲对家庭无尽的爱、奉献和忠诚使这份感情无价。为了向全球所有母亲表示敬意,母亲节在世界46个国家庆…

如何用ChatGPT拆解爆款内容(文章/脚本)、提出修改意见,再根据修改意见,最终成稿?

该场景对应的关键词库(11个): 示例内容、爆款库、内容类型、拆解角度、亮点、不足、修改建议、文案、风格、文章、脚本 提问模板(4个): 第一步:建立自己的爆款库,并选择其中1个爆款…

路径规划算法:基于鲸鱼优化的路径规划算法- 附代码

路径规划算法:基于鲸鱼优化的路径规划算法- 附代码 文章目录 路径规划算法:基于鲸鱼优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要:本文主要介绍利用智能优化算法鲸鱼…

SpringBoot通过自定义注解整合Redisson实现分布式锁(单机+集群模式)

😊 作者: 一恍过去 💖 主页: https://blog.csdn.net/zhuocailing3390 🎊 社区: Java技术栈交流 🎉 主题: SpringBoot通过自定义注解整合Redisson实现分布式锁 ⏱️ 创作时间&am…

低代码信创开发核心技术(一):基于Vue.js的描述依赖渲染DDR实现模型驱动的组件

前言 随着数字化转型的不断发展,低代码开发平台已成为企业快速建立自己的应用程序的首选方案。然而,实现这样一个平台需要具备高效、灵活和可定制化的能力。这正是基于描述依赖渲染(Description dependency rendering)所实现的。…

Jenkins 发布到 windows 主机

由于一些原因, 最近程序部署在windows 服务器上比较多, 本文以将前端程序发布到windows server 2016 为例进行介绍 流程 需考虑网络联通性, 此处我的目标服务器没有公网固定IP, 故采用vpn 工具组网 步骤: 一、使用执行SSH脚本的方式 1. 在jenkins 服务器及目标机器上安装 VP…

Windows终端中文乱码,查看系统默认编码及修改系统默认编码

最近windows升级之后出现一个问题,终端出现了乱码,导致启动程序启动不起来。 window系统如何查看系统默认编码 方式一: 在Windows平台下,winr 打开运行—》输入cmd进入cmd窗口,输入:chcp 可以得到操作系统…

会声会影2023是什么软件,会声会影和pr到底哪个好

图1是pr(premiere)平时大家可能会经常听到有人说会声会影2023,但是很多人都不知道这是什么软件。其实听它的名字就知道这是一款和声音、影像有关系的软件。下面,小编就来给大家具体介绍一下这款软件吧。 会声会影2023是什么软件&…

微信客服对接-唯一客服系统文档中心

微信客服官方网址为:https://kf.weixin.qq.com ,可以在微信内、外各个场景中接入微信客服,提供一致的咨询体验,企业可通过API接口回复消息,做好客户服务。 微信客服或者也可以叫企业微信客服,可通过API接口…

CSS平面转换和渐变

01-平面转换 简介 作用:为元素添加动态效果,一般与过渡配合使用 概念:改变盒子在平面内的形态(位移、旋转、缩放、倾斜) 平面转换也叫 2D 转换,属性是 transform 平移 transform: translate(X轴移动距…

IM即时通讯系统[SpringBoot+Netty]——梳理(三)

文章目录 七、打通业务服务器与IM服务器多端同步1、负载均衡策略—随机模式2、负载均衡策略—轮询模式3、负载均衡策略—一致性Hash4、配置负载均衡策略5、使用Apache—HttpClient封装http请求工具6、用户资料变更、群组模块回调7、数据多端同步8、封装查询用户Session工具类9、…

两分钟速览谷歌2023IO大会:AI军备竞争,全线出击

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。 5月10日周三,谷歌举办了年度开发者大会Google I/O 2023,在会上…

【ARMv8 编程】A64 内存访问其他指令

A64 内存访问其他指令包括浮点和 NEON 标量加载存储指令、访问多个内存位置指令、非特权访问指令、预取内存指令、非临时加载存储对指令、内存屏障和栅栏指令、同步原语等。 一、浮点和 NEON 标量加载存储指令 加载和存储指令也可以访问浮点/NEON 寄存器。这里,大…

k8基础知识

总述 在构成扁平化网络的基础上实现Pod编排(控制、管理)、调度,再构成服务;对服务的管理有所欠缺;可以说k8s重点解决资源的问题 服务管理、应用管理;istio重点解决服务的问题 功能 开源、动态伸缩、负载…

爱奇艺2020校招Java方向笔试题(第一场)

1.计算下列程序的时间复杂度&#xff08;&#xff09; for (i1;i<n;i)for(j1;j<m;j){a1,a2,a3,a4};A.O(n) B.O(mn) C.O(m) D.O(1) 答案:B 2.求递归方程T(n)4T(n/2)n 的解 ( ) A.O(n) B.O(n^2) C.O(n^3) D.O(logn) 答案:B 用Mater公式计算 3.下列关于动态规划算法说法错…

RCWA包:光学模拟的强大工具——用于计算光子 晶体R/T 光谱 的严格耦合波分析

目录 RCWA包&#xff1a;光学模拟的强大工具 RCWA包的功能 如何开始使用RCWA包 RCWA包的特性 RCWA包的应用示例 示例代码 基本的光学概念介绍。 1. 反射率、透射率和散射率 2. 衍射和衍射光栅 3. 光子晶体 4. 布拉格镜 5. 垂直腔面发射激光器&#xff08;VCSEL&…

芒果改进YOLOv8系列:改进特征融合网络 BiFPN 结构,融合更多有效特征

芒果改进YOLOv8系列:改进特征融合网络 BiFPN 结构,融合更多有效特征 在这篇文章中,将 BiFPN 思想加入到 YOLOv8 结构中 该版本为高效简洁版,涨点多、还速度快(实际效果反馈) 本篇博客 不占用 高阶专栏的总篇数计划中 文章目录 一、BiFPN 论文理论二、效果反馈(涨点)…