CV——dy83 接昨天的论文中DAM模块:压缩-激励的宽残差网络在图像分类中的应用

news2024/12/28 22:01:00

压缩-激励的宽残差网络在图像分类中的应用(ICIP 2019)

  • 1. INTRODUCTION
  • 2. PROPOSED METHODS
    • 2.1 总体框架
    • 2.2 通道的重要性
  • 3. EXPERIMENTS
    • 3.1 Datasets
    • 3.2 训练和测试的设置
    • 3.3 分类结果及分析
  • 4. CONCLUSION

SQUEEZE-AND-EXCITATION WIDE RESIDUAL NETWORKS IN IMAGE CLASSIFICATION

image-20230305103420138

在昨天的论文中,DAM模块中右侧分支就是基于本文所提出的SE-block,今天来了解一下这个模块。

1. INTRODUCTION

宽残差网络(WRNs:Wide residual networks)表明,与增加残差网络深度相比,拓宽残差块(如果处理得当)可以更有效地提高残差网络的性能。

SE-WRNs可以增强信息通道并抑制不太有用的通道,SE-WRNs块是计算轻量级的,只略微增加模型复杂度和计算量。

SE-blocks中的全局平均池化会导致信息的丢失,因此我们提出了一个r(残差)SE-blocks块,将在后面的章节中介绍,我们的rSE-blocks在计算上也是轻量级的。

综上所述,我们的工作贡献如下

(1 )我们提出了SE-WRNs。与WRNs仅仅增加通道数量不同,SE-WRNs增加了有效通道。为了避免过拟合,提出了一种带有dropout的SE-block块。

(2) 然后,我们提出了利用通道间关系提高图像分类性能的SE-WRNs-GVP(全局平均池化)算法。

(3) 为了避免SE-block中的信息丢失,提出了一种残差SE-block。

2. PROPOSED METHODS

2.1 总体框架

WRN已经证明基本残差结构的3 × 3卷积层中的每一层都是重要的,因此我们采用在WRN中的卷积类型。WRN-n-k表示具有卷积层总数n和加宽因子k的残差网络。其结构如表1所示。

image-20230305105634968

GVP:全局平均池化 🎃

2.2 通道的重要性

SE-WRN可以通过简单地堆叠一组SE构造块来生成。这些特征首先通过一个挤压操作(全局平均池化),该操作聚集空间维度H × W上的特征图以产生一个通道描述符。统计量z ∈ RC通过将U收缩到空间维度H ×W来生成,其中z的第c个计算公式为:image-20230305110002134

该描述符嵌入了信道特征响应的全局分布,使得来自网络的全局感受域的信息能够被其较低层利用。

随后是激发操作,其中通过基于通道依赖性的自门控机制针对每个通道学习的样本特异性激活控制每个通道的激发。image-20230305110051688

块的最终输出是通过用激活重新缩放变换输出U来获得的:image-20230305110225541

其中X = [x1,x2,…,xc]和Fscale(uc,sc)是指特征映射Uc ∈ RH×C和尺度sc之间的通道乘法。变换输出U可以解释为局部描述符的集合,所述局部描述符的统计对于整个图像是有表现力的。SC不能将每个信道的重要性表示为SE块中的全局平均池,因此我们提出了残差SE-blok。未通过SE块的特征被加到具有权重的特征上,如公式(4)所示。然后将融合特征图馈入后续层。image-20230305110512930

image-20230305110558364

图1显示了SE阻断和rSE阻断之间的差异。缩减比R是一个重要的超参数,它允许我们改变模型中SE块的容量和计算成本。

3. EXPERIMENTS

3.1 Datasets

我们选择了著名的CIFAR10和CIFAR100数据集进行实验。CIFAR10和CIFAR100数据集由10和100类绘制的32 × 32彩色图像组成,这些图像分为50,000张训练图像和10,000张测试图像。对于数据增强,我们做水平翻转,从图像中随机选取作物,每边填充4个像素,用原始图像的反射填充缺失的像素。

3.2 训练和测试的设置

所有的网络使用随机梯度下降(SGD)训练。

3.3 分类结果及分析

随着通道的有效利用,分类性能逐渐提高。表2显示了结果。

image-20230305105040403

SE-block阻断增强了有效通道的作用,抑制了非有效通道的作用。然后利用全局协方差池来表征信道之间的相关性,从而有效地利用信道信息。

image-20230305105117443

我们的网络只略微增加了模型的复杂性和计算负担。结果如表4所示。

image-20230305105145891

图二。在cifar数据集上的结果。

4. CONCLUSION

SeNets的目的是通过明确地建模其卷积特征的信道之间的相互依赖关系来提高网络的表示能力。全局协方差池描述了特征通道之间的相关性。

本文提出了利用信道信息的SE-WRNs-GVP。为了避免SE-blocks造成的信息丢失,提出了一种rSE-blocks。我们的rSE-WRN-26-10-GVP对CIFAR10的错误率为3.79%,对CIFAR100的错误率为20.44%,低于WRN。在加入全局协方差池时,学习速率衰减和带有dropout的SE-blocks对解决过拟合问题至关重要。信道信息的有效利用将提高分类的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/389113.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CSS 选择器以及CSS常用属性

目录 🐇今日良言:可以不光芒万丈,但不要停止发光 🐯一、写CSS的三种方法 🐯二、CSS选择器的常见用法 🐯三、CSS常用属性 🐇今日良言:可以不光芒万丈,但不要停止发光 🐯一、写CSS的三种方法 CSS的基本语…

目标检测开源数据集汇总

导 读本文汇总了一些开源目标检测类的数据集,附下载链接。多显著性对象数据集数据集链接:http://m6z.cn/5AsmXB本数据集共有 1224 张图像来自四个公共图像数据集:COCO、VOC07、ImageNet 和 SUN。Amazon Mechanic Turk 工作人员将每个图像标记…

Firebase入门使用 01

官网 firebase.google.com 解决问题 firebase 帮助解决 数据库 和 API之间的问题 这样我们就可以 集中精力开创应用。 快速上手样例指南 https://github.com/firebase 提供的服务 其中80%用不到,下面是一些我们可以用到的服务。 Authentication:用户认证管理…

Qt安装与使用经验分享;无.pro文件;无QTextCodec file;Qt小试;界面居中;无缝;更换Qt图标;更换Qt标题。

1、切换安装下载源 《Qt安装教程》先推荐一篇安装文章:《Qt安装教程》 Qt 5.15 之后已经不提供离线安装包了,就是那个 3.7G 的 exe 安装包。请看官方说明,所以只能用在线安装包。 1,下载在线安装包 QT 在线安装包链接&#xff…

基于WSL2和Clion搭建Win下C开发环境

系列文章目录 一、基于WSL2和Clion搭建Win下C开发环境 二、make、makeFile、CMake、CMakeLists的使用 三、全面、详细、通俗易懂的C语言语法和标准库 文章目录系列文章目录前言WSL2安装WSL常用命令VSCode连接WSLroot密码以systemd启动配置sshClion结语前言 Win下C语言开发环境…

zabbix-API对接实录:关键基础设施数据清洗和封装函数(php数组函数、数据清洗、数据结构化)

系列文章目录 Zabbix监控系统PHP-API开发测试实录Zabbix监控系统开发(2):JSON多维数组筛选字段是否包含字符串的解决方案Zabbix物联网可视化开发文档 文章目录系列文章目录前言一、zabbix-API数据爬虫二、主机ID封装接口1.封装API接口2.数据处理封装函数三、组ID封装接口1.格式…

汽车 Automotive > T-BOX GNSS高精定位测试相关知识

参考:https://en.wikipedia.org/wiki/Global_Positioning_SystemGPS和GNSS的关系GPS(Global Positioning System),全球定位系统是美国军民两用的导航定位卫星系统,GPS包含双频信号,频点L1、L2和L5GNSS&…

RecyclerView ViewType二级

实现效果描述: 1、点击recyclerview中item,列表下方出现其他样式的item,作为子item,如下所示 所需要的java文件和xml文件有: 1、创建FoldAdapteradapter, 在FoldAdapter中,定义两种不同的类型&#xff…

Allegro如何将Waived掉的DRC显示或隐藏操作指导

Allegro如何将Waived掉的DRC显示或隐藏操作指导 在用Allegro做PCB设计的时候,如果遇到正常的DRC,可以用Waive的命令将DRC不显示,如下图 当DRC被Waive掉的时候,如何将DRC再次显示出来。类似下图效果 具体操作如下 点击Display

linux下strace的使用

strace是一款用于跟踪Linux系统调用和信号的工具,可以帮助开发者排除程序运行时的问题。 具体来说,strace可以跟踪一个程序执行时所涉及到的系统调用,包括读写文件、网络通信、进程管理、内存管理等操作,通过分析程序运行过程中发…

JavaWeb--JSP案例

JSP案例8 案例8.1 环境准备8.1.1 创建工程8.1.2 创建包8.1.3 创建表8.1.4 创建实体类8.1.5 准备mybatis环境8.2 查询所有8.2.1 编写BrandMapper8.2.2 编写工具类8.2.3 编写BrandService8.2.4 编写Servlet8.2.5 编写brand.jsp页面8.2.6 测试8.3 添加8.3.1 编写BrandMapper方法8.…

ARM uboot 的移植0-从三星官方 uboot 开始移植的准备工作

一、移植前的准备工作 1、三星移植过的uboot源代码准备 (1) 三星对于 S5PV210 的官方开发板为 SMDKV210,对应的移植过的 uboot 是:三星官方为210移植过的uboot和kernel/android_uboot_smdkv210.tar.bz2。 (2) 这个源代码网上是下载不到的,…

Leetcode.2397 被列覆盖的最多行数

题目链接 Leetcode.2397 被列覆盖的最多行数 Rating : 1719 题目描述 给你一个下标从 0 开始的 m x n二进制矩阵 mat和一个整数 cols,表示你需要选出的列数。 如果一行中,所有的 1 都被你选中的列所覆盖,那么我们称这一行 被覆盖…

RabbitMQ的使用以及整合到SpringBoot中

RabbitMQ的使用以及整合到SpringBoot中 一、比较: (1)、传统请求服务器: (2)、通过MQ去操作数据库: 通过MQ去操作数据库,从而达到削峰的效果; 问题现象: (1)、海量数据; (2)、高并发&#…

Python如何获取弹幕?给你介绍两种方式

前言 弹幕可以给观众一种“实时互动”的错觉,虽然不同弹幕的发送时间有所区别,但是其只会在视频中特定的一个时间点出现,因此在相同时刻发送的弹幕基本上也具有相同的主题,在参与评论时就会有与其他观众同时评论的错觉。 在国内…

【SQLAlchemy】第二篇——连接失效及连接池

一、背景 为了节约资源,MySQL会对建立的连接进行监控,当某些连接处于不活跃状态的时间超过一个阈值时,则关闭它们。 用户可以执行show variables like %wait_timeout%;来查看这个阈值: 可以看到,在默认的情况下&…

Multi-modal Graph Contrastive Learning for Micro-video Recommendation

模型总览如下: 解决问题:同种重要性对待每种模态,可能使得得到的特征表示次优,例如过度强调学习到的表示中的特定模态。以MMGCN为例,下图为MMGCN模型总览。 如上图所示MMGCN在每种模态上构建用户-物品二部图&#xff0…

【云原生】Gateway网关选型

网关一般分为流量网关和业务网关,流量网关负责接入所有的流量,并分发给不同的子系统,那在具体的业务接入之前,还有一层业务网关。流量网关提供全局性的、与后端业务应用无关的策略,例如 HTTPS证书卸载、Web防火墙、全局…

[vue]vue3.x 组合式API不同写法

[vue]vue3.x 组合式API不同写法改进后组合API实际实际使用中的疑问组件名称问题两种写法的优缺点对比优点缺点组合式API,采用了更加灵活的方式,官网推荐的语法糖,但仅限于比较简单的单文件,作为尝试 改进后组合API实际实际使用中的疑问 改进…

4-2 Linux进程和内存概念

文章目录前言进程状态进程优先级内存模型进程内存关系前言 进程是一个其中运行着一个或多个线程的地址空间和这些线程所需要的系统资源。一般来说,Linux系统会在进程之间共享程序代码和系统函数库,所以在任何时刻内存中都只有代码的一份拷贝。 进程状态…