[论文评析]Densely Connected Convolutional Networks,CVPR,2017

news2025/1/11 22:45:59

Densely Connected Convolutional Networks,

  • 文章信息
  • 背景与动机
  • DenseNet
    • Dense block
    • DenseNet
    • DenseNet的集中经典配置
  • 总结


文章信息

题目:Densely Connected Convolutional Networks,
发表:CVPR,2017
作者:Gao Huang, Zhuang Liu, Laurens van der Maaten, Kilian Q. Weinberger

这篇文章所提出的DenseNet模型被称为是最经典4种卷积架构之一。

背景与动机

卷积网络是是一类非常强大的网络结构,从最早的Google LNet, 到AlexNet,VGG, 再到ResNet, ResnetXt, 可以发现:
(1)网络的结构变得越来越深,
(2)这些网络架构基本上都是以前馈方式顺序级联的,仅相邻的层之间有连接,很少有跨层连接(即使是ResNet,也仅仅只是增加了Short cut path),

作者主要是从信息流动的角度出发,提出了一种的新型卷积网络模型 密集连接网络Densely -connetced neural network (DenseNet).

DenseNet

Dense block

下图直观的展示了一个5层的growth rate为4的Dense block的示意图, 其中不同颜色的框代表Feature map, H i H_{i} Hi表示一个由Convolution, Relu,Batch Normalization组成的符合操作,对应的输出为 x i x_{i} xi。 可以看到其与以往的卷积网络的最大不同点
以往的网络都是仅相邻的两个层之间有连接,而这里是任意两个Layer之间都以前馈的方式连接,换言之,每个layer的输出都作为后继所有layers的输入的一部分, 对于每个layer来说,之前所有layer的输出作为该layer的输入的一部分。
在这里插入图片描述

DenseNet

下面展示了基于Dense block搭建的一个包含3个Dense block的DenseNet的示意图。

在这里插入图片描述
总结以下DenseNet的几个特点、优势:

(1) Dense connectity
对于传统的卷积网络,
x l = H l ( x l − 1 ) x_{l}=H_{l}(x_{l-1}) xl=Hl(xl1),
对于ResNet,
在这里插入图片描述
而对于DenseNet, 第l层的输入与之前的所有层的输出都有关,
在这里插入图片描述

另外有一点需要特别注意
在Resnet中,short cut path是直接把直接把输入叠加到卷积的输出上,这样一种生硬的方式可能会阻碍信息的流动,而在DenseNet中,是把之前所有层的输出聚合起来作为输入,这与Resnet有本质的区别。

(2) Composite function
Dense block中每一层都为一个由Convolution, Relu, Batch Normalization组成的复合操作,

(3)Pooling layers.
由于公式(2)中每个层的输入为之前所有层的输出的聚合,这意味着这些输出的尺寸必须保持一致,然而,众所周知, 卷积网络的一个基本的特点是:feature map的尺寸在不断变小而feature map的厚度在不断增加, 那么在DenseNet中如何考虑这个呢? 由此,作者引入了Transition layer的概念,Transition layer位于相邻的两个Dense block之间,由Batch Normalization, 1x1 convolution, 2x2的 Pooling layer组成,主要的目的是为了进行下采样,同时可能降维。

(4)Growth rate
对于给定的Dense block, 其中每个复合操作 H l H_{l} Hl的输出的feature map的数量相等记为k,假设输入的feature map的数量为 k 0 k_{0} k0,则该层输入feauture map的数量为 k 0 + k ( l − 1 ) k_{0}+k(l-1) k0+k(l1).
传统的卷积网络中feature map的数量都是随着网络深度的增加成倍甚至直输暴增的,而这里,通过控制参数k,可以得到很窄/瘦的网络。

(5)Bottleneck layers
尽管每个复合操作输出的feature map数量为k,然而因为每个层的输入由多个之前层的输出组成,最终输入的feature map的数量可能比较大,因此可以在3x3卷积之前再加一个1x1卷积,也就是所谓的Bottlenet layer, 这样一来可以进一步提高季孙效率。

(6)Compression.
假设一个Dense block的输出包含m个feature map, 经过Transition layer以后输出feature map的数量为 θ m \theta m θm,其中 θ \theta θ称之为压缩因子。

DenseNet的集中经典配置

在这里插入图片描述

总结

作者从信息流的角度思考设计了这么一种网络,看起来也特别简单,挺有意思。最近也有一些工作通过尝试结合物理方面的知识来设计网络,这一块值得研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/24894.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【TWVRP】遗传算法求解带时间窗的含充电站车辆路径规划问题【含Matlab源码 1177期】

⛄一、VRP简介 1 VRP基本原理 车辆路径规划问题(Vehicle Routing Problem,VRP)是运筹学里重要的研究问题之一。VRP关注有一个供货商与K个销售点的路径规划的情况,可以简述为:对一系列发货点和收货点,组织调用一定的车辆&#xff…

【密码学篇】虚拟专用网技术原理与应用(商密)

【密码学篇】虚拟专用网技术原理与应用(商密) VPN技术不是洪水猛兽,其普遍应用于网络通信安全和网络接入控制,可通过服务器、硬件、软件等多种方式实现。—【蘇小沐】 文章目录【密码学篇】虚拟专用网技术原理与应用(…

JAVA多线程并发(一):线程的创建

JAVA多线程并发——创建线程 第一章:线程的创建与实现 文章目录JAVA多线程并发——创建线程一、继承Thread类二、实现runnable接口三、简单匿名内部类写法四、实现Callable接口五、线程池一、继承Thread类 代码示例: public class ExtendThread {publ…

SPARKSQL3.0-Unresolved[Parsed]阶段源码剖析

一、前言 上两节介绍了Antlr4的简单使用以及spark中如何构建SessionState,如果没有看过建议先了解上两节的使用,否则看本节会比较吃力 [SPARKSQL3.0-Antlr4由浅入深&SparkSQL语法解析] [SPARKSQL3.0-SessionState构建源码剖析] 那么在Unresolved…

MySql查询的生命周期和性能优化思路

目录 前言 1. 为什么查询性能差 2. 一次查询的生命周期 2.1 客户端与服务端通信 2.2 查询缓存 2.3 解析器 2.4 预处理器 2.5 优化器 2.6 查询引擎 2.7 存储引擎 3. 查询性能优化的思路 4.总结 前言 一说到mysql的查询性能优化,相信很多人能说出来很多的技…

AT32F407/437使用FreeRTOS并实现ping客户端

示例目的 基于以太网络,实现ping客户端已检测网络联机。 支持型号 AT32F407xx AT32F437xx 主要使用外设 EMAC GPIO USART 快速使用方法硬件资源 1) 指示灯LED2/LED3 2) USART1(PA9/PA10) 3) AT-START-F407/ AT-START-F437实验板 4) 以太网连接线软件资源 1) SourceC…

sql函数coalesce和parse_url

学习函数系列: coalesce coalesce函数可以用来排除null值。 coalesce(a, b,c,d) 参数的个数没有限制 返回第一个参数中非null的值。 select help coalesce\G; [ 1. row ] name | COALESCE description | Syntax: COALESCE(value,…) Returns the first non-NUL…

15-JavaSE基础巩固练习:多态、接口、抽象类的综合练习

多态的综合练习 1、需求 狗类 属性:年龄,颜色行为: eat(String something):表示吃东西lookHome():看家 猫类 属性:年龄,颜色行为: eat(String something):吃东西catch…

5G工业互联阶段二:5G产线工控网

5G深入核心生产环节的第二个阶段,主要是实现产线内部通信5G化。以工控5G化为主,并综合考虑数采、安全通信等。大致示意如下: 工艺部件工控通信5G化: 如上图所述,以产线主PLC为中心,大致分为主PLC到产线内机…

Spark 3.0 - 5.ML Pipeline 实战之电影影评情感分析

目录 一.引言 二.Stage1 - 数据准备 1.数据样式 2.读取数据 3.平均得分与 Top 5 4.训练集、测试集划分 三.Stage-2 - Comment 分词 1.Tokenizer 🙅🏻‍♀️ 2.JieBa 分词 🙆🏻‍♀️ 2.1 Jieba 分词示例 2.2 自定义 Jie…

系统设计 system design 干货笔记

参考大佬的博客 https://www.lecloud.net/post/9246290032/scalability-for-dummies-part-3-cache 参考的github https://github.com/donnemartin/system-design-primer#step-2-review-the-scalability-article scalability 1 Clone 每台服务器都包含完全相同的代码库&#…

SOLIDWORKS 2023 3D Creator 云端结构设计新功能

3DEXPERIENCE平台更新版本已经与大家见面,今天微辰三维与大家分享3D Creator 云端结构设计新功能,让我们先一起来看看视频—— SOLIDWORKS 2023 3D 云端结构设计新功能点击观看3D Creator 云端结构设计新功能 如今,我们的设计生产工作不仅要面…

Linux进阶-Makefile

make工具:找出修改过的文件,根据依赖关系,找出受影响的相关文件,最后按照规则单独编译这些文件。 Makefile文件:记录依赖关系和编译规则。 Makefile本质:无论多么复杂的语法,都是为了更好地解决…

m认知无线电网络中频谱感知的按需路由算法matlab仿真

目录 1.算法概述 2.仿真效果预览 3.MATLAB部分代码预览 4.完整MATLAB程序 1.算法概述 使用无线电用户的频率范围在 9kHz 到 275GHz[3],由于无线通信环境中的干扰、信道衰落和无线电收发设备自身属性等的影响,大部分无线电设备只能工作在 50GHz 以下。…

融媒体解决方案-最新全套文件

融媒体解决方案-最新全套文件一、建设背景二、建设思路三、建设方案二、获取 - 融媒体全套最新解决方案合集一、建设背景 随着互联网的快速发展,社会已步入全媒体时代,各媒体机构积极探索传统媒体转型之路。 为巩固壮大主流思想舆论,不断提…

对数的应用:放缩x轴或者y轴以更好地表达函数的结果

对数尺度的作用 yAxnyAx^nyAxn 在实验中 AAA 和 nnn 都是未知数,现在我想求出 AAA 和 nnn假设 n1.5,A1n1.5, A1n1.5,A1,那么我们可以做个图看看 x np.linspace(1,10,10) y 1 * x**3 plt.plot(y)如果我做实验恰好得到一些点,那么我很难知道…

【全志T113-S3_100ask】14-1 linux采集usb摄像头实现拍照(FFmpeg、fswebcam)

【全志T113-S3_100ask】14-1 linux采集usb摄像头实现拍照背景(一)FFmpeg1、简介:2、交叉编译FFmpeg3、测试(二)fswebcam1、背景2、交叉编译fswebcam3、测试背景 在开发板上有一个csi转dvp接口的摄像头,但是…

前端入门到放弃(VUE、ES6,简单到不得了)

VSCode 使用 1、安装常用插件 切换到插件标签页 安装一下基本插件 2、创建项目 vscode 很轻量级,本身没有新建项目的选项,创建一个空文件夹就可以当做一个项目 3、创建网页 创建文件,命名为 index.html 快捷键 !快速创建网页模板 h1 回…

精益管理学会|什么是ECRS改善方法?

ECRS是IE工程改善、精益生產管理改善的四大法宝。 针对现有的生产线进行改善时,常见的做法是对现有的生产线进行绘制各工站的工时山积表如下圖所見,然后对各工站的动作单元进行ECRS 改善。 E:不需要的可进行 Eliminate (取消&…

Telegraf-Influxdb-Grafana容器化部署拓展(Https、AD域、告警集成)并监控Cisco设备指标

前言: 还记得在去年的笔记中提到过使用python的pysnmp模块,配合Influxdb,Grafana收集Cisco设备指标。链接如下:https://blog.csdn.net/tushanpeipei/article/details/117329794 。在该实例中,我们通过python编写脚本收…