【论文阅读】Densenet:Densely Connected Convolutional Networks 密集连接的卷积网络

news2024/12/25 1:25:55

文章目录

  • 前言
  • 一、摘要
  • 二、网络架构
    • 2.1. densenet
    • 2.2. dense block
    • 2.3 与resnet对比
    • 2.4 pytorch代码
  • 三.实验结果
  • 四.结论


前言

从今天开始总结一下之前看的一些深度学习相关的论文。
今天的这篇还是比较经典的论文:密集连接网络。在很多国内的硕士毕业论文里都出现过,作为一个改进的模块。

论文地址:https://arxiv.org/pdf/1608.06993.pdf

在这里插入图片描述

一、摘要

摘要还是完整的截取一张图:
在这里插入图片描述
翻译一下就是:最近的研究表明,如果卷积网络包含接近输入层和接近输出层之间更短的连接,那么它的训练就可以更深入、更准确、更有效。在本文中,我们接受了这一观察结果,并引入了稠密卷积网络(DenseNet),该网络以前馈方式将每一层连接到其他每一层。传统的L层卷积网络有L个连接(每一层和随后的一层之间各有一个连接),而我们的网络有L(L+1) 2个直接连接。对于每一层,前面所有层的特征图被用作输入,它自己的特征图被用作所有后续层的输入。densenet有几个引人注目的优点:它们减轻了梯度消失问题,加强了特征传播,鼓励特征重用,并大大减少了参数的数量。我们在四个高度竞争的目标识别基准任务(CIFAR-10、CIFAR-100、SVHN和ImageNet)上评估了我们提出的体系结构。densenet在大多数技术上获得了显著的改进,同时需要更少的计算来实现高性能。

这咋一看哈,感觉这个模型可用在轻量化的改进上,我的眼睛一下就绿了。接下来我在后面挑一些我觉得的重点内容学一学。

二、网络架构

2.1. densenet

首先是densenet的整体架构:
在这里插入图片描述
主要构成是dense block和transition layers(过渡层)。过渡层包括一个批处理规范化层和一个1×1卷积层,然后是一个2×2平均池化层。

2.2. dense block

在这里插入图片描述
红色打圈的部分就是dense block,然后图的右下角经过了一个过渡层transition layers。dense block内部实行了密集连接。denseblock内部又由各个dense layer组成。

2.3 与resnet对比

resnet和densenet的区别(从公式就可以看出一些端倪):

首先是resnet的连接公式:本层信号和前一层信号相加(用的是➕号)
在这里插入图片描述
然后是densenet的公式:之前所有层信号的叠加(这应该对应torch里的concat操作)
在这里插入图片描述

2.4 pytorch代码

作者的github是https://github.com/liuzhuang13/DenseNet.
但是点进去后发现pytorch版本的代码打不开了,其他caffe,tensorflow等的代码还可以用。

pytorch的代码可以在github上看别人写的:
在这里插入图片描述
总体来说还算比较简单的网络了

三.实验结果

第一次实验:Classification Results on CIFAR and SVHN
结果如下
在这里插入图片描述
总记的话就是四点:
精度高,容量大,参数使用效率高(相同性能参数小),不容易过拟合。

第二次实验:Classification Results on ImageNet
结果如下
在这里插入图片描述
总记的话就是:
densenet的性能与最先进的ResNets相当,同时只用更少的参数和计算就能达到类似的性能。

四.结论

在这里插入图片描述
densenet趋向于随着参数数量的增加而在准确性上不断提高,而没有任何性能退化或过拟合的迹象。在多个设置下,它在几个高度竞争的数据集上实现了最先进的结果。此外,densenet需要更少的参数和更少的计算来实现最先进的性能。由于我们在研究中采用了针对残差网络优化的超参数设置,我们认为,通过对超参数和学习速率调度进行更详细的调整,可以进一步提高densenet的精度。在遵循简单的连接规则的同时,DenseNets自然地集成了身份映射、深度监管和多样化深度的属性。它们允许特征在整个网络中重用,因此可以学习更紧凑的模型,根据我们的实验,也可以学习更精确的模型。由于其紧凑的内部表示和减少的特征冗余,densenet可能是各种基于卷积特征的计算机视觉任务的良好特征提取器,例如,[4,5]。我们计划在未来的工作中利用densenet研究这种特征迁移。

重点看看打粗部分就可以了,根据国内硕士论文的情况,这篇论文可以作为模型轻量化的参考基准文献之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/579670.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

XDP入门--eBPF程序实现网桥/二层交换机转发功能

本文目录 1、试验环境2、eBPF字节码源代码实现3、用户态应用层管理与控制程序的源代码实现4、编译与运行5、测试结果 我们在此文的进阶部分 或者 此文中已经描述了如何设置Linux网桥,并将多个以太接口加入网桥后实现一个最基本的二层交换机的二层交换转发功能。Linu…

如何在华为OD机试B卷中获得满分?Java实现【食堂供餐】一文详解

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: Java华为OD机试真题(2022&2023) 文章目录 1. 题目描述2. 输入描述3. 输出描述…

【剑指offer】数据结构——链表

目录 数据结构——字符串直接解【剑指offer】06. 从尾到头打印链表牛客力扣 【剑指offer】24. 反转链表【剑指offer】25. 合并两个排序的链表【剑指offer】35. 复杂链表的复制【剑指offer】52. 两个链表的第一个公共结点 特殊解——双指针【剑指offer】18. 删除链表的节点【剑指…

六级备考23天|CET-6|翻译技巧4|2013年官方样题|新年|9:45~11:00

目录 1 PRACTICE ANSWER 2 PRACTICE ANSWER 3 ​ PRACTICE ANSWER 4 PRACTICE ANSWER 5 PRACTICE ANSWER 6 ​ PRACTICE ANSWER ​​​​​​​ 答案整合​​​​​​​ 1 PRACTICE Chinese new year is the Chinese most important traditional festival, wh…

2023上半年软考系统分析师科目一整理-02

2023上半年软考系统分析师科目一整理-02 1. 安全2. 知识产权 1. 安全 对称加密算法中,由于加密解密都使用同样的密钥,所以密钥需要进行共享,故也被称共享密钥算法。 三重DES加密是使用2个DES密钥,进行多次操作来完成的&#xff…

Redis相关

Redis基本概念 一、Redis的持久化方式二、Redis的单机、主从、哨兵、集群Redis主从复制的原理 三、Redis分布式锁的实现四、缓存穿透 击穿 雪崩 一、Redis的持久化方式 1)RDB方式 2)AOF方式 二、Redis的单机、主从、哨兵、集群 单机的问题&#xf…

机器学习 | SVD奇异值分解

本文整理自哔哩哔哩视频:什么是奇异值分解SVD–SVD如何分解时空矩阵 📚奇异值分解是什么? M是原始矩阵,它可以是任意的矩阵,奇异值分解就是将它分解为三个矩阵相乘。U和V是方阵,∑是不规则矩阵,…

django组件552

前言:相信看到这篇文章的小伙伴都或多或少有一些编程基础,懂得一些linux的基本命令了吧,本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python:一种编程语言&…

618京东预售一般便宜多少?跟直接买有啥区别?

618京东预售一般便宜多少?跟直接买有啥区别? 京东作为消费者比较喜欢的电商购物平台之一,经常会推出促销打折的活动,以吸引用户到平台上购物。在这些大促活动中,平台会在预售环节设置专属的优惠,让消费者下单提前锁定这些折扣&a…

一、stable diffusion的发展史

一、stable diffusion的发展史 本文目标:学习交流 对于熟悉SD的同学,一起学习和交流使用过程中的技巧和心得。 帮助新手 帮助没有尝试过SD但又对它感兴趣的同学快速入门,并且能够独立生成以上效果图。 1.发展史介绍: 2015年的时候…

RepGhost 解析

paper:RepGhost: A Hardware-Efficient Ghost Module via Re-parameterization official implementation:https://github.com/chengpengchen/repghost 存在的问题 特征重用feature reuse是轻量网络设计中常用的一种技术,现有的方法通常使…

[元带你学: eMMC协议详解 10] Device 识别流程 与 中断模式

依JEDEC eMMC 5.1及经验辛苦整理,付费内容,禁止转载。 所在专栏 《元带你学: eMMC协议详解》 全文2700字,重点需掌握设备识别过程(CMD1 -> CMD2 -> CMD3), 这很常用, 也是最容易出现异常的地方。其他…

Git进阶之代码回滚、合并代码、从A分支选择N次提交,合并到B分支【revert、merge、rebase、cherry-pick】

B站视频地址: https://www.bilibili.com/video/BV1KX4y1a7N9 Git学习文档:https://d9bp4nr5ye.feishu.cn/wiki/PeDPw3mm3iFA36k9td9cVeignsZ 在很长一段时间里,我对Git的操作只限于:提交代码,拉取代码,合…

研报精选230528

目录 【行业230528华金证券】传媒行业深度研究:AIGC最新应用与场景研究 【行业230528国海证券】电动船舶行业深度报告:绿色智能大势已至,驶向电化百亿蓝海 【行业230528华西证券】纺织服装行业周报:5月增长放缓无碍中长期出清逻辑…

Linux下的yum和vim

目录 一、Linux软件包管理器yum1.1 何为软件包?1.2 rzsz工具1.3 如何安装和卸载软件?1.4 Linux的软件生态 二、vim文本编辑器 一、Linux软件包管理器yum 1.1 何为软件包? 软件包可以理解成是windows下别人提前编译好的安装包程序&#xff0…

任务7 课程信息管理系统

系列文章 任务7 课程信息管理系统 已知课程的信息包括:课程编号,课程名称,课程性质(必修、选修),课时,学分,考核方式(考试、考查课),开课学期&a…

day41_servlet

今日内容 零、 复习昨日 一、Cookie 二、Session 三、拦截器 四、登录认证、全局编码格式 零、 复习昨日 注解 热部署 请求转发 重定向 路径问题 总结使用经验: 无论请求路径是多层是单层,在写路径时都从/开始,即从根开始如果是服务器动作,从/开始直接写如果是浏览器动作,从/开…

CVPR 2018 | Spotlight论文:单摄像头数秒构建3D人体模型

想把自己的身体形象投射进电子游戏里?现在已经是很容易的事了。人工智能算法此前已被广泛应用于虚拟现实头像、监视、服装试穿或电影等多种任务的人体建模上,但大多数方法需要特殊的照相设备来检测景深,或从多个角度探查人体。近日,来自德国布伦瑞克工业大学和 Max Planck …

js获取Element元素的常用方法

js中获取Element元素的常用方法有以下四种: 【方法一】根据元素ID:document.getElementById() 【方法二】根据元素标签:document.getElementsByTagName() 【方法三】根据元素class名:document.getElementsByClassName() 【方法…

yolov5刚开始train时的环境问题

torch会自动被requirement.txt替换 在对yolov5_5.0进行pip install requirement.txt后,yolo5_5.0会将虚拟环境中中的torch替换为2.0.1版本的,但要注意查看该torch是否为gpu版本,查看方式如下:打开Anaconda Prompt,激活…