DenseNet笔记

news2025/1/16 20:51:24

📒from  ©实现pytorch实现DenseNet(CNN经典网络模型详解) - 知乎 (zhihu.com)

是什么之 DenseBlock

读图:

  • x0是input
  • H1的输入是x0 (input)
  • H2的输入是x0和x1 (x1是H1的输出)

Summary:

  • 传统卷积网,网络有L层,就会有L个连接
  • DenseNet中,会有L(L+1)/2个连接<------>每一层的输入来自前面所有的层的输出

原文仅有的两个公式:

通过这两个公式理解 ResNet 和 DenseNet

 Summary

Identity function

输出等于输入(继续

是谁,在哪儿。啥时候

作为CVPR2017年的Best Paper, DenseNet脱离了加深网络层数(ResNet)和加宽网络结构(Inception)来提升网络性能的定式思维,从特征的角度考虑,通过特征重用和旁路(Bypass)设置,既大幅度减少了网络的参数量,又在一定程度上缓解了gradient vanishing问题的产生.结合信息流和特征复用的假设,DenseNet当之无愧成为2017年计算机视觉顶会的年度最佳论文.

©实现pytorch实现DenseNet(CNN经典网络模型详解) - 知乎 (zhihu.com)

评价

  1. DenseNet网络层数深
  2. 相比ResNet参数量更少
  3. 旁路增加了特征重用
  4. 网络更易于训练,并具有一定的正则效果
  5. 缓解了gradient vanishing和model degradation问题

杂谈:

  1. CNN网络层数不断增加,梯度消失模型退化的问题出现在人们面前
    1. gradient vanishing 梯度消失的问题真的很严重
    2. model degradation
  2. batch  normalization一定程度上解决了   gradient vanishing
  3. ResNet 和 Highway Networks 通过恒等映射设置旁路,进一步减少了gradient vanishing 和 model degradation
  4. Fractal Nets通过将不同深度的网络并行化,获得深度的同时保证梯度的传播
  5. 不同网络架构的核心思想:将feature map 跨网络层 连接

DenseNet v.s.  ResNet

  • 何恺明 ResNet 的假设:若某一较深的网络多出另一较浅网络的若干层有能力学习到恒等映射,那么这一较深网络训练得到的模型性能一定不会弱于该浅层网络
    • = 如果对某一网络中增添一些可以学到恒等映射的层组成新的网络,那么最差的结果也就是新网络中的这些层在训练后成为恒等映射而不会影响原网络的性能
  • DenseNet假设:(特征复用)    与其多次学习冗余的特征,特征复用是一种更好的特征提取方式

DenseNet优点

  • 网络更窄,参数更少
  • DenseNet❤️:dense block
    • dense block每个卷积层的输出 feature map数量都很小( feature map < 100)
    • feature map理解为 网络的宽度
  • 密集连接使得特征和梯度的传递更加有效,网络也更容易训练(why?

A:

  • 原文句子:Each layer has direct access to the gradients from the loss function and the original input signal, leading to an implicit deep supervision.每个层都可以直接访问损失函数的梯度和原始输入信号,从而导致了一种隐式的深度监督。
  • 首先明确:梯度消失在网络越深的时候越容易出现(原因在于:输入信息和梯度信息在很多层之间传递导致的)
  • ∴dense connection
    • 第1个优点:相当于 每一层都直接连接input和loss,因此可以减轻梯度消失现象
    • 第2个优点:正则化效果,对过拟合有抑制作用(原因在于参数减少了,所以过拟合现象减轻)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1506726.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

角蜥优化算法 (Horned Lizard Optimization Algorithm ,HLOA)求解无人机路径优化

一、无人机路径规划模型介绍 无人机三维路径规划是指在三维空间中为无人机规划一条合理的飞行路径,使其能够安全、高效地完成任务。路径规划是无人机自主飞行的关键技术之一,它可以通过算法和模型来确定无人机的航迹,以避开障碍物、优化飞行时间和节省能量消耗。 二、算法介…

python学习笔记------集合(set)

集合定义格式 基本语法&#xff1a; #定义集合字面量 {元素&#xff0c;元素&#xff0c;元素......&#xff0c;元素} #定义集合变量 变量名称{元素&#xff0c;元素&#xff0c;元素......&#xff0c;元素} #定义空集合 变量名称set() #定义集合字面量 {元素&#…

海纳斯Hinas安装Tailscale

海纳斯Hinas安装Tailscale 海纳斯安装Tailscale第一步&#xff0c;注册Tailscale账号&#xff0c;并在手机/电脑安装Tailscale第二步&#xff0c;进入海纳斯后台卸载重装Tailscale 海纳斯安装Tailscale 海纳斯自己安装了Tailscale&#xff0c;但是无法使用&#xff0c;需要卸载…

GPU,一统天下

三十年前&#xff0c;CPU 和其他专用处理器几乎处理所有计算任务。那个时代的显卡有助于加快 Windows 和应用程序中 2D 形状的绘制速度&#xff0c;但没有其他用途。 快进到今天&#xff0c;GPU 已经成为业界最具主导地位的芯片之一。 但具有讽刺意味的是&#xff0c;图形芯片…

系统分析与设计(一)

我们有这么多各式各样的工具,互联网给我们带来了这么多用户和数据,这是好事也有副作用。 世界上能访问用户数据,并根据数据做分析和改进的公司,大概Google是其中翘楚,这种 data-centric 的做法做过了头,也有悲剧发生: Douglas Bowman 曾经是Google 的视觉设计主管,2009年的一天…

2013-2021年全国31省电子商务销售额数据(无缺失)

2013-2021年全国31省电子商务销售额数据&#xff08;无缺失&#xff09; 1、时间&#xff1a;2013-2021年 2、指标&#xff1a;电子商务销售额数据 3、来源&#xff1a;国家TJ局、各省NJ 4、范围&#xff1a;31省 5、缺失情况&#xff1a;无缺失 6、指标解释&#xff1a;…

JavaScript高级Ⅱ(全面版)

接上文 JavaScript高级Ⅰ JavaScript高级Ⅰ(自认为很全面版)-CSDN博客 目录 第2章 DOM编程 2.1 DOM编程概述 2.1.4 案例演示(商品全选) 2.1.5 dom操作内容 代码演示&#xff1a; 运行效果&#xff1a; 2.1.6 dom操作属性 代码演示&#xff1a; 运行效果&#xff1a; 2…

程序设计基础--C语言【一】

课堂笔记 1.整数数制 整数数制包括二进制数、八进制数、十进制数、十六进制数 1.1.十进制数 基数为10&#xff0c;由0到9这十个数构成。例如&#xff0c;4261可以看作是&#xff1a; &#xff08;4*1000&#xff09;&#xff08;2*100&#xff09;&#xff08;6*10&#x…

最简单的电子书制作方法

制作电子书的方法有很多种&#xff0c;但最简单的一种可能就是使用在线工具了。现在有很多免费的在线工具可以让您轻松地创建电子书&#xff0c;而无需任何编程或设计技能。以下是最简单的电子书制作方法&#xff1a; 1. 准备好制作工具&#xff1a;FLBOOK在线制作电子杂志平台…

内存管理 --- 页面置换算法

最优置换&#xff1a;&#xff08;参照未来OPT&#xff09; 可以将将来很长一段时间不会访问的逻辑页面&#xff0c;进行置换 举例说明&#xff1a; 首先物理空间只有4个&#xff0c;然后遍历了ABCD 页&#xff0c;其中&#xff0c;要访问5 e 了但是没有&#xff0c;即发生缺页…

登录凭证------

为什么需要登录凭证&#xff1f; web开发中&#xff0c;我们使用的协议http是无状态协议&#xff0c;http每次请求都是一个单独的请求&#xff0c;和之前的请求没有关系&#xff0c;服务器就不知道上一步你做了什么操作&#xff0c;我们需要一个办法证明我没登录过 制作登录凭…

【LLM】Advanced rag techniques: an illustrated overview

note 文章目录 noteAdvanced rag techniques: an illustrated overview基础RAG高级RAG分块和向量化(Chunking & Vectorisation)搜索索引(Search Index)1. 向量存储索引&#xff08;Vector Store Index&#xff09;2. 多层索引(Hierarchical Indices)3. 假设问题和HyDE(Hypo…

【笔记】全国大学生GIS应用技能大赛练习总结

该总结笔记为小组成员在练习完毕了历届题目后自我总结的结果&#xff0c;如有不足之处可以在评论区提出&#xff0c;排版较乱往谅解 绘制带空洞的面要素&#xff1a; 法一&#xff1a; 1、矢量化整个区域。2、矢量化空洞区域。3、将矢量化空洞区域进行合并&#xff08;编辑器…

Linux之selinux详解

华子目录 概念作用selinux与传统的权限区别selinux工作原理名词解释主体&#xff08;subject&#xff09;目标&#xff08;object&#xff09;策略&#xff08;policy&#xff09;&#xff08;多个规则的集合&#xff09;安全上下文&#xff08;security context&#xff09; 文…

【数理统计实验(四)】方差分析

&#x1f349;CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一&#xff5c;统计学&#xff5c;干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项&#xff0c;参与研究经费10w、40w级横向 文…

美洲狮优化算法(Puma Optimizar Algorithm ,POA)求解机器人栅格地图最短路径规划(提供MATLAB代码)

一、美洲狮优化算法 美洲狮优化算法&#xff08;Puma Optimizar Algorithm &#xff0c;POA&#xff09;由Benyamin Abdollahzadeh等人于2024年提出&#xff0c;其灵感来自美洲狮的智慧和生活。在该算法中&#xff0c;在探索和开发的每个阶段都提出了独特而强大的机制&#xf…

java继承,接口,抽象类

目录 目录 1 继承的含义 2 继承的好处 3使类与类之间产生了关系。 看这里继承-------我的理解 代码部分 接口 代码 抽象类 代码 各位友友们大家好呀&#x1f60a;&#xff01; 今天让我们继续回顾java&#xff0c;看看java中的抽象类以及接口继承是什么&#x1f914…

【动态规划】代码随想录算法训练营第三十九天 |62.不同路径,63.不同路径II(待补充)

62.不同路径 1、题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 2、文章讲解&#xff1a;代码随想录 3、题目&#xff1a; 一个机器人位于一个 m x n 网格的左上角 &#xff08;起始点在下图中标记为 “Start” &#xff09;。 机器人每次只能向下或者向右…

%xxx%的环境变量全部失效问题

现象 配置nvm环境变量时候, 我做了如下配置 home配置 NVM_HOMED:\nvm NVM_SYMLINKD:\nvm\nodejs然后配置了path 看上去没有任何毛病, 可是发现nvm -v总是提示命名不存在, 居然发现java -version命令也不存在了, 不过怎么关机重启都是无效, 后面发现直接把D:\nvm配置到path里…

[力扣 Hot100]Day49 二叉树的最近公共祖先

题目描述 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个节点 p、q&#xff0c;最近公共祖先表示为一个节点 x&#xff0c;满足 x 是 p、q 的祖先且 x 的深度尽可能大&#xff08;一个节点也可以…