神经网络——day67:Residual Network

news2024/12/27 16:20:26

Deep Residual Learning for Image Recognition

  • Deep Residual Learning for Image Recognition
  • 1. Introduction
  • 2. Related Work
    • Residual Representations(剩余表示).
    • Shortcut Connections(快捷连接).
  • 3. Deep Residual Learning
    • 3.1. Residual Learning
    • 3.2. Identity Mapping by Shortcuts
    • 3.3. Network Architectures
      • Plain Network.
      • image-20230119165226891Residual Network.
    • 4. conclusion

Deep Residual Learning for Image Recognition

1. Introduction

  • 本文提出了一个残差学习框架,以简化比以前使用的网络更深入的网络的训练 。在ImageNet数据集上,评估了深度为152层的残差网–比VGG网咯深8倍,但仍然具有较低的复杂度。

图一:在CIFAR-10数据集上使用20层和56层“普通”网络的训练错误(左)和测试错误(右)。

image-20230119163737464

较深的网络具有较高的训练误差,从而产生较大的测试误差。 在图的ImageNet数据集上也出现了类似的现象 ,如下图所示:

图四

image-20230119163842214

F(x)+x的公式可由“捷径连接”的前馈神经网络实现:

图二:剩余学习:一个构建块:

image-20230119164142289

2. Related Work

请自行了解,本篇不过多赘述

Residual Representations(剩余表示).

Shortcut Connections(快捷连接).

3. Deep Residual Learning

3.1. Residual Learning

  • 让我们把H(x)看作是一个底层映射,它需要由几个堆叠的层(不一定是整个网络)来拟合,其中x表示这些层中第一层的输入。如果假设多个非线性层可以渐近地逼近复杂函数,那么这就相当于假设它们可以渐近地逼近残差函数,即:H(x)− x(假设输入和输出的维数相同)。因此,我们不期望叠层近似H(x),而是显式地让这些叠层近似残差函数F(x):= H(x)− x。因此,原函数变为F(x)+x。虽然两种形式都应该能够渐近地逼近期望的函数(如假设的那样),但学习的容易程度可能不同。
  • 在真实的情况下,恒等映射不太可能是最优的,但是我们的重新表述可以帮助预处理这个问题。如果最优函数更接近恒等映射而不是零映射,那么求解器应该更容易根据恒等映射找到扰动,而不是将函数作为新函数来学习。我们通过实验(图7)表明,学习的残差函数通常具有较小的响应,这表明恒等映射提供了合理的预处理。

image-20230119164750239

3.2. Identity Mapping by Shortcuts

我们对每几个堆叠的层采用剩余学习。构建块如图2所示。形式上,在本文中,我们考虑的构建块定义为:

image-20230119164940884

这里x和y是所考虑的层的输入和输出向量。函数F(x,{Wi})表示要学习的残差映射。对于图2中具有两层的示例,F = W2σ(W1 x),其中σ表示ReLU。运算F + x是通过一个快捷连接和逐元素加法来执行的。

3.3. Network Architectures

我们描述ImageNet的两个模型如下。

Plain Network.

我们的普通基线(图3,中间)主要是受VGG网(图3,左)的启发。卷积层大多具有3×3滤波器,并遵循两个简单的设计规则:

(i)对于相同的输出特征地图大小,层具有相同数量的滤波器;

(ii)如果特征图大小减半,则滤波器的数量加倍,以便保持每层的时间复杂度。

我们直接通过步长为2的卷积层执行下采样。该网络以全局平均池层和使用softmax的1000路完全连接层结束。在图3(中间)中,加权层的总数为34。

image-20230119165200130

image-20230119165216254

image-20230119165226891Residual Network.

在上述简单网络的基础上,我们插入了捷径连接(图3,右图),将网络转化为对应的残差网络。标识快捷方式(公式(1))当输入和输出尺寸相同时,可以直接使用(图3中的实线快捷方式)。当尺寸增加时(图3中虚线快捷方式),我们考虑两种选择:(A)快捷方式仍然执行恒等映射,为增加的维度填充额外的零条目。此选项不引入额外参数;(B)方程中的投影捷径(2)用于匹配维度(通过1×1卷积完成)。对于这两个选项,当快捷键跨越两种大小的要素地图时,它们以步长2执行。

  • 残差网络就介绍到这儿了,现在已经更新换代很多次了,可以从Residual Network这个关键词搜索更多更新的论文来学习神经网络。

4. conclusion

表征的深度对于许多视觉识别任务来说是至关重要的。仅由于我们的极深表示,我们获得了28%的相对改进的COCO对象检测数据集。深度残差网络是我们提交给ILSVRC & COCO 2015竞赛1的基础,我们还在ImageNet检测、ImageNet定位、COCO检测和COCO分割任务中获得了第一名。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/172906.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java项目:学生管理系统

Java项目:学生管理系统一、学生管理系统基础版需求1. 初始菜单2. 学生类:3. 添加功能:4. 删除功能:5. 修改功能:6. 查询功能:代码1. 学生类2. 测试类输出结果a. 添加b. 删除c. 修改d. 查询e. 退出二、学生管…

前端监控 二三事

有必要针对 JS 错误做监控吗? 我们可以先假设不对 JS 错误做监控,试想会出现什么问题? JS 错误可能会导致渲染出错、用户操作意外终止,如果没有 JS 错误监控,开发者完全感知不到线上这些异常情况。特别是像电商、支付…

【2-神经网络优化】北京大学TensorFlow2.0

课程地址:【北京大学】Tensorflow2.0_哔哩哔哩_bilibiliPython3.7和TensorFlow2.1六讲:神经网络计算:神经网络的计算过程,搭建第一个神经网络模型神经网络优化:神经网络的优化方法,掌握学习率、激活函数、损…

7. 字符串str的详细讲解

python3字符串str的使用 (1) 基本使用 [a]. Python 中单引号 和双引号 " 使用完全相同; [b]. 使用三引号(单或双)可以指定一个多行字符串; # 长字符串 print( jkl fsf fs fs )[c]. 反斜杠可以用来转义,使用r(raw)可以让反斜杠…

【LeetCode高频100题-3】冲冲冲(持续更新23.1.19)

文章目录62. 不同路径题意解法1 排列组合解法2 动态规划62. 不同路径 题意 一道数学题,排列组合/小学奥赛题。动态规划不是一般来解决最值问题的吗,这道题为什么会想到dp? 解法1 排列组合 从左上角到右下角,一共要走mn-2步&am…

DEJA_VU3D - Cesium功能集 -完整地图标绘及编辑功能系列预告

前言编写这个专栏主要目的是对工作之中基于Cesium实现过的功能进行整合,有自己琢磨实现的,也有参考其他大神后整理实现的,初步算了算现在有差不多实现小140个左右的功能,后续也会不断的追加,所以暂时打算一周2-3更的样…

【算法】克鲁斯卡尔 (Kruskal) 算法

目录1.概述2.代码实现2.1.并查集2.2.邻接矩阵存储图2.3.邻接表存储图2.4.测试代码3.应用本文参考: 《数据结构教程》第 5 版 李春葆 主编 1.概述 (1)在一给定的无向图 G (V, E) 中,(u, v) 代表连接顶点 u 与顶点 v 的边&#xf…

【6s965-fall2022】剪枝✂pruningⅠ

模型剪枝的介绍 修剪,消除不必要的知识。DNN的知识可以理解为存在于其权重中。 事实证明,许多 DNN 模型可以被分解为权重张量,而权重张量经常包含统计冗余(稀疏性)。因此,你可以压缩 DNN 的权重张量&…

[从零开始]用python制作识图翻译器·五

测试 通过以上步骤我们终于实现了系统,现在到了紧张刺激的测试环节。直接运行run.py文件: python run.py ::注意需要进入conda环境稍作等等,我们的系统就运行啦(啵唧啵唧)。 在使用之前,我们还需要在设置中输入自己的…

使用vscode进行C++代码开发(linux平台)

使用vscode进行C代码开发(linux平台一、插件安装二、常用快捷键三、重要配置文件四、实际例子1. 编译并运行一个含有多个文件夹和文件的代码工程2. 编译并运行一个依赖第三方库的代码工程参考资料一、插件安装 执行 ctrl shift x打开插件窗口,然后搜索c插件&…

鸡格线(map操作)

鸡格线 (nowcoder.com) 题目描述 你有一个长为n的数组a,你需要支持以下两种操作: 1、输入l, r, k,对区间[1,r]中所有数字执行a; f(a;)操作k次(式中等号表示赋值操作),之中f(z)round(10、c),round为四舍五入函数。 2、输出当前数组…

缓存一致性问题怎么解决

关于Redis的其他的一些面试问题已经写过了,比如常见的缓存穿透、雪崩、击穿、热点的问题,但是还有一个比较麻烦的问题就是如何保证缓存一致性。对于缓存和数据库的操作,主要有以下两种方式。先删缓存,再更新数据库先删除缓存&…

Java 多线程 笔记

文章目录实现方式1. 通过Thread类2. 通过Runnable接口3. 通过Callable接口线程状态线程方法1. 线程停止2. 线程休眠sleep3. 线程礼让yield4. 线程强制执行join5. 线程状态观测getState6. 线程优先级守护线程(daemon线程同步 TODO线程死锁Lock锁(可重入锁…

Typora+Gitee+PicGo搭建图床

引言 markdown原则上不建议使用base64内嵌图片,因为太麻烦。 如果只是在本机浏览、编辑的话,那引用相对路径或者绝对路径即可,但是考虑到要发布、分享的情况,使用图床是比较好的解决方案。 本教程可以快速得到一个相对稳定的免…

单片机数据、地址、指令、控制总线结构

数据、地址、指令:之所以将这三者放在一同,是因为这三者的实质都是相同的──数字,或者说都是一串‘0’和‘1’组成的序列。换言之,地址、指令也都是数据。 指令:具体可参考文章 由单片机芯片的设计者规则的一种数字…

c程序gcc编译常见报错及解决方法整理

目录一、简介二、常见报错及解决方法1、数组定义错误2、Not enough information to produce a SYMDEFs file3、文件乱码<U0000>4、未定义或未申明报错5、代码中误加入中文三、其他相关链接一、简介 本文主要是整理c程序编译过程的常见报错的解决方法&#xff0c;方便大家…

Leetcode.312 戳气球

题目链接 Leetcode.312 戳气球 题目描述 有 n个气球&#xff0c;编号为0到 n - 1&#xff0c;每个气球上都标有一个数字&#xff0c;这些数字存在数组 nums中。 现在要求你戳破所有的气球。戳破第 i 个气球&#xff0c;你可以获得 nums[i−1]∗nums[i]∗nums[i1]nums[i - 1]…

C++ 类 对象初学者学习笔记

C 类 & 对象 访问数据成员 #include <iostream>using namespace std;class Box {public:double length; // 长度double breadth; // 宽度double height; // 高度// 成员函数声明double get(void);void set( double len, double bre, double hei ); }; // 成员…

两种在CAD中加载在线卫星影像的方法

概述 经常使用CAD的朋友应该会有这样的一个烦恼&#xff0c;就是当加载卫星图到CAD中进行绘图的时候&#xff0c;由于CAD本身的限制和电脑性能等原因&#xff0c;往往不能加载太大的地图图片到CAD内&#xff0c;这里给大家介绍两种在CAD内加载在线卫星影像的方法&#xff0c;希…

用docker部署webstack导航网站-其一

序言 认识的好朋友斥资买了一个NAS&#xff0c;并搭建了webdev和其他一些web应用&#xff0c;用于存放电子书、电影&#xff0c;并用alist搭建了一个网盘。现在他还缺少一个导航页&#xff0c;于是拖我给他做一个导航页。我欣然接受了&#xff0c;他想做一个和TBox导航&#x…