【AI论文阅读笔记】ResNet残差网络

news2024/9/24 1:56:39

在这里插入图片描述
论文地址:https://arxiv.org/abs/1512.03385

摘要

重新定义了网络的学习方式
让网络直接学习输入信息与输出信息的差异(即残差)
比赛第一名

1 介绍

不同级别的特征可以通过网络堆叠的方式来进行丰富
梯度爆炸、梯度消失解决办法:
    1.网络参数的初始标准化
    2.网络中间层的标准化(BN)
退化的解决办法:
    残差模块
    shortcut可以跳过一层或者多次来进行实现恒等映射,且没有增加额外的参数,也没有增加计算的复杂度
    ResNet复杂度比VGG-16要低

在这里插入图片描述

2 相关工作

    residual representations:
    shortcut connections:不带门功能

3 深度残差学习

3.1 残差学习
        残差函数 F(x)=H(x)-x
        很难将非线性的层训练成恒等映射
        但是在残差的框架下,如果恒等映射是最优的结果,那么网络只需要让新增加的非线性层的权重变为0,即可达到拟合恒等映射的目的。
        在实际的例子中,恒等映射或许不是最优的结果,但是却有助于解决训练退化的问题。(至少不会变差)

3.2 shortcut实现identity mapping

        y=F(x,{Wi})+x
        解决x和F(x)维度不一样的问题:
        y=F(x,{Wi})+Ws*x (这种方法叫投影映射,会带来额外的参数和计算量)

3.3 网络结构

      普通网络:
      残差网络:
            维度增加:
                      (A) 新增的维度用0代替(zero-padding)
                      (B) 线性投影(通过1x1卷积实现,会带来额外的参数和计算量)
           尺寸不一致:
                      使用stridr=2的卷积来让他们统一。(下采样的一种,会带来额外的参数和计算量)

在这里插入图片描述

3.4 部署

                    在卷积和激活之间添加了BN(方差偏移)
                    SGD优化器
                     mini-batch size=256
                    learning rate=0.1( The learning rate starts from 0.1 and is divided by 10 when the error plateaus)
                     momentum=0.9
                    没有使用dropout(与BN不兼容)

4 实验

4.1 ImageNet分类

                     训练集:128万
                     验证集:5万
                     测试:10万
                     普通网络:
                               观测到训练退化的问题:
                                                  34层网络比18层网络有更高的训练误差
                               这种退化现象不太可能是由梯度消失引起的:
                                               因为BN的使用,所以前向传播的过程中不会出现0方差的问题
                                               因为BN的使用,反向传播的过程中所展示出现的梯度也是健康的
                               猜测是由于更深的普通网络就是有指数级的更低的收敛速度。(有待验证)
                     残差网络:
                           18层 34层
                            对应增加的维度,使用0进行填充(方案A),所以相对于普通网络,没有增加新的参数
                            发现:32层残差网络展示了相当低的训练误差,并且可以泛化到验证集
                             说明:残差网络结构可以解决退化问题
                     恒等映射VS投影映射:
                               投影映射并不能在本质上解决退化的问题,而且引入了新的参数。所以为了减少内存使用,时间的复杂度和模型的大小,选择主要使用恒等映射(parameter-free),维度增加时,使用0进行填充。
                   更深的瓶颈结构:
                                无参数的恒等映射对应瓶颈结构来说尤其重要,轻量化。
                   50层残差结构:
                   101层和152层残差结构:
                   和其他先进的方法比:

在这里插入图片描述
在这里插入图片描述

4.2 CIFAR-10数据集测试和分析

                 层响应分析
                 开发大于1000层的网络

4.3 在PASCAL和MS coco上的目标检测

                在其他的识别任务上也有很好的泛化能力。
                比赛第一名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1517889.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

固态硬盘有缓存和没缓存有什么区别

固态硬盘(SSD)已经成为现代计算机的重要组成部分,它们提供了比传统机械硬盘更快的读写速度,从而显著提升了操作系统的运行速度和应用程序的加载效率。 其中,缓存(Cache)是固态硬盘中一个重要的…

Ansible inventory文件详解

我们知道inventory主要用来管理managed nodes(host),定义playbook要在哪些远程机器上执行。如果不熟悉inventory的角色的,可以参考ansible playbook基本概念。 在具体讲解如何构建inventory文件之前,我们必须知道在ansible的配置文件中,有一个参数inventory用于指定默认的…

PyQt4应用程序的PDF查看器

最近因为项目需要创建一个基于PyQt4的PDF查看器应用程序,正常来说,我们可以使用PyQt4的QtWebKit模块来显示PDF文件。那么具体怎么实现呢 ?以下就是我写的一个简单的示例代码,演示如何创建一个PyQt4应用程序的PDF查看器&#xff1a…

几何相互作用GNN预测3D-PLA

预测PLA是药物发现中的核心问题。最近的进展显示了将ML应用于PLA预测的巨大潜力。然而,它们大多忽略了复合物的3D结构和蛋白质与配体之间的物理相互作用,而这对于理解结合机制至关重要。作者提出了一种结合3D结构和物理相互作用的几何相互作用图神经网络GIGN,用于预测蛋白质…

每周一算法:迭代加深搜索

题目链接 加成序列 题目描述 满足如下条件的序列 X X X&#xff08;序列中元素被标号为 1 、 2 、 3 … m 1、2、3…m 1、2、3…m&#xff09;被称为加成序列&#xff1a; X [ 1 ] 1 X[1]1 X[1]1 X [ m ] n X[m]n X[m]n X [ 1 ] < X [ 2 ] < … < X [ m − 1 ]…

泽众云真机-机型支持ADB调试功能即将上线

最近云真机平台在线客服&#xff0c;收到很多咨询关于ADB调试功能&#xff0c;什么时候能更新&#xff1f;据小编所知&#xff0c;正在升级之中&#xff0c;有一块专门为了解决ADB调试功能提前准备&#xff0c;升级网络硬件设备&#xff0c;目前平台的功能已开发完成&#xff0…

windows 资源管理器(explorer)占用高的问题

找到配置 win r 输入 gpedit.msc 打开本地组策略管理器 扎到本地计算机策略-》 用户配置-》管理模板-》 windows组件-》 搜索 将后续的设置项均设置为已禁用

SpringTask实现的任务调度与XXL-job实现的分布式任务调度【XXL-Job工作原理】

目录 任务调度 分布式任务调度 分布式任务调度存在的问题以及解决方案 使用SpringTask实现单体服务的任务调度 XXL-job分布式任务调度系统工作原理 XXL-job系统组成 XXL-job工作原理 使用XXL-job实现分布式任务调度 配置调度中心XXL-job 登录调度中心创建执行器和任务 …

CVPR2023 | 3D Data Augmentation for Driving Scenes on Camera

3D Data Augmentation for Driving Scenes on Camera 摄像机驾驶场景的 3D 数据增强 摘要翻译 驾驶场景极其多样和复杂&#xff0c;仅靠人力不可能收集到所有情况。虽然数据扩增是丰富训练数据的有效技术&#xff0c;但自动驾驶应用中现有的摄像头数据扩增方法仅限于二维图像…

MySQL order by 语句执行流程

全字段排序 假设这个表的部分定义是这样的&#xff1a; CREATE TABLE t (id int(11) NOT NULL,city varchar(16) NOT NULL,name varchar(16) NOT NULL,age int(11) NOT NULL,addr varchar(128) DEFAULT NULL,PRIMARY KEY (id),KEY city (city) ) ENGINEInnoDB; 有如下 SQL 语…

自动控制原理--matlab/simulink建模与仿真

第一讲 自动控制引论 第二讲 线性系统的数学模型 第三讲 控制系统的复域数学模型(传递函数) 第四讲 控制系统的方框图 /video/BV1L7411a7uL/?p35&spm_id_frompageDriver pandas, csv数据处理 numpy&#xff0c;多维数组的处理 Tensor&#xff0c;PyTorch张量 工作原理图…

留学生课设|R语言|研究方法课设

目录 INSTRUCTIONS Question 1. Understanding Quantitative Research Question 2. Inputting data into Jamovi and creating variables (using the dataset) Question 3. Outliers Question 4. Tests for mean difference Question 5. Correlation Analysis INSTRUCTIO…

Tomcat的使用

1. Tomcat 1.1 Tomcat 是什么 Tomcat 就是基于 Java 实现的一个开源免费, 也是被广泛使用的 HTTP 服务器 1.2 下载安装 Tomcat官网选择其中的 zip 压缩包, 下载后解压缩即可&#xff0c;解压缩的目录最好不要带 “中文” 或者 特殊符号 进入 webapps 目录,每个文件夹都对应…

graylog API 弱密码

graylog web 页面密码设置 输入密码&#xff1a;获取sha256加密后密码 echo -n "Enter Password: " && head -1 </dev/stdin | tr -d \n | sha256sum | cut -d" " -f1vi /etc/graylog/server/server.conf #修改以下配置 root_usernameroot ro…

Monorepo 解决方案 — 基于 Bazel 的 Xcode 性能优化实践

背景介绍 书接上回《Monorepo 解决方案 — Bazel 在头条 iOS 的实践》&#xff0c;在头条工程切换至 Bazel 构建系统后&#xff0c;为了支持用户使用 Xcode 开发的习惯&#xff0c;我们使用了开源项目 Tulsi 作为生成工具&#xff0c;用于将 Bazel 工程转换为 Xcode 工程。但是…

【爬虫开发】爬虫从0到1全知识md笔记第1篇:爬虫概述【附代码文档】

爬虫开发从0到1全知识教程完整教程&#xff08;附代码资料&#xff09;主要内容讲述&#xff1a;爬虫概述。selenium的其它使用方法。Selenium课程概要。常见的反爬手段和解决思路。验证码处理。chrome浏览器使用方法介绍。JS的解析。Mongodb的介绍和安装,小结。mongodb的简单使…

信息系统项目管理师--干系人管理

干系人会受到项⽬积极或消极的影响&#xff0c;或者能对项⽬施加积极或消极的影响 项⽬经理和团队管理⼲系⼈的能⼒决定着项⽬的成败。为提⾼项⽬成功的概率&#xff0c; 尽早开始识别⼲系⼈并引导⼲系⼈参与。当项⽬章程被批准、项⽬经理被委任&#xff0c;以及团队开始组建之…

【剪枝实战】使用VGGNet训练、稀疏训练、剪枝、微调等,剪枝出只有3M的模型

摘要 本次剪枝实战是基于下面这篇论文去复现的&#xff0c;主要是实现对BN层的γ/gamma进行剪枝操作&#xff0c;本文用到的代码和数据集都可以在我的资源中免费下载到。 相关论文&#xff1a;Learning Efficient Convolutional Networks through Network Slimming (ICCV 2017…

算法---滑动窗口练习-3(水果成篮)

水果成篮 1. 题目解析2. 讲解算法原理3. 编写代码 1. 题目解析 题目地址&#xff1a;水果成篮 2. 讲解算法原理 算法的主要思想是使用滑动窗口来维护一个包含最多两种水果的子数组。定义两个指针 left 和 right 分别表示窗口的左边界和右边界。还定义了一个数组 hash 来记录水…

【新书推荐】29.1 32位汇编基本概念

第二十九章 32处理器体系结构 这一章我们将讲述32处理器体系结构。包括32位计算机的一些基本概念&#xff0c;32位处理器&#xff0c;程序加载执行的过程&#xff0c;32位计算机的硬件组成和输入输出系统。 29.1 基本概念 本节内容&#xff1a; ■实模式与保护模式 ■操作系…