什么是残差网络结构

news2025/1/21 2:56:05

大家好啊,我是董董灿。

在我刚开始学习AI算法时,有一次参加一个线下的讨论,有个西南大学的本科生,在做汇报时说到了残差网络具有很好的推理效果。

那时的我还未入门,像是听天书,听了半天没搞懂说的啥意思,但是却记住了残差这个词。

那么残差到底是什么呢?在神经网络中他又为什么那么重要呢?

1、残差网络和Resnet

经常读我文章的小伙伴可能指导,我之前写了很多拆解 resnet50 这个网络中算法原理的文章万字长文解析Resnet50的算法原理。

而残差网络在这一网络中就有很显著的作用。在很多学科中,残差指的是:预测值与实际值之间的误差。

而在残差网络中,大致也可以这么理解。只不过在神经网络结构中,残差有更加具体的表示,一般表示为残差块,如下图。

图片

对于正常的神经网络,输入X,那么输出可以表示为F(x),其中F就是神经网络逼近的一个函数。

而残差块的输出除了F(x)之外,还会加上原始输入,也就是说,残差块作为一个神经网络模块,它的输出为:F(x) + x。

在原始论文中,残差块的结构被叫作 short-cut结构,翻译成中文被叫做高速公路。

比如上图中,左侧是正常的神经网络层,一层层往下传,在右侧增加一条直连的线,如此一来,整个网络结构形成了一个残差结构。

原始输入可以顺着右侧的线,如跑高速一般,直接到达残差网络的终点,这就是残差结构。

2、为什么要增加残差结构

深度学习算法之所以区分传统的机器学习,一个关键点在与“深度”二字。

随着神经网络层数的不断增加,神经网络的深度就越深,网络学到的特征就会更加丰富。

但是,能无限制地加深么?肯定是不行的,原因在于不好训练。

神经网络训练的过程是不断与目标值进行拟合的过程,直到拟合的误差降低到人们的预期,那么久代表着神经网络训练完毕,一个AI就诞生了。

但是在训练过程中,数据的传递除了从前往后传之外,还需要将最后一层与目标值的误差往前传,从而在进行下一轮训练时,可以获得更小的误差,这一过程便是神经网络的反向传播

在往回传的过程中,由于误差本身就很小,如果神经网络层数过多,在经过激活函数时,很容易发生误差传着传着就消失了,称为梯度消失

梯度消失的原因有很多种,不好的激活函数、过深的网络层数等都有可能导致误差消失。

上一轮训练结果的误差传不回来,下一轮如何在上一轮的基础上进行进一步优化训练?结果就会导致怎么训练神经网络最终的结果都无法收敛。

AI根本训练不出来,这个时候残差就可以发挥作用。

想象一下,这个高速公路的存在,可以使得输入数据无损地通过。

如果左侧卷积层学习到的数据不够好,那么叠加上无损通过的原始数据,依然保留了原始数据,不至于丢掉原始数据。

而如果左侧卷积层学习到的效果很好,那么依然会保留着学习到的数据,下面的卷积层依然可以在这些数据基础上进一步学习优化。

反向传递也是一样,高速公路的存在,可以确保即使很小的误差也能传递过来,从而避免了梯度消失的发生。

有了残差结构,我们就可以把神经网络设计的更深一些,从而使得神经网络可以识别出更加丰富的特征。

自从有了残差结构,很多网络开始借鉴这种网络设计方法,甚至有些网络会直接把res block,也就是残差块当做一个网络单元来用,这样网络可以设计的更深,提取特征的效果也就更好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1130521.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【c++】模拟实现优先级队列(priority_queue)

全部代码 以容器适配器的玩法来实现,底层容器默认为vector 使用了模板参数T表示存储在队列中的元素类型,Container表示底层容器类型,默认为vector,Compare表示比较器类型,默认为less。 adjustDown函数用于向下调整堆…

高速下载b站视频的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

【C语言】关于char的取值范围的讨论

前提知识: 计算机内存中存的是整数的补码。 正数的原反补相同! 负数的补码 (除符号位以外)原码取反 1 负数的源码 (除符号位以外)补码取反 1 有符号的char,最高位二进制位表示符号位 …

基于 MTAOO 方法论,看连锁餐饮品牌如何落地 CJO 理念、实现精细化用户运营

移动互联网时代的流量红利已经消失,企业亟需在数字化转型时代抓住触点红利,基于客户旅程编排(Customer Journey Orchestration,简称 CJO)为用户提供个性化、全渠道一致的体验。 在此背景下,连锁餐饮品牌已经…

《C和指针》笔记34:字符串函数

文章目录 1. 获取字符串长度strlen 2. 复制字符串strcpystrncpy 3. 拼接字符串strcatstrncat 4. 字符串比较strcmpstrncmp 1. 获取字符串长度 strlen 库函数strlen的原型如下: size_t strlen( char const *string );注意strlen返回一个类型为size_t的值。这个类型…

【GIT】:一文快速了解什么是GIT

【GIT】:一文快速了解什么是GIT 个人主页: 【⭐️个人主页】 需要您的【💖 点赞关注】支持 💯 关于版本控制 什么是“版本控制”?我为什么要关心它呢? 版本控制是一种记录一个或若干文件内容变化,以便将来…

使用数组实现队列

目录 队列的应用场景 任务调度 广度优先搜索(BFS) 网络请求管理 消息队列 当我们在编写JavaScript代码时,经常会遇到需要使用队列的情况。队列是一种常见的数据结构,它按照先进先出(First-In-First-Out&#xff0…

【刷题篇】笔试真题

文章目录 复数乘法一年中的第几天字符串相加字符串相乘 复数乘法 复数 可以用字符串表示,遵循 “实部虚部i” 的形式,并满足下述条件: 实部 是一个整数,取值范围是 [-100, 100] 虚部 也是一个整数,取值范围是 [-100, 1…

ES6初步了解迭代器

迭代器是什么? 迭代器(iterator)是一种接口,为各种不同的数据结构提供统一的访问机制。任何数据结构只要部署 iterator 接口,就可以完成遍历操作 ES6创造了一种新的遍历方法for…of循环,iterator 接口主要供 for…of 使用 原生中具…

docker、docker-compose安装教程,很详细

docker、docker-compose安装教程,很详细 一、卸载旧版1、查看有没有安装过旧版2、停止docker3、删除安装过docker的相关包4、删除docker相关的镜像和容器 二、docker安装1、设置阿里云镜像2、查看所有docker3、安装最新版本4、安装指定版本 三、使用前准备1、启动do…

第二证券:AIGC概念活跃,焦点科技、三维通信涨停,万兴科技大涨

AIGC概念24日盘中走势生动,到发稿,万兴科技、三态股份涨超10%,焦点科技、三维通讯、我国科传等涨停,中文在线涨超9%,果麦文明、新国都涨约7%。 消息面上,各大电商途径于10月18-24日先后发动“双11”大促或…

FPGA驱动步进电机-Sin曲线加速

FPGA驱动步进电机-Sin曲线加速 基本实现原理实际仿真的波形程序 以下由特权同学的FPGA文档摘取 Sin 曲线控制 step 脉冲信号生成的功能框图如下所示。 基本实现原理 ①判断步进电机驱动的目标频率 stepper_delay_target 与当前频率 stepper_delay_current的值是否一致&#…

Java IDEA controller导出CSV,excel

Java IDEA controller导出CSV,excel 导出excel/csv,亲测可共用一个方法,代码逻辑里判断设置不同的表头及contentType;导出excel导出csv 优化:有数据时才可以导出参考 导出excel/csv,亲测可共用一个方法&…

【Jenkins 安装】

一:安装文件夹准备 在/home/admin 界面下新建三个文件夹,用来安装tomcat、maven 1.打开,/home/admin目录 cd /home/admin 2.新建三个文件夹 mkdir tomcat mkdir maven 二:安装tomcat 1.打开tomcat目录进行tomcat的安装 访问:h…

Xfigure综合膳食营养粉美丽上线,大健康行业竞争呈现多元化

10月21日,“美丽健康 营养为先”2023全民营养健康科学论坛暨悦小妖2023秋季新品发布会在杭州召开,会上就当下的国民营养健康问题提出了许多建设性的观点,新发布的Xfigure是行业内少有的提倡营养为主的特膳类产品。 拥抱趋势,全新突…

redis持久化之RDB(Redis DataBase)

1 : 总体介绍 Redis是一个基于内存的数据库,它的数据是存放在内存中,内存有个问题就是关闭服务或者断电会丢 失。 Redis的数据也支持写到硬盘中,这个过程就叫做持久化 1.1 。 Redis提供了2种不同形式的持久化方式。 RDB(Redis Da…

uboot移植之DDR初始化参数更改说明

一. 简介 裸机篇开发时,DDR初始化是 imxdownload软件完成的。imxdownload软件在 二进制文件 u-boot.bin 前面加上头部(IVT、DCD等数据)。这其中所加的头部信息就包括 DDR初始化内容。 u-boot.bin 就是编译出来的 uboot 二进制文件。 uboot 是个裸机程序&#x…

JUnit5参数化测试的几种方式!

参数化测试一直是津津乐道的话题,我们都知道JMeter有四种参数化方式:用户自定义变量、用户参数、CSV文件、函数助手,那么JUnit5有哪些参数化测试的方式呢? 依赖 JUnit5需要添加junit-jupiter-params依赖才能使用参数化&#xff…

Java项目_家庭记账(简易版)

文章目录 简介代码实现 简介 该项目主要用来练习,Java的变量,运算符,分支结构和循环结构的知识点。 程序界面如下: 登记收入 登记支出 收支明细 程序退出 代码实现 package project;import java.util.Scanner;import sta…

【疑问解决】- 源码Enmu枚举类的toString里面的name是哪里来的,什么时候传入的?

起因是听课到 该段的输出boy输出什么&#xff1f; 答案就是输出BOY&#xff0c;但韩老师解释的有点笼统。 但是我看了一眼源码关于这个name确实有点没头绪 public abstract class Enum<E extends Enum<E>>implements Comparable<E>, Serializable {/*** T…