循环神经网络-RNN

news2024/10/9 10:03:50

文章目录

  • 前言
  • 一、RNN介绍
    • 1.基本结构
    • 2.隐藏态特点
    • 3.输出计算
  • 二、RNN循环由来与局限
  • 三、RNN延申

前言

  • 因为传统神经网络无法训练出具有顺序的数据且模型搭建时没有考虑数据上下之间的关系。所以我们提出了循环神经网络。

一、RNN介绍

循环神经网络(Recurrent Neural Network,RNN)是一种用于处理序列数据的神经网络架构。与传统神经网络(Feedforward Neural Network, FNN)不同,RNN能够在处理序列输入时具有记忆性,可以保留之前输入的信息并继续作为后续输入的一部分进行计算。
在这里插入图片描述

1.基本结构

RNN 的基本结构包含以下几个部分:

  • 输入层(Input Layer):接收序列中的当前输入。
  • 隐藏层(Hidden Layer):包含循环连接,能够接收来自上一时间步的隐藏状态。
  • 输出层(Output Layer):基于隐藏层的当前状态生成输出。

RNN 的隐藏层在每一个时间步都会更新其状态,这个状态不仅取决于当前的输入,还取决于上一个时间步的隐藏状态。这使得 RNN 能够捕捉序列数据中的时间依赖性。

2.隐藏态特点

特点:引入了隐状态h(hidden state)的概念,隐状态h可以对序列形的数据提取特征,接着再转换为输出。
在这里插入图片描述
如上图,最开始我们输入 x 1 x_1 x1,导入最初的隐藏态 h 0 h_0 h0
通过RNN计算公式:
h n = f ( U x n + W h n − 1 + b ) h_n=f(Ux_n+Wh_{n-1}+b) hn=f(Uxn+Whn1+b)
我们可以得出后续的 h 1 = f ( U x 1 + W h 0 + b ) h_1=f(Ux_1+Wh_{0}+b) h1=f(Ux1+Wh0+b) h 2 = f ( U x 2 + W h 1 + b ) h_2=f(Ux_2+Wh_{1}+b) h2=f(Ux2+Wh1+b)等等。

注意: 1、W是隐藏状态到隐藏状态的权重矩阵,U是输入到隐藏状态的权重矩阵,b是隐藏层的偏置向量,f 是激活函数(如 tanh 或 ReLU)。在计算时,每一步使用的参数U、W、b都是一样的,也就是说每个步骤的参数都是共享的,这是RNN的重要特点;
2、LSTM和GRU中的权值则不共享。

3.输出计算

在这里插入图片描述
RNN结构中输入是 x 1 x_1 x1, x 2 x_2 x2, … x n x_n xn,输出为 y 1 y_1 y1, y 2 y_2 y2, … y n y_n yn,也就是说,输入和输出序列必须要是等长的。
根据输出结果的计算公式:
y n = g ( V h n + c ) y_n=g(Vh_n+c ) yn=g(Vhn+c)
可以得出 y 1 = S o f t m a x ( V h 1 + c ) y_1=Softmax(Vh_1+c) y1=Softmax(Vh1+c)

V是隐藏状态到输出的权重矩阵,c是输出的偏置向量,g 是输出层的激活函数(如 softmax 等)。

二、RNN循环由来与局限

循环由来:
在这里插入图片描述
上图中可以看出,RNN的网络结构中包含了一个环路,这个环路使得数据可以在网络中不断循环。是RNN的核心特征,也是其被称为“循环”神经网络的关键所在。通过这个环路,RNN可以一边记住过去的数据,一边更新到最新的数据,从而实现对序列数据的处理。
局限性:
当我们所需要的相关信息和当前预测位置之间的间隔较远时,可能会影响学习效率。这是因为梯度会随着时间的推移不断下降减少,而当梯度值变得非常小时,就不会继续学习。​

三、RNN延申

尽管 RNN 能够处理序列数据,但在处理长期依赖关系时存在梯度消失(Vanishing Gradient)和梯度爆炸(Exploding Gradient)问题。为了解决这个问题,RNN 进行了延申,包括:

长短期记忆网络(Long Short-Term Memory, LSTM):

  • LSTM 通过引入三个门(遗忘门、输入门和输出门)以及一个细胞状态(Cell State)来捕获长期依赖关系。

门控循环单元(Gated Recurrent Unit, GRU):

  • GRU 是 LSTM 的简化版本,通过将 LSTM 中的遗忘门和输入门合并成一个更新门,以及将细胞状态和隐藏状态合并,简化了模型结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2198727.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LabVIEW惯性导航系统仿真平台

LabVIEW开发捷联惯性导航系统仿真平台,采用模块化设计,利用LabVIEW的图形化编程特性,提高了系统仿真的效率和精度,同时具备良好的可扩展性和用户交互性。 项目背景 当前,惯性导航系统(INS)的研…

EMC-LISN是什么

LISN,Line Impedance Stabilization Network的缩写,即线路阻抗稳定网络 LISN主要是用于EMI测试中传导发射(CE)的 我们希望只测试到待测产品传导出来的干扰,能够不测试到电源输入本身上面的干扰。 测试场地不同&…

如何避免PuTTY的连接超时

问题:使用PuTTY默认创建的SSH连接,过一会就会提示“Remote side unexpectedly closed network connection" 解决方法: 要防止PuTTY会话由于空闲而断开连接,可以通过启用keep-alives功能,使PuTTY定期向远程主机发…

【实时计算 Flink】检查点和快照超时的诊断方法与调优策略

Flink的状态管理是一个复杂而关键的领域,涉及到作业的性能、稳定性和资源利用等多个方面。通过对状态生成机制和优化策略地深入理解与正确应用,结合实时计算Flink版提供的产品能力,可以帮您有效地优化Flink作业以应对大规模状态作业带来的挑战…

PigGo的安装配置

TyporaPigGo的使用 1、下载PigGo 1.1、先打开Typora的偏好设置 1.2 下载PigGo app 1.3 下载Setup-xxx.exe版本 1.4安装成功后打开PigGo 2、配置PigGo 1、安装gitee-uploader插件 2、 PicGo设置 ​ ​ 3、图床设置 3.1配置SM.MS 3.1.1 登录sm,生成秘钥 如果没有注册&…

期权懂|期权交易涨跌幅限制会随时调整吗?

本期让我懂 你就懂的期权懂带大家来了解,期权交易涨跌幅限制会随时调整吗?有兴趣的朋友可以看一下。期权小懂每日分享期权知识,帮助期权新手及时有效地掌握即市趋势与新资讯! 期权交易涨跌幅限制会随时调整吗? 涨跌幅…

天玑 9400 基本确认:4大升级,一代“冰龙”来了

去年,天玑9300 破釜沉舟,打破了A系不可击败的神话。但今年,对安卓阵营来说,才是扬眉吐气的时刻。 因为芯片人才的流失,果子已经雄风不再。即使是 4nm 工艺打3nm工艺,天玑 9300 的 GPU效能,也压…

机器学习笔记-1

文章目录 前言一、How to find a function二、Define Loss from Training Data三、Optimization总结 前言 机器学习(Machine Learning, ML)是一门让计算机通过数据来自动学习和改进的技术。它的核心理念是通过分析大量的历史数据来找到其中的规律&#…

YOLOv10改进策略【注意力机制篇】| CVPR2024 CAA上下文锚点注意力机制

一、本文介绍 本文记录的是基于CAA注意力模块的YOLOv10目标检测改进方法研究。在远程遥感图像或其他大尺度变化的图像中目标检测任务中,为准确提取其长距离上下文信息,需要解决大目标尺度变化和多样上下文信息时的不足的问题。CAA能够有效捕捉长距离依赖…

Spark算子使用-Map,FlatMap,Filter,diatinct,groupBy,sortBy

目录 Map算子使用 FlatMap算子使用 Filter算子使用-数据过滤 Distinct算子使用-数据去重 groupBy算子使用-数据分组 sortBy算子使用-数据排序 Map算子使用 # map算子主要使用长场景,一个转化rdd中每个元素的数据类型,拼接rdd中的元素数据&#xf…

NUKE 15有哪些新的改进功能?影视后期特效合成NUKE 15 安装包分享 【Mac/win】

Nuke 15是一款由英国The Foundry公司开发的专业的合成软件,被广泛用于电影、电视和广告制作中的后期合成和特效制作。 Nuke 15拥有强大的功能和灵活性,可以帮助用户处理各种复杂的合成任务,包括图像修复、色彩校正以及粒子特效等。它具备高效…

sql注入第8关

手工注入麻烦 目录 判断闭合方式 判断注入类型 手工注入 1、获取数据库名 2、爆破数据库的名字(security) 3、爆破表的数量 4、判断表名的长度 5、判断表的列名数量 6、判断表的列名的名字 7、获取表的数据 8、判断数据的长度 9、判断数据的…

在 Hugging Face MTEB 排行榜上比较 ELSER 的检索相关性

作者:来自 Elastic Aris Papadopoulos 及 Serena Chou 本博客对 ELSER 在 Hugging Face MTEB 排行榜上的检索相关性进行了比较。 在 Hugging Face MTEB 排行榜上比较 ELSER 的检索相关性 ELSER(Elastic Learned Sparse EncodeR)是 Elastic …

WMS 智慧仓储管理系统的可视化管理_SunWMS

【大家好,我是唐Sun,唐Sun的唐,唐Sun的Sun。一站式数智工厂解决方案服务商】 WMS 智慧仓储管理系统的可视化管理主要表现在以下几个方面: 首先是库存可视化。通过系统,仓库管理人员能够以直观的图表、图形等形式清晰地…

pdf怎么加密码怎么设置密码?这几种pdf设置密码的方法简单!

pdf怎么加密码怎么设置密码?PDF格式作为现代办公和学习中频繁使用的文档类型,其身影遍布于各类场景,然而,在享受PDF带来的便利之余,不少用户对其安全性产生了疑虑,尽管PDF文件相较于其他格式更难被直接编辑…

如何查看是否是ip转发?

一、什么是ip转发 ip转发指的是路由器或者其他网络设备把接受的ip数据包从一个接口转发到另一个ip的过程。在ip转发的过程中,如果某个设备接收到某个数据包时发现该设备不是此数据包的最终目的地,它就会根据路由表中的信息将此数据包转发到下一个适合的…

10.8摩尔学习知识点

今天学习获取数据 在摩尔云平台找到要修改的主视图,然后点击操作功能,点击新增,直接输入名字获取数据,然后,显示顺序15,显示是,点击确定,然后就是自定义类上面输入创建的类名&#…

006集—— CAD锁文档的用法(CAD—C#二次开发入门)

CAD 二开中,当要在除当前文档外的其它文档的模型空间或图纸空间中添加图元时,需要先锁定其文档。用户可用要锁定的Document对象的LockDocument方法进行锁定。在调用LockDocument方法后,将返回一个DocumentLock对象。 本例创建一个新的文档然…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《面向电动汽车用户的电价套餐模块化设计 》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

数学建模算法与应用 第1章 线性规划

第1章 线性规划 线性规划是数学规划领域的重要分支,广泛应用于资源配置、生产计划、物流管理等领域。它主要用于解决如何在满足一定约束条件下,使目标函数(如成本、利润等)达到最大或最小的问题。第一章将介绍线性规划的基本概念…