循环神经网络RNN+长短期记忆网络LSTM 学习记录

news2024/11/24 18:33:19

循环神经网络(RNN)

RNN的的基础单元是一个循环单元,前部序列的信息经处理后,作为输入信息传递到后部序列
在这里插入图片描述
x为输入向量,y为输出向量,a为上一隐藏层的a与x通过激活函数得到的值,简言之,每一层神经元是通过输入x和上层得到的权重的a共同得到后续的结果
在这里插入图片描述
上述公式中,在这里插入图片描述为隐藏层的激活函数,在这里插入图片描述为常数,在这里插入图片描述为权重,由此得到a与y。


依次往后,可以得到
在这里插入图片描述

RNN常见的结构

多对多结构(常用于机器翻译)、多对一结构(常用与情感分析)、一对一结构、一对多结构(音乐生成)
在这里插入图片描述

双向循环神经网络

双向循环神经网络通过反向更新的隐藏层来利用方向时间信息
通常用来对序列抽取特征、填空,而不是预测未来
在这里插入图片描述
简言之,双向循环神经网络有两个隐藏层,一个用来输出给后面的神经元,一个反向输出给上一个神经元。
在这里插入图片描述

长短期记忆网络LSTM

参考文章:人人都能看懂的LSTM介绍及反向传播算法推导(非常详细)
RNN是想把所有信息都记住,不管是有用的信息还是没用的信息
LSTM则设计了一个记忆细胞,具备选择性记忆的功能,可以选择记忆重要信息,过滤噪声信息,减轻记忆负担,避免长期依赖问题。
如下图为LSTM结构
在这里插入图片描述

LSTM–遗忘门

在这里插入图片描述
遗忘门就是遗忘对当前状态来说没有用的信息,决定我们还需不需要记住前面状态的信息,即当前时刻的记忆状态有多少来自于前面的记忆。接受ht-1和xt通过Sigmoid 激活函数生成了ft。输出值ft均介于0和1之间,1表示"完全接受这个",0表示"完全忽略这个"

Ct-1是上一层的记忆细胞, 给与LSTM选择记忆功能,使得LSTM有能力选择每个时间步里面记忆的内容。

LSTM–输入门

在这里插入图片描述
输入门就是对当前输入ht-1和xt进行处理,来确定在当前状态哪些信息需要保存。
第一步,通过Sigmoid激活函数来决定什么值需要更新,即产生了it
第二步,通过tanh激活函数创建了一个新的候选值向量,会被加入到状态中。

LSTM–细胞状态更新

在这里插入图片描述
对记忆细胞的更新,忘记不想要的信息,然后在加上在这里插入图片描述根据我们决定更新每个状态的程度进行变化。

LSTM–输出门

在这里插入图片描述
最后我们要确定输出值,第一步,我们将信息输入到一个sigmoid激活函数来确定细胞状态的哪一部分将被输出。第二步,将第一步输出的信息ot与我们的Ct通过一个tanh激活函数最终得到我们确定输出的信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2135324.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode[中等] 74.搜索二维矩阵

给你一个满足下述两条属性的 m x n 整数矩阵: 每行中的整数从左到右按非严格递增顺序排列。每行的第一个整数大于前一行的最后一个整数。 给你一个整数 target ,如果 target 在矩阵中,返回 true ;否则,返回 false 。…

ASP.NET Core高效管理字符串集合

我们在开发 Web 项目时经常遇到需要管理各种来源的字符串集合(例如HTTP 标头、查询字符串、设置的值等)的情况。合理的管理这些字符串集合不仅可以减少出bug的几率,也能提高应用程序的性能。ASP.NET Core 为我们提供了一种特殊的只读结构体 S…

网络基础,协议,OSI分层,TCP/IP模型

网络的产生是数据交流的必然趋势,计算机之间的独立的个体,想要进行数据交互,一开始是使用磁盘进行数据拷贝,可是这样的数据拷贝效率很低,于是网络交互便出现了; 1.网络是什么 网络,顾名思义是…

工业网关在工厂数据采集中的核心作用-天拓四方

随着工业4.0时代的到来,工厂设备数据采集的重要性日益凸显。其中,工业网关以其独特的功能和优势,在工厂数据采集系统中发挥着核心作用。本文旨在深入探讨工业网关在工厂数据采集中的关键作用,以及它是如何助力工厂实现智能化、高效…

高性能编程:无锁队列

目录 1.无锁队列 1.1.1 阻塞(Blocking) 1.1.2 无锁(Lock-Free) 1.1.3 无等待(Wait-Free) 1.2 队列 1.2.1 链表实现的队列 1.2.2 数组实现的队列 1.2.3 混合实现的队列 1.3 多线程中的先进先出数据…

打破瓶颈:搭贝低代码平台助力企业数字化转型

在当今快速变化的商业环境中,越来越多的企业认识到数字化转型的重要性。然而,很多企业在追求数字化的过程中却遇到各种障碍,无论是信息管理的混乱、软件使用的低效,还是应对市场变化的迟缓,这些问题都在消耗企业的资源…

React学习笔记(1.0)

在使用vite创建react时,有一个语言选项,就是typescript-SWC,这里介绍一下SWC。 SWC:可扩展的Rust的平台,用于下一代快速开发工具,SWC比Babel快20倍。 简单来说,就是用于格式转换的&#xff0c…

反向沙箱的功能特点

在这个信息化飞速发展的时代,企业的数据安全面临着前所未有的挑战。员工的无意操作、恶意软件的潜伏、甚至是敌对势力的网络攻击,都可能成为企业数据安全的致命威胁。深信达SPN反向沙箱为您筑起了一道坚不可摧的数据安全防线! 来百度APP畅享高…

《Python青少年趣味编程108例》书籍介绍

文章目录 前言为什么选择Python?书籍介绍文章目录配套资源 前言 在这个数字化飞速发展的时代,编程已经成为了一项不可或缺的技能。对于青少年而言,学习编程不仅能够培养逻辑思维、解决问题的能力,还能激发无限创意,让…

代码随想录刷题day32丨动态规划理论基础,509. 斐波那契数, 70. 爬楼梯, 746. 使用最小花费爬楼梯

代码随想录刷题day32丨动态规划理论基础,509. 斐波那契数, 70. 爬楼梯, 746. 使用最小花费爬楼梯 1.动态规划理论基础 动态规划,英文:Dynamic Programming,简称DP,如果某一问题有很多重叠子问题…

如何实现跨站点协同管理和异地远程管理监控?

前言 随着科技进步,企业愈发重视智能化生产,它提升效率、降低成本、提高质量,帮助企业更好应对市场变化。对于拥有多个分散站点的大型企业,跨站点协同管理成为一大挑战。 在这一背景下,宏集物联网HMI异地远程管理和监…

SSM 传统工艺品销售网站---附源码74714

摘 要 近年来,信息网络迅猛推进,其具有灵活方便、传递消息速度快等优点,这一新兴媒体日渐兴盛,已经成为人们日常生活获取信息一个重要手段。从08开始,电商行业如春风吹过后的小草,呈现出一片蓬勃地发展态势…

yjs03——matplotlib的介绍与使用(一个图里面画折线)

import...as plt plt.figure(figsize(宽度,高度),dpi清晰度) x... y... plt.plot(x,y,label"上海",color“r”,linestyle“--”) plt.xticks(刻度ticks(仅限数字)&#xf…

测试2sigma离群点过滤

椭圆跑道形内部的离群点移除失败,影响拟合结果

为什么自动驾驶技术的实现离不开4G+5G多卡聚合?

如今,汽车制造商和零部件巨头都在研究自动驾驶相关技术。要实现汽车的自动驾驶,不乏相关技术与道路环境的结合和变化。但要实现这一目标,最重要的环节无疑是建设网络。 在4G时代,随着网络带宽和速度的提高,可以实现实…

PMP--一模--解题--51-60

文章目录 9.资源管理--职能经理--项目经理要找他沟通51、 [单选] 团队成员必须按照进度基准来完成一个复杂项目的可交付成果。但是,由于一些团队成员被其他职能经理分配给其他任务,导致项目落后。 若要将项目拉回正轨,项目经理应该做什么&…

软件安装攻略:EmEditor编辑器下载安装与使用

EmEditor是一款在Windows平台上运行的文字编辑程序。EmEditor以运作轻巧、敏捷而又功能强大、丰富著称,得到许多用户的好评。Windows内建的记事本程式由于功能太过单薄,所以有不少用户直接以EmEditor取代,emeditor是一个跨平台的文本编辑器&a…

【vuetify】v-select 无法正常显示,踩坑记录!

一、上代码 template <v-selectv-model"editedUser.userRole":items"roles"label"角色"item-value"value":rules"[rules.required]" ></v-select>script const editedUser ref({userRole: customer // 设置…

springboot老年康复中心—计算机毕业设计源码27406

摘 要 随着互联网趋势的到来&#xff0c;各行各业都在考虑利用互联网将自己推广出法&#xff0c;最好方式就是建立自己的互联网系统&#xff0c;并对其进行维护和管理。在现实运用中&#xff0c;应用软件的工作规则和开发步骤,采用Springboo框架建设老年康复中心信息管理系统。…

Redis运维之监控指标,性能监控,监控方式,响应慢分析

文章目录 1 Redis监控1.1 Redis监控指标1.1.1 性能指标: Performance1.1.2 内存指标: Memory1.1.3 基本活动指标&#xff1a;Basic activity1.1.4 持久性指标: Persistence1.1.5 错误指标&#xff1a;Error 1.2 监控方式1.2.1 info1.2.2 性能监控1.2.3 内存监控1.2.4 基本活动指…