循环神经网络三

循环神经网络三

news2025/2/23 18:22:44

一.介绍

在普通的神经网络中，信息的传递是单向的，这种限制虽然使得网络变得更容易学习，单在一定程度上也减弱了神经网络模型的能力。特别是在现实生活中，网络的输出不仅和当前时刻的输入相关，也过去一段时间的输出相关。此外，普通网络难以处理时序任务，比如语言，视频，文本等等，时序数据的长度一般是不固定的，而前馈神经网络要求和输出的维数都是固定的，不能任意改变。所以处理这一类时序相关的问题时，需要一种能力更强的模型

循环神经网络（Recurrent Neural Network，RNN ）是一类具有短期记忆的神经网络。在循环神经网络中，神经元不仅可以接收其他神经元的信息，还可以接收自身的信息，形成具有环路的网络结构。

可以看到RNN比传统的审计网络多了一个循环，这个循环表示在下一个时间步上会返回作为输入的一部分，把RNN时间点展开就是：

就是在t_0时刻x_0输入后返回h_0的同时将h_0当成输入和下一个时间点的x_1一起输入，如此反复

或者是：当x_t-1输入后返回的结果h_t-1和x_t一起当作输入后通过tanh计算后输出h_t同时向下一个时间点输入h_t

在不同的时间步中，RNN的输入都与之前的时间状态有关，t_n时刻网络的输出和之前的所有历史共同作用的结果。

图1：固定长度的输入和输出，比如图像分类

图2：序列输入，输入一个数据，逐渐分析结果，比如图像转文字

图3：数列输入，输入一些数据，总结后得出结果，比如文本分类

图4：异步的序列输入和输出，比如文本翻译

图5：同步的序列输入和输出，比如根据视频的每一帧来对视频分类

二.LSTM

1.LSTM的基础介绍

假如现在有一个文本预测，比如天上的云朵漂浮在__，通过间隔不愿的位置可以预测到答案是天上。但是对于有些句子，答案可能在很远的位置，间隔非常大，随着间隔的增大对于RNN来说，效果就不怎么好了。而LSTM（Long Short-Term Memory）可以解决这个问题，LSTM是RNN的一种特殊类型，可以长期依赖信息，而RNN只能短期的依赖。

其中x表示相乘，+表示相加， $\sigma$ 表示使用某个函数

2.LSYM的核心

LSTM的核心在于单元中的状态，也就是图中最上边那根弦。

如果只要这跟线，那么就不能对信息增加或者删除，所以在LSTM是通过一个叫做门的结构实现的，门可以选择让信息通过或者不通过

这个门主要是通过sigmoid和点乘实现的

sigmoid函数的结果是在0-1之间的，如果结果为0那么就不让这个信息通过，如果是1就全部通过

3.遗忘门

遗忘门是通过sigmoid函数实现的，用来决定哪些信息保留，哪些信息遗忘。

下图就是h_t-1和x_t进行合并后乘上权重和偏置然后通过sigmoid函数，输入一个0-1之间的值，这个值会和前一个细胞输出的状态c_t-1进行点乘，从而决定是遗忘还是保留

4.输入门

i_i是sigmoid函数后，结果在0-1之间，决定哪些信息会被更新，tanh会创造一个新的候选量C_t如果i_i不是0的话可能会添加到细胞中，比如昨天我吃了苹果，今天我想吃梨，通过遗忘门可以遗忘掉苹果，通过输入门可以输入梨。

经过输入门后就可以更新细胞状态了，C_t-1更新为C_t。怎样更新呢

1.旧的细胞状态和遗忘门的结果相乘

2.然后加上输入门和tanh相乘的结果

5.输出门

最后，我们需要决定哪些信息会被输出，和输入门差不多，线通过sigmoid函数结果来决定哪些细胞状态会被输出

1.前一次的输出结果h_t-1和当前时间步输入的x_t组和通过sigmoid函数进行处理后结果

2.在输入门的时候更新过的细胞状态C_t会经过tanh层的处理将数据转换到(-1,1)之间

3.将1和2的结果点乘后得到结果，一个输入结果，一个输入到下一个时间步的结果

三.GPU

GRU(Gated Recurrent Unit),是一种LSTM的变形版本，它将遗忘门和输入门组合成一个“更新门”。它还合并了单元状态和隐藏状态，并进行了一些更改。

1.z_t就是上一次的结果和这一次的数据通过sigmoid函数后的结果

2.r_t和z_t一样

3.h_t一把是r_t和上一次的结果h_t-1点乘后于x_t组合后通过tanh后的结果

4.h_t是z_t通过1-后点乘上一次的结果后加上z_t点乘上h_t一把的结果

r_t到z_t是更新门，而后面的就是输入出门

四.双向LSTM

结合上面的例子，都是对前面的结果进行计算，而一个词语填空有些时候也要看后面的数据。那么就需要有一种计制，能够使模型不仅能够从前面获得记忆，还要从后获得记忆。此时就要用到双向LSTM了。

从图中可以看出，没给x的输入后不仅得到了结果，这个结果还传到了下一个时间步中计算，而且还生成了一个LSTM_b的结果，因为LSTM_0的箭头是从后往前的，所以使得当前这个时步同时拥有了前后的数据。

都看到这里了，一键三连呗！！！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2036561.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

keepalived搭建与基础配置

keepalived搭建与基础配置

目录 1 keepalived部署与环境准备 1.1 Keepalived 实验环境准备 1.2 Keepalived 相关文件 1.3 Keepalived 安装 1.4 KeepAlived 配置说明 1.5 配置语法说明 2 企业应用示例与配置 2.1 主从架构 2.1.1 启用keepalived日志功能 2.1.2 vrrp_iptables 参数 2.1.3 实现独立子配置文件…

阅读更多...

python实现模型训练期间定时查询解析GPU资源详细信息，根据实际显存占用量动态启动新模型训练任务

python实现模型训练期间定时查询解析GPU资源详细信息，根据实际显存占用量动态启动新模型训练任务

经常要做模型开发训练的人一定对于GPU的查询不会陌生，实例如下： 详情数据如下： Tue Aug 13 16:42:31 2024 ----------------------------------------------------------------------------- | NVIDIA-SMI 450.80.02 Driver Versi…

阅读更多...

oracle普通导出导入

oracle普通导出导入

原始的普通导出导入工具，是一个客户端工具。使用导出工具（export utility简称exp）是将数据从oracle数据库以二进制形式写入操作系统文件，这个文件存储在数据库之外，并且可以被另一个数据库使用导入工具（imp…

阅读更多...

大数据系列之：Flink Doris Connector，实时同步数据到Doris数据库

大数据系列之：Flink Doris Connector，实时同步数据到Doris数据库

大数据系列之：Flink Doris Connector，实时同步数据到Doris数据库一、版本兼容性二、使用三、Flink SQL四、DataStream五、Lookup Join六、配置通用配置项接收器配置项查找Join配置项七、Doris 和 Flink 列类型映射八、使用Flink CDC访问Doris的示例九、…

阅读更多...

Unity协程WaitForSeconds在编辑器和WebGL表现不同问题的解决方法参考

Unity协程WaitForSeconds在编辑器和WebGL表现不同问题的解决方法参考

最近做的一个效果让下面为了让下面这种图片生成一个翻页效果（使用ShaderGraph中的FlipBook节点），我通过携程来实现连续翻页。先是定义一个Coroutine coroutine null； 然后在一定情况下执行coroutine StartCoroutine(KeepPrevie…

阅读更多...

Spring入门讲解

Spring入门讲解

这里写目录标题 Spring基础概念关键重点主要特性主要优势Spring与Java EE的对比Spring生态系统概述总结 Spring 基础概念 Spring是一个开源的轻量级Java开发框架，它提供了全面的基础设施支持，简化了企业级应用的开发和部署。Spring的核心理念是依赖注入…

阅读更多...

基于华为atlas下的yolov5+BoT-SORT/ByteTrack煤矿箕斗状态识别大探索

基于华为atlas下的yolov5+BoT-SORT/ByteTrack煤矿箕斗状态识别大探索

写在前面： 本项目的代码原型基于yolov5yolov8。其中检测模型使用的yolov5，跟踪模型使用的yolov8。这里说明以下，为什么不整体都选择yolov8呢，v8无疑是比v5优秀的，但是atlas这块经过不断尝试没有过去，所以…

阅读更多...

前端进行分页Vue3+Setup写法

前端进行分页Vue3+Setup写法

当后端不方便提供数据分页查询接口时，就需要前端来自己分割进行分页操作在有可能的情况下还是建议用分页查询接口，减少网络数据传输首先el-table绑定数组分页组件，变量自己定义防止报错 <el-paginationlayout"->, total, siz…

阅读更多...

Springboot实现doc,docx,xls,xlsx,ppt,pptx,pdf,txt,zip,rar,图片,视频,音频在线预览功能，你学“废”了吗？

Springboot实现doc,docx,xls,xlsx,ppt,pptx,pdf,txt,zip,rar,图片,视频,音频在线预览功能，你学“废”了吗？

最近工作中，客户需要生成包含动态内容的word/pdf报告，并且需要在线预览。刚开始使用后台直接生成word文档，返回文件流给前端，浏览器预览会发生格式错乱问题，特别是文档中的图片有些还不显示。想到最简单的办法就是…

阅读更多...

在原生未启用kdump的BCLinux 8系列服务器上启用kdump及报错处理

在原生未启用kdump的BCLinux 8系列服务器上启用kdump及报错处理

本文记录了在原生未启用kdump的BCLinux 8系列操作系统的服务器上手动启用kdump服务及报错处理的过程。一、问题描述 BCLinux 8系列操作系统，系统初始化安装时未启用kdump服务，手动启动时报以下“No memory reserved for crash kernel”或“ConditionK…

阅读更多...

数学建模——评价决策类算法（层次分析法、Topsis）

数学建模——评价决策类算法（层次分析法、Topsis）

一、层次分析法概念原理通过相互比较确定各准则对于目标的权重, 及各方案对于每一准则的权重，这些权重在人的思维过程中通常是定性的, 而在层次分析法中则要给出得到权重的定量方法. 将方案层对准则层的权重及准则层对目标层的权重进行综合, 最终确定方案层对目标…

阅读更多...

解读RPA自动化流程机器人

解读RPA自动化流程机器人

RPA全称Robotic Process Automation，即机器人流程自动化，基于人工智能和自动化技术，能够将大量重复、规则明确的日常事务操作实现自动化处理，通常被形象地称为“数字员工”。本文金智维将深入探讨RPA的主要价值和应用领域&#xf…

阅读更多...

除悟空CRM外，主流的6大CRM私有部署的厂商

除悟空CRM外，主流的6大CRM私有部署的厂商

支持私有化部署的CRM有：1.纷享销客； 2.悟空CRM； 3.销售易； 4.有赞CRM； 5.知客CRM； 6.八骏CRM； 7.白码CRM。面对日益复杂的网络环境和严峻的数据保护法规，私有化部署的CRM系统成为了…

阅读更多...

论文阅读笔记：Semi-DETR: Semi-Supervised Object Detection with Detection Transformers

论文阅读笔记：Semi-DETR: Semi-Supervised Object Detection with Detection Transformers

论文阅读笔记：Semi-DETR: Semi-Supervised Object Detection with Detection Transformers 1 背景1.1 动机1.2 问题 2 创新点3 方法4 模块4.1 分阶段混合匹配4.2 跨视图查询一致性4.3 基于代价的伪标签挖掘4.4 总损失效果5.1 和SOTA方法对比5.2 消融实验论文&…

阅读更多...

Flink开发过程中遇到的问题

Flink开发过程中遇到的问题

1. 任务启动报错Trying to access closed classloader. Exception in thread "Thread-5" java.lang.IllegalStateException: Trying to access closed classloader. Please check if you store classloaders directly or indirectly in static fields. If the st…

阅读更多...

基于PSO-BP+BP多特征分类预测对比(多输入单输出) Matlab代码

基于PSO-BP+BP多特征分类预测对比(多输入单输出) Matlab代码

基于PSO-BPBP多特征分类预测对比(多输入单输出) Matlab代码 1、和市面上的不同，运行一个main一键出对比图，非常方便 2、可以根据需要定制其他算法优化模型对比程序已经调试好，无需更改代码替换数据集即可运行！！&…

阅读更多...

Python | Leetcode Python题解之第334题递增的三元子序列

Python | Leetcode Python题解之第334题递增的三元子序列

题目： 题解： class Solution:def increasingTriplet(self, nums: List[int]) -> bool:n len(nums)if n < 3:return Falsefirst, second nums[0], float(inf)for i in range(1, n):num nums[i]if num > second:return Trueif num > first…

阅读更多...

C++字体库开发之EM长度单位转换九

C++字体库开发之EM长度单位转换九

freetype 设置EM // if (m_face) // FT_Set_Pixel_Sizes(*m_face, 0, pixelSize); // 动态宽，固定高 px // error FT_Set_Char_Size(face, /* face 对象的句柄 */ // 0, /* 以 …

阅读更多...

Unity Audio

Unity Audio

这章练习将介绍在unity中创建 audio（音频）的工具，培养的技能将帮助创建引人入胜的音频音景。完成本次学习后，能够使用 Unity 中的所有主要音频组件，为各种不同体验创建音频效果。音频处理工具： Audacity…

阅读更多...

Mintegral出海系列：解锁全球应用商店新增长路径

Mintegral出海系列：解锁全球应用商店新增长路径

在全球化竞争的浪潮中，面对打法各异的应用和游戏品类，以及全球数百个环境不同的国家和地区，开发者们正面临着前所未有的挑战。Mintegral「出海ing」系列专题内容，助力出海开发者选准赛道探索新的增长路径。据近期数据显示&#x…

阅读更多...

推荐文章

最新文章