RNN、LSTM、Seq2Seq

news2024/10/6 18:36:38

目录

  • 时间序列表示
  • 梯度弥散和梯度爆炸
  • RNN(循环神经网络)
  • LSTM
  • Seq2Seq
  • ELMo

时间序列表示

核心是加入历史信息去预测下一步骤

在NLP中,序列维度一般是这个样子:[b,seq_len,feature_len]
b个句子,每个句子seq_len个单词,每个单词128个维度

NLP大部分是和时间相关的

步长,在计算机又叫记忆,比如预测一个点的值,是用多长的步长去预测它,要根据不同数据选择不同的步长

Embedding是词向量的分布式表示
在这里插入图片描述

梯度弥散和梯度爆炸

当解决短文本没有这个问题,解决长文本时,这个模型就有问题
在这里插入图片描述
在这里插入图片描述

RNN(循环神经网络)

在这里插入图片描述
xt@wxh是自身的影响,ht@wxh是历史信息的影响

在这里插入图片描述
在这里插入图片描述
只要Y4的输出信息,因为Y4记录了前面的历史信息,所以4个单词就变成只要1个单词

多层循环神经网络
在这里插入图片描述

堆叠RNN
在这里插入图片描述
信息越来越明确、清晰

双向RNN
在这里插入图片描述
反向进行也有可能让信息更加明确

LSTM

由RNN来的,在此基础上增加一些门控机制,门控用来选择存储哪些历史信息
在这里插入图片描述
在这里插入图片描述
ft决定遗忘哪些信息

在这里插入图片描述
it和Ct决定学习哪些新信息

在这里插入图片描述

Seq2Seq

编码解码模型
在这里插入图片描述

ELMo

用来预训练语言模型
相当于2个双向的LSTM
在这里插入图片描述

注意力机制:在Seq2Seq中注意到每个单词的重要程度

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/745055.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【python】Flask的基本应用

目录 一、介绍 二、与Django相比 三、基本使用 3.1入门案例: 3.2路由定义 3.3变量路由 3.4渲染模块 3.5重定向 3.6Flask返回json数据 3.7Flask模板的使用 一、介绍 Flask是一个基于Python开发并且依赖jinja2模板和Werkzeug WSGI服务的一个微型框架,对于Wer…

如何通过会员系统实现线上线下贯通

​蚓链会员系统有一个整合的营销概念,优化线上和线下会员的投入比例,让消费者在每一个购物场景都能够获得满意的消费体验,大大的提升会员的留存和行为习惯养成,同时还能实现销售额与客户结构的提升。并将线上和线下的会员数据进行…

uni-app直播开发教程

第三方平台选型:腾讯、阿里、即构、声网 由于即构直播平台支持uni-app故本文章选用的是即构sdk版讲解 一、效果 二、sdk集成 1、 首先注册即构平台账号,然后对照即构官网一步步集成 主要分为sdk插件集成与JS 封装层集成这两部分,具体步骤请…

SLAM算法知识荟萃

文章目录 SLAM自动驾驶八股四元数在表示空间旋转时的优势是什么?介绍自动驾驶系统介绍回环检测介绍词袋模型 手撕对极约束使用OpenCV找到四边形的边界介绍卡尔曼滤波推导卡尔曼增益 介绍PnPPnP求解最少需要几个点PnP的误差来源 求解线性方程 AxbSVD和QR方法哪个快介…

The 2022 ICPC Asia Xian Regional Contest(C/E/F/G/J/L)

原题链接:Dashboard - The 2022 ICPC Asia Xian Regional Contest - Codeforces 目录 J. Strange Sum F. Hotel C. Clone Ranran G. Perfect Word E. Find Maximum L. Tree J. Strange Sum 题意:思路:当我们选择in时,我们则可以…

Django_获取api接口的传参

目录 当参数为form-data 或者x-www-form-urlencoded类型时,使用request.POST获取到参数 当参数为raw类型时,使用request.body获取到参数,获取的参数需要经过处理才能使用 源码等资料获取方法 当参数为form-data 或者x-www-form-urlencoded…

UE4 关闭steamvr自启动

在我们打开项目时,如果安装过steamvr会自动启动,因为steamvr插件是默认启用的,所以把引擎目录下的steamvr插件默认启动改为false就可以了 用记事本打开SteamVR.uplugin文件 把true改成false

Redshift有哪些硬件要求?不同项目的电脑配置推荐

当谈到使用 Redshift 这样的软件时,项目类型有很多种——从简单的低多边形资产到大片的整个城市景观。很难推荐一种适合所有需求的硬件配置。 因此,我们将介绍 Redshift 的一些常见项目类型,为每个特定项目级别提供硬件建议。通过将硬件与您的…

互联网医院平台定制|互联网医疗平台开发

互联网医院系统是指通过互联网技术与医疗服务相结合的一种新型医疗模式。相比传统医院,互联网医院系统具有许多功能优势,为患者和医生提供了更便捷、高效的医疗服务。以下是互联网医院系统的一些功能优势:   在线挂号与预约:互联…

Tomcat关闭日志输出

一般在部署Tomcat后,运行久了,catalina.out文件会越来越大,对系统的稳定造成了一定的影响。可通过修改conf/logging.properties日志配置文件来屏蔽掉这部分的日志信息。那么Tomcat怎么关闭日志输出 一、 linux 系统 1、直接修改catalina.sh…

虚拟化容器化与docker

虚拟化容器化与docker 基本概念虚拟化分类虚拟化实现主机虚拟化实现容器虚拟化实现命名空间namespace空间隔离 控制组群cgroup资源隔离 LXC(Linux Container) docker与虚拟机 基本概念 物理机: 实际的服务器或者计算机。相对于虚拟机而言的对实体计算机的称呼。物理…

Linux基础(一)Linux基础命令、vi/vim编辑器

目录 虚拟机快照 Linux命令 基础格式 ls命令 cd-pwd命令 创建目录mkdir命令 文件操作命令:touch、cat、more 文件操作命令:cp、mv、rm 查找命令:which、find grep、wc和管道符 echo、tail和重定向符 vi\vim编辑器 下载VM ware works…

低粉高播放!30万粉竟打造900万播放的B站恰饭

截至2023年第一季度,B站官方发布的财报显示,平台日均活跃用户达9370万,月均活跃用户3.15亿,用户的增长离不开UP主,UP主是构建B站内容多样性不可或缺的存在。 在B站14周年庆典上,陈睿就曾表示,2…

送你一瓶好运喷雾,2023BAT大厂最新Java热门面试题及答案总结

毕业后就在腾讯的高级程序员,由于种种原因,离职出来了。趁着金三银四的求职季,互联网大厂小厂面试了一圈,感觉都不太好, 最后只 收到了京东的录用通知。 简单分析了一下:一面二面hr面都挂过, 原…

智能轮廓仪在汽车行业(零部件)的应用

在汽车领域里的空调,发动机,车内循环系统,油料供给和制动系统中,多会引入螺杆类产品,其主要用于紧固密封连接。螺杆制造工艺的好坏直接关系到其部件的性能和使用寿命,因此需要对螺杆的形状和尺寸进行质量管…

MySQL 第六天作业 备份与还原以及操作索引和视图

一、备份与还原 创建数据库、表以及插入数据 CREATE DATABASE booksDB;use booksDB;CREATE TABLE books(bk_id INT NOT NULL PRIMARY KEY,bk_title VARCHAR(50) NOT NULL,copyright YEAR NOT NULL);INSERT INTO booksVALUES (11078, Learning MySQL, 2010),(11033, Study Ht…

postgrep 9.4 断电后启动不了

journalctl -xe1、问题1:pg_ctl: another server might be running pg_ctl: another server might be running 解决方法:删除原来没有删除的pid文件 rm /opt/PostgreSQL/9.4/data/postmaster.pid 2、问题2 postgres文件丢失 - Unit postgresql-9.4.ser…

在3dMax中保存或使用Corona渲染时发生崩溃?

尝试在3ds Max中保存、打开、合并或渲染文件时,Corona渲染引擎3ds Max崩溃。 使用Corona渲染时,在“虚拟帧缓冲区(VFB)”窗口打开时,会发生更多情况。 此外,渲染时可能会显示警告消息,显示以下Corona错误: …

DataSparkle为非洲数字经济研究提供数据支撑,助力中非合作

7月1日,在第三届中非经贸博览会举办期间,中非经贸合作研究院在中非经贸合作智库研讨会上发布了《非洲数字经济发展指数与中非数字经济合作报告(2023)》(以下简称《报告》)。《报告》系统分析了非洲数字经济的发展情况,并深入解读了中非数字经济合作的现状与机遇。传音移动互联旗…

深入剖析 JavaScript 数组和字符串的各种操作技巧

🙂博主:小猫娃来啦 🙂文章核心:深入剖析 JavaScript 数组和字符串的各种操作技巧 近日总结了一下js数组和字符串相关操作方法,今天输出一篇博客,进行前端有关数组字符串相关操作方法的汇总,以后…