【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记

news2024/9/30 15:32:04

Recurrent Neural Network(RNN)

Example Application

Slot Filling
智慧订票系统:
在这里插入图片描述
在这里插入图片描述
How to represent each word as a vector?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
但是光这样,feedforward Network是无法solve这一问题的,因为他无法区别是leave Taipei还是arrive Taipei。
那我们就希望这个neuron network是有记忆的,即看到过arrive/leave这个词。
在这里插入图片描述
这种有记忆的network就叫做 recurrent neural network(rnn)
在这里插入图片描述

举例:

我们假设所有的w=1,没有bias;所有的激活函数都是线性的;
要给memory(每一个时间点都会被洗掉)一个初始值,我们假设给0
在这里插入图片描述
在这里插入图片描述
接下来2被存到memory中
在这里插入图片描述
在这里插入图片描述
rnn会考虑input sequence的order
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

of course it can be deep…

在这里插入图片描述

Elman Network & Jordan Network

在这里插入图片描述

Bidirectional RNN

同时train 一个正向的rnn和逆向的rnn
在这里插入图片描述
在这里插入图片描述

Long Short-term Memory(LSTM)

Input/Output/Forget Gate何时打开/关闭 是需要网络自己学的
LSTM有三个操控信号,一个输入信号
在这里插入图片描述
“-”为什么放在short-term之间,而不是long short之间?
因为他只是比较长的short term。是否遗忘取决于forget gate,关闭时代表遗忘
在这里插入图片描述
假设在四个z输入之前,cell中存了一个“c”
在这里插入图片描述
在这里插入图片描述
如果选择不遗忘c(由f(zf)决定),则需要再加起来即c‘
在这里插入图片描述
在这里插入图片描述

LSTM-Example

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
original network
在这里插入图片描述
LSTM 直接将neurons替换成LSTM的cell即可
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
GRU是LSTM的simple版本,他只有两个gate,参数较少,所以比较不容易overfitting。simpleRNN指最原始的RNN,下图是目前标准的RNN。
在这里插入图片描述

Learning Target

在这里插入图片描述
RNN 用 Gradient Descent是可以train的
Backpropagation through time(BPTT) 基于时间的反向传播算法。
在这里插入图片描述
在这里插入图片描述
Why?
在这里插入图片描述
在这里插入图片描述
如何解决?
Clipping.
裁剪,当梯度过大时候进行裁剪。
在这里插入图片描述
为什么rnn会有这种奇特的特性呢?
sigmoid function? no
在这里插入图片描述
在这里插入图片描述
有什么样的技巧可以帮助我们解决这个问题呢?
在这里插入图片描述
可以让你的error surface不要那么崎岖, 在做LSTM时,你可以放心的把learning rate设置的特别小。

为什么我们要把RNN换成LSTM? LSTM可以handle gradient vanishing的问题。

为什么可以handle gradient vanishing的问题?
一旦你的weight,可以对memory的值发生影响时,这个影响会一直存在,除非forget gate关闭。不像rnn,其在每一个时间的会被forget掉。
在这里插入图片描述
在这里插入图片描述

Application

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如何解决?
CTC
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
句法解析
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Attention-based Model

可以想成RNN的进阶版本
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Deep&Structured

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/55031.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

stable diffusion webui安装部署教程

系统环境: 腾讯云服务器,centos 7.6 基础环境安装 git 安装(直接安装高版本的) (默认安装的是1.8 版本的。没有 -c 命令,需要升级) 参考: https://blog.csdn.net/qq_28903377/article/detai…

[附源码]Python计算机毕业设计SSM康健医药公司进销存管理系统(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

[附源码]Python计算机毕业设计SSM酒店入住管理系统(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

计算机视觉专家:如何从C++转Python

有人说用 Python 编程很简单,6 岁小孩都能学会。计算机视觉专家和编程语言爱好者 asya f 刚开始上手 Python 时也这么想。但门槛低就仅意味着使用简单吗?经常调用 API 的人是不是一定比可以从零写出源码的人菜?在本文中,asya f 告…

数据生产流程——采集、清洗、分析

大家好,这里是小安说网控。 前几篇文章,我们分享了线上价格监测的重要性以及注意事项。数据监测是如何将平台上海量的数据转换为有价值的营销情报的呢?今天,我们来一个数据生产流程大揭秘! 一、 数据采集 数据采集就是…

2022腾讯数字生态大会:腾讯云HiFlow,零代码自动化工作流助手

2022腾讯数字生态大会,在主题为“数字化叠变、全域新协作”的腾讯云SaaS连接专场上,多款产品重磅发布。 未来企业数字化转型的越来越多的使用saas是一个趋势,那么如何解决SaaS之间的互联互通和数据孤岛?腾讯云HiFlow的业务负责人…

嵌入式通用const和volatile和static inline关键字 (volatile寄存器地址修饰必不可少)

const和volatile之间的合作【1】const修饰变量【2】const修饰数组【3】const修饰指针【4】const修饰函数【5】volatile的应用【6】volatile详解【7】const和volatile配合【8】AHB (高级高性能总线)【9】APB (高级外围总线)在学习ADC之前掌握这些 #define __IO volatile …

iPayLinks艾贝盈上线委托换汇功能!

“8.11”汇改以来,人民币汇率市场化形成机制逐步完善,人民币汇率弹性不断增强,双向波动成为常态。 在市场化的汇率形成机制下,外贸人想要快、准、稳地选到合适汇率,降低汇损提高利润,仅靠自己难以实现。 …

模拟电路设计(36)---谐振型变换器

谐振型变换器 今天来介绍下谐振型变换器。脉宽调制型通过控制开关管的导通占空比来调节输出电源功率,而谐振型变换器以正弦形式处理功率开关管,使得开关管在零电流或者在零电压的情况下实现导通和关闭,从而降低开关功耗,提高变换…

这才是数字孪生污水处理厂该有的样子 | 智慧水务

近年来,智慧水务、数字水务成为水务行业的热点领域。对于污水处理领域,如何贯彻落实双碳战略,积极推进智慧水厂建设,显得尤为关键。 图扑软件依托自主研发的 HT for Web 产品,并结合视频融合、BIM、5G、物联网、云计算…

springMVC02,restful风格,请求转发和重定向

springMVC02,restful风格,请求转发和重定向restful风格restful简介restful 例子测试请求转发和重定向restful风格 restful简介 概念: Restful就是一个资源定位及资源操作的风格。不是标准也不是协议,只是一种风格。基于这个风格设计的软件可以更简洁,…

第10章Swagger自定义实现index.html页

1 初始化index.html页 复制原程序“index.html”页的内容到当前程序员“index.html”页。 注意:是内容复制,如果是页面替换复制,则必须重新把“index.html”页的属性中的“生成操作”设定为:“嵌入的资源”。 2 自定义SwaggerSet…

【数据结构】堆和优先级队列

目录 一、堆 1.1堆的特点 1.2如何构造一个最大堆 (1)最大堆的构造以及常用方法的实现 (2)添加操作 (3)删除操作 (3)将任意数组调整为堆 二、TopK问题 2.1使用优先级队列 &am…

jenkins 参数化构建发布到kubernetes集群不同的命名空间下

最终效果 在构建前可以选择参数,要拉取的Git分支、什么命名空间下、什么服务。 自由风格项目使用的jenkins agent镜像,请参考这个文章: 【DevOps】(2022.11更新)基于jenkins/jnlp-slave:4.13.3-1-jdk11镜像,加入kubectl、mvn命令_阳光很暖吧的博客-CSDN博客 1、自由风格项…

广告和电商应该怎么串联起来呢?我们可以从各大巨头的动作中发掘

电商广告是广告产业与电子商务模式联姻的时代产物,是把广告、传媒、营销推广产业链的各种产品和服务搬到网上,利用网络便捷的实现广告资源信息流通、在线交易和客户关系管理的一种商业模式,是广告业营销模式和渠道的创新。 电商平台从无到有…

一篇文章彻底理解自定义View

目录 一.View的基础 1.view的基础概念 2.view的位置和事件event几种表示法 3.view的滑动 ①.ScrollTo、ScrollBy: ②.布局位置(layout,offsetLeftAndRight,offsetTopAndBottom) ③.布局参数(LayoutParams) 4.view的弹性滑动 ①.ScrollercomputeScrollscrollTo ②.动画…

如何基于YAML设计接口自动化测试框架?看完秒会

在设计自动化测试框架的时候,我们会经常将测试数据保存在外部的文件(如Excel、YAML、CSV)或者数据库中,实现脚本与数据解耦,方便后期维护。目前非常多的自动化测试框架采用通过Excel或者YAML文件直接编写测试用例&…

部署高校房屋管理系统可以实现哪些目标?

数图互通房产管理 随着技术的不断进步和升级,以及高校房屋建筑物数量的不断扩充,建立房屋资产管理信息系统进行信息化、数字化、图形化房屋资产管理已经是势在必行。数图互通自主研发的FMCenterV5.0平台,是针对中国高校房产的管理特点和管…

工业数据与数据采集应用如何在ARM+FPGA异核架构的米尔MYC-JX8MMA7核心板应用

随着通信与网络技术、互联网的发展,工业管理数据化、网络化、智能化已成大势所趋,利用工业物联网完成工业控制是智慧工厂中必不可少的一部分。传统的控制与数据采集系统,主机一旦需要同时与多个数据采集设备保持高速通信,并要承担…

Golang【Web 入门】 07 路由 - http.ServeMux

阅读目录说明ServeMux 和 Handler重构:区分不同的 Handler查看 http.HandleFunc 源码重构:使用自定义的 ServeMuxhttp.ServeMux 的局限性URI 路径参数请求方法过滤不支持路由命名http.ServeMux 的优缺点标准库里的就是最好的?说明 goblog 需…