神经网络复习--循环神经网络

news2024/11/24 14:05:27

文章目录

  • RNN
  • LSTM神经网络
  • GAN神经网络

RNN

有些任务人工神经网络,CNN解决不了,自然语言处理中,输入和输出之间不独立,而传统神经网络中,输入和输出都是相互独立的,因此需要一种神经网络让输出和之前的输入是相关的

在这里插入图片描述

RNN是一类拓展的人工神经网络,它是为了对序列数据进行建模而产生的。
针对现象:序列数据。例如文本,是字母和词汇的序列;语音,是音节的序列;视频,是图像的序列;气象观测数据,股票交易数据等等

核心思想:样本间存在顺序关系,每个样本和它之前的样本存在关联。通过神经网络在时序上的展开,我们能够找到样本之间的序列相关性

在这里插入图片描述

5分钟搞懂RNN,3D动画

S t = f ( W i n X + W s S t − 1 + b ) S_t = f(W_{in}X + W_s S_{t-1} + b) St=f(WinX+WsSt1+b)

RNN本质与BP很像,就是加上了时序演化。定义权重U, V, W.
s t = t a n h ( U x t + W s t − 1 ) y t = s o f t m a x ( V s t ) s_t = tanh(Ux_t + Ws_{t - 1}) \\y_t = softmax(Vs_t) st=tanh(Uxt+Wst1)yt=softmax(Vst)
损失函数交叉熵损失函数

缺点:虽然解决了信息依赖的问题,但是他会丧失很久以前的信息

LSTM神经网络

增加了长短期记忆功能
LSTM是一种循环神经网络(RNN)的变体,它在处理长序列数据时比标准RNN更有效。LSTM的全称为长短时记忆网络,它的设计目的是为了解决标准RNN中梯度消失问题,同时允许网络记住长期依赖关系。

LSTM的核心思想是引入了一种称为“门”的机制,这些门可以控制信息的流动。LSTM包含三个门:输入门、遗忘门和输出门。这些门可以根据输入数据和先前的状态来控制信息的流动,从而有效地处理长序列数据。
在这里插入图片描述
遗忘门控制着旧信息的流出。它包含一个sigmoid激活函数和一个点乘运算。sigmoid决定哪些信息需要保留,哪些信息需要丢弃。点乘运算可以将旧的状态与sigmoid函数输出相乘,从而产生一个新的向量,表示需要保留的旧信息
f t = s i g m o i d ( W f [ h t − 1 , x t ] + b f ) c t − 1 ′ = c t − 1 ⊙ f t ⊙ 表示两个向量按位相乘 f_t = sigmoid(W_f[h_{t-1}, x_t] + b_f) \\c'_{t-1} = c_{t - 1}\odot f_t \\ \odot 表示两个向量按位相乘 ft=sigmoid(Wf[ht1,xt]+bf)ct1=ct1ft表示两个向量按位相乘
在这里插入图片描述
输入门控制新信息的流入。
i t = s i g m o i d ( W i [ h t − 1 , X t ] + b i C t = t a n h ( W c [ h t − 1 , X t ] + b c ) i_t = sigmoid(W_i[h_{t-1}, X_t] + b_i \\ C_t = tanh(W_c[h_{t - 1}, X_t] + b_c) it=sigmoid(Wi[ht1,Xt]+biCt=tanh(Wc[ht1Xt]+bc)
在这里插入图片描述
输出门控制中新的状态的输出。

相比于RNN只有一个传输状态,LSTM有两个传输状态,一个cell state, 和一个hidden state

在这里插入图片描述

GAN神经网络

由两个同时训练的模型组成:一个训练模型(Generator)以伪造数据,另一个训练模型(Discriminator)从真实示例中识别假数据

在这里插入图片描述
在这里插入图片描述
GAN的训练过程如下:

  • 训练鉴别器
    1. 从训练集中随机抽取真实样本x
    2. 获取一个新的随机噪声向量,并使用生成器生成一个伪造实例 x f x_f xf
    3. 使用鉴别器x和 x f x_f xf进行分类
    4. 计算分类误差并方向传播总误差,以更新鉴别器的可训练参数,将分类误差降至最低
  • 训练生成器
    1. 获得一个新的随机噪声向量z,并使用生成器生成一个伪造示例 x f x_f xf
    2. 使用鉴别器对 x f x_f xf进行分类
    3. 计算分类误差并反向传播该误差,以更新生成器的可训练参数,使鉴别器误差最大化
  • 结束
    平衡状态:
    1. 生成器生成的伪造示例与训练数据集中的真实示例没有区别
    2. 鉴别器只能依靠随机猜测来确定一个特定示例是真实还是伪造的(以1:1的比例猜测一个示例是真实的)

在这里插入图片描述

生成器的损失函数正好相反:
J G = E x _ p d a t a [ log ⁡ D ( x ) ] + E z _ p z ( z ) [ l o g ( 1 − D ( G ( z ) ) ) ] J^{G} = E_{x \_ pdata}[\log{D(x)}] + E_{z\_pz(z)}[log(1 - D(G(z)))] JG=Ex_pdata[logD(x)]+Ez_pz(z)[log(1D(G(z)))]

因此总的目标函数为:
min ⁡ G − max ⁡ D { E x _ p d a t a [ log ⁡ D ( x ) ] + E z _ p z [ log ⁡ 1 − D [ G ( z ) ] ] } \min \limits_G - \max \limits_D \{ E_{x\_p_{data} [\log{D(x)}] + E_{z \_ p_z} [\log{1 - D[G(z)]}] }\} GminDmax{Ex_pdata[logD(x)]+Ez_pz[log1D[G(z)]]}
生成器最小,鉴别器最大

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1679040.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Go微服务: 接入Prometheus性能监控平台与Grafana平台

接入Prometheus 在 go-micro 生成的模板中, 我们一如既往的完成基础工作之后 进入main.go工作的代码编写,main.go package mainimport ("fmt""log""strconv""github.com/go-micro/plugins/v4/registry/consul"opentracing…

[更改挂载点]重新挂载硬盘

显示磁盘空间使用情况 df -hdf -h 命令的输出显示了文件系统的磁盘空间使用情况。 这里 /dev/nvme0n1p1 设备(大小为 880GB)已经被挂载到 /media/nvidia/SSD 目录下,并且使用了 304GB,剩余 532GB,使用率为 37%。这意…

Django视图Views

Views视图 HttpRequest 和HttpResponse Django中的视图主要用来接受web请求,并做出响应。视图的本质就是一个Python中的函数视图的响应分为两大类 1)以Json数据形式返回(JsonResponse) 2)以网页的形式返回 2.1)重定向到另一个网页 (HttpRe…

JAVA云his医院管理系统源码 SaaS模式+融合B/S版电子病历 基于云计算技术开发的云his医院管理系统

JAVA云his医院管理系统源码 SaaS模式融合B/S版电子病历 基于云计算技术开发的云his医院管理系统 定义 美国著名教授Morris.Collen于1988年曾著文为医院信息系统下了如下定义:利用电子计算机和通讯设备,为医院所属各部门提供病人诊疗信息和行政管理信息…

OFDM 802.11a的FPGA实现(十六)长训练序列:LTS(含Matlab和verilog代码)

目录 1.前言2.原理3.Matlab生成长训练序列4.硬件实现5.ModelSim仿真6.和Matlab仿真结果对比 原文链接(相关文章合集): OFDM 802.11a的xilinx FPGA实现 1.前言 在之前已经完成了data域数据的处理,在构建整个802.11a OFDM数据帧的时…

QT基础 获取颜色

比如我们要获取图片上某个点的颜色,要怎么处理呢? 1.获取鼠标坐标 2.截图并将坐标代入途中获取RGB(这里要考虑坐标不在范围) 假如是通过mousePressEvent获取到鼠标坐标 void mousePressEvent(QMouseEvent* e) {QPoint orgPoint…

vue2 配置运行环境

vue2 配置运行环境 在 vue2 项目中配置运行环境 在项目中新建 .env.development 文件 和 .env.production 文件 .env.development NODE_ENV development //指定当前环境模式 VUE_APP_MODE development VUE_APP_BASE_URL "/dev-api".env.production NODE_ENV &q…

粒子系统技术在AI去衣应用中的创新探索

引言: 随着计算机视觉和人工智能技术的飞速发展,AI去衣技术逐渐走进公众视野。这一技术以其独特的应用前景和技术挑战引起了广泛的关注。在实现衣物去除的同时保持图像质量的关键技术之一,便是粒子系统技术。本文将深入探讨粒子系统技术在AI去…

文件系统,磁盘的物理存储结构和逻辑存储结构

问题导入 在计算机中不是所有的文件都是被打开的,只有我们要用的文件的被打开,大部分文件(当前不需要访问的文件),都在磁盘中保存着。问题是没有被打开的文件是否需要管理? 这就好比我有十套衣服&#xff…

LBSS138LT1G 丝印J1 SOT-23 N沟道 50V/200mA 贴片MOSFET

LBSS138LT1G的应用领域广泛,主要因为它是一种N沟道金属氧化物半导体场效应晶体管(MOSFET),具有低电荷、快速开关速度和高阻断特性。以下是一些典型的应用领域: 1. 消费电子产品:LBSS138LT1G常用于电视、音响…

【UE5.1 角色练习】01-使用小白人蓝图控制商城角色移动

目录 效果 步骤 一、导入资源 二、控制角色移动 三、更换角色移动动作 效果 步骤 一、导入资源 新建一个工程,然后在虚幻商城中将角色动画的相关资源加入工程,这里使用的是“动画初学者内容包”和“MCO Mocap Basics” 将我们要控制的角色添加进…

洗地机怎么挑?洗地机选购指南,2024洗地机测评选购攻略

在快节奏的生活中,繁琐的清洁工作往往令人头疼,随着洗地机的诞生,极大地简化了清洁的过程,洗地机凭借着它吸拖洗为一体的高效清洁特点,受到家庭和商业场所的广泛欢迎。那么,洗地机怎么挑,要注意…

什么是Zoho CRM客户关系系统管理?

以客户为中心的商业时代,卓越的客户体验已成为企业持续增长与成功的关键,为了在这场激烈的市场竞争中脱颖而出,企业需要一套强大、灵活且智能的客户关系管理系统——Zoho CRM应运而生,它不仅是管理客户信息的工具箱,更是驱动业务增…

数据结构篇3—《龙门客“栈”》

文章目录 🚩前言1、栈的概念2、栈的实现框架3、栈的代码实现3.1、栈的初始化和销毁3.2、入栈\出栈\返回栈顶元素\元素个数\判空3.3、栈定义注意事项 4、栈的应用实例——《括号匹配问题》 🚩前言 前面记录了关于顺序表和链表的数据结构,这一篇…

2.1.2 C++程序设计——程序基本概念

文章目录 展示大纲1、程序基本概念2、基本数据类型3、程序基本语句4、基本运算5、数学库常用函数6、结构化程序设计展示大纲 1、程序基本概念

数据结构初阶 顺序表的补充

一. 题目的要求 写出三种链表的接口函数 它们的功能分别是 1 查找数的位置 2 在pos位置插入值 3 在pos位置删除值 二. 实现pos 这个其实很简单 找到一步步遍历 找到这个数字就返回 找不到就提示用户下 这个数字不存在 int SLFind(SL* ps,SLDateType x) {assert(ps);int…

C# WinForm —— 21 RichTextBox 使用

1. 加载文件到控件中 加载文件时,要设置文件的路径和类型RichTextBoxStreamType,文件类型包含: RichText 0:富文本格式(RTF)流PlainText 1:纯文本流对象链接和嵌入(OLE&#xff…

根据参考风格进行矢量图绘制

摘要 利用机器学习根据给定的文本描述生成图像的技术已经取得了显著的进步,例如CLIP图像-文本编码器模型的发布;然而,当前的方法缺乏对生成图像风格的艺术控制。我们提出了一种方法,用于为给定的文本描述生成指定风格的绘图&…

DIYGW UniApp可视化工具:低代码时代的前端开发新体验

摘要: 随着技术的不断发展,前端开发领域也迎来了低代码时代的浪潮。本文介绍了DIYGW UniApp可视化工具,这款工具以其傻瓜式、拖拽式、模块化的特性,为前端开发者提供了一个全新的开发体验。通过DIYGW UniApp,用户无需深…