序列建模之循环和递归网络 - 递归神经网络篇

news2024/11/16 16:11:58

序言

在序列建模的广阔领域中,递归神经网络( Recursive Neural Network, RNN \text{Recursive Neural Network, RNN} Recursive Neural Network, RNN),注意此处的 RNN \text{RNN} RNN与常用于序列处理的循环神经网络在命名上有所重叠,但在此特指处理树状或层次结构数据的网络)以其独特的递归机制,为处理具有层次或嵌套结构的数据提供了强有力的工具。递归神经网络通过模拟数据的自然层次结构,如句子的句法树、文档的章节结构等,能够深入理解数据的内在组织和含义。与传统的序列 RNN \text{RNN} RNN不同,递归 RNN \text{RNN} RNN通过递归调用自身来处理每个子节点,从而逐步构建出整个结构的深层表示。

递归神经网络

  • 递归神经网 络 1 递归神经网络^1 递归神经网1代表循环网络的另一个扩展,它被构造为深的树状结构而不是RNN的链状结构,因此是不同类型的计算图。
    • 递归网络的典型计算图如图例1所示。
    • 递归神经网络由 Pollack (1990) \text{Pollack (1990)} Pollack (1990) 引入,而 Bottou (2011)  \text{Bottou (2011) } Bottou (2011) 描述了这类网络的潜在用途——学习推论。
    • 递归网络已成功地应用于输入是数据结构的神经网络( Frasconi et al., 1997, 1998 \text{Frasconi et al., 1997, 1998} Frasconi et al., 1997, 1998),如自然语言处理 ( Socher et al., 2011a,c, 2013a \text{Socher et al., 2011a,c, 2013a} Socher et al., 2011a,c, 2013a) 和计算机视觉( Socher et al., 2011b \text{Socher et al., 2011b} Socher et al., 2011b)。
  • 递归网络的一个明显优势是,对于具有相同长度 τ \tau τ 的序列,深度(通过非线性操作的组合数量来衡量)可以急剧地从 τ \tau τ 减小为 O ( log ⁡ τ ) \Omicron(\log\tau) O(logτ),这可能有助于解决长期依赖。
    • 一个悬而未决的问题是如何以最佳的方式构造树。
    • 一种选择是使用不依赖于数据的树结构,如平衡二叉树。
    • 在某些应用领域,外部方法可以为选择适当的树结构提供借鉴。
    • 例如,处理自然语言的句子时,用于递归网络的树结构可以被固定为句子语法分析树的结构(可以由自然语言语法分析程序提供)( Socher et al., 2011a,c \text{Socher et al., 2011a,c} Socher et al., 2011a,c)。
    • 理想的情况下,人们希望学习器自行发现和推断适合于任意给定输入的树结构,如( Bottou, 2011 \text{Bottou, 2011} Bottou, 2011)所建议。
  • 许多递归网络想法的变种是可能的。
    • 例如, Frasconi et al. (1997) \text{Frasconi et al. (1997)} Frasconi et al. (1997) Frasconi et al. (1998) \text{Frasconi et al. (1998)} Frasconi et al. (1998) 将数据与树结构相关联,并将输入和目标与树的单独节点相关联。
    • 由每个节点执行的计算无须是传统的人工神经计算(所有输入的仿射变换后跟一个单调非线性)。
    • 例如, Socher et al. (2013a) \text{Socher et al. (2013a)} Socher et al. (2013a) 提出用张量运算和双线性形式,在这之前人们已经发现当概念是由连续向量(嵌入)表示时,这种方式有利于建模概念之间的联系 ( Weston et al., 2010; Bordes et al., 2012 \text{Weston et al., 2010; Bordes et al., 2012} Weston et al., 2010; Bordes et al., 2012)。

注1:我们建议不要将 ‘‘递归神经网络’’ 缩写为 “RNN’’,以免与 “循环神经网络’’ 混淆。


  • 图例1:递归网络将循环网络的链状计算图推广到树状计算图。
    • 递归网络将循环网络的链状计算图推广到树状计算图。
      在这里插入图片描述

    • 说明:

      • 可变大小的序列 x ( 1 ) , x ( 2 ) , … , x ( t ) \boldsymbol{x}^{(1)},\boldsymbol{x}^{(2),\dots,\boldsymbol{x}^{(t)}} x(1),x(2),,x(t)可以通过固定的参数集合(权重矩阵 U , V , W \boldsymbol{U},\boldsymbol{V},\boldsymbol{W} U,V,W)映射到固定大小的表示(输出 ο \boldsymbol{\omicron} ο)。
      • 该图展示了监督学习的情况,其中提供了一些与整个序列相关的目标 y \boldsymbol{y} y

总结

  • 递归神经网络作为处理层次和嵌套结构数据的利器,在序列建模中占据了重要地位。
  • 其递归机制使得网络能够按照数据的自然结构进行建模,从而捕捉到更为丰富的语义和上下文信息。这种特性使得递归 RNN \text{RNN} RNN在自然语言处理、文本分类、情感分析等多个领域展现出了独特的优势。
  • 随着深度学习技术的不断发展,递归 RNN \text{RNN} RNN的性能和应用范围还将不断拓展,为更多复杂序列建模任务提供新的解决方案。

往期相关内容回顾

序列建模之循环和递归网络 - 循环神经网络篇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2049732.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【生成式人工智能-十五-经典的影像生成方法-GAN】

经典的影像生成方法-GAN GANDiscriminatorGenerator还需要加入额外信息么 GAN可以加在其他模型上面我们可以用影像生成模型做什么? 前面讲过VAE和Flow-based以及diffusion Model ,今天讲最后一种经典的生成方法GAN。 GAN 前面讲的几种模型都是用加入额外…

红黑树剖析(插入部分)

文章目录 红黑树插入节点情景分析情景1:红黑树为空树情景2:插入节点的Key已存在情景3:插入节点的父节点为黑色节点情景4:插入节点的父节点为红色情景4.1 叔叔节点存在并且为红色节点情景4.2 叔叔节点存在而且是黑色节点情景4.3 叔…

xss 一些例子

目录 XSS 1.Ma Spaghet!​编辑 2.Jefff​编辑 3.Ugandan Knuckles​编辑 4.Ricardo Milos​编辑 5.Ah Thats Hawt​编辑 6.Ligma​编辑 7.Mafia​编辑 简单解法就是换一个函数 作者得原意解法 8.Ok, Boomer​编辑 XSS 1.Ma Spaghet! 这里接收了一个somebody参数&…

Chain of Thought (CoT) 系列论文:大模型思维链,提升 LLM 的推理能力

文章目录 1. COT:Chain of Thought1. 研究背景2. CoT的原理3. CoT Prompt 1. COT:Chain of Thought COT 是 2022.01 由 google 提出的针对提升 LLM 的推理能力的 Prompt Engineering 方法。 paper: Chain-of-Thought Prompting Elicits Re…

一器多能,数据文件处理的瑞士军刀 — dasel

Dasel:简化数据操作,提升开发效率。- 精选真开源,释放新价值。 概览 dasel是一款专为开发者设计的高效数据文件操作工具,它允许用户通过统一的接口对JSON、TOML、YAML、XML和CSV等格式的文件进行数据选择、插入和删除操作。这款工…

Kafka基本概念及消费流程

Kafka是消息中间件的一种,相较于其他消息中间件,其以极高的吞吐量闻名,常用于构建实时数据管道和流应用,能够处理高吞吐量的数据流。以下是Kafka中的重要概念: 1. 生产者 生产者是向Kafka主题发送消息的客户端。生产…

登录 k8s-Dashboard 显示 Your connection is not private

文章目录 一、背景二、解决方案 一、背景 部署好 kubernetes-Dashboard 后使用 master节点的 ipport 登录 Dashboard 显示 Your connection is not private 无论是 Edge 还是 Google Chrome 都是这样的情况 二、解决方案 点击网页空白处,英文输入法输入&#xf…

论文解读:LONGWRITER: UNLEASHING 10,000+ WORD GENERATION FROM LONG CONTEXT LLMS

摘要 现象:当前的大预言模型可以接受超过100,000个tokens的输入,但是却难以生成超过2000个token的输出。 原因:监督微调过程(SFT)中看到的样本没有足够长的样本。 解决方法: Agent Write,可以将长任务分解为子任务&a…

为什么MCU I2C波形中会出现的脉冲毛刺?

在I2C的波形中,经常会发现有这样的脉冲毛刺,会被认为是干扰或者器件不正常。 看到这个波形时,可以先数一下出现在第几个clock的位置,如果出现在第9个clock的低电平期间,就不是干扰或者器件异常导致。 在I2C的协议中&a…

Java并发类的主要API方法-CountDownLatch和CyclicBarrier

1.概念介绍 CountDownLatch 是一个计数器,计数器的初始值由创建它时指定。每次调用 countDown() 方法时,计数器会减1,直到计数器值变为0时,所有调用 await() 的线程都会被唤醒继续执行。 CyclicBarrier 是 Java 中另一个常用的同…

基于CDIO概念的人工智能物联网系统开发与实施的人才培养研究

目录 1. 引言(Introduction) 2. AIoT技术及其培训特点(The Characteristics of AIOT and Its Training) 3. 基于CDIO概念的AIoT课程改革(CDIO Concept-based Reform of AIOT Course) 4. AIoT课程内容安…

SweetAlert2

1. SweetAlert2 SweetAlert2是一个基于JavaScript的库, 用于在网页上替换标准的警告框(alert), 确认框(confirm)和提示框(prompt), 并提供更加美观和用户友好的界面.需要在项目中引入SweetAlert2, 可以通过CDN链接或者将库文件下载到你的项目中来实现这一点. 通过CDN引入:<…

C++:stack类(vector和list优缺点、deque)

目录 前言 数据结构 deque vector和list的优缺点 push pop top size empty 完整代码 前言 stack类就是数据结构中的栈 C数据结构&#xff1a;栈-CSDN博客 stack类所拥有的函数相比与string、vector和list类都少很多&#xff0c;这是因为栈这个数据结构是后进先出的…

SPRING09_ Bean后置处理器创建过程、SmartInstantiationAwareBeanPostProcessor预测方法调用

文章目录 ①. Bean后置处理器创建过程②. SmartInstantiationAwareBeanPostProcessor预测方法调用 ①. Bean后置处理器创建过程 ①. 坏境准备,在BeanPostProcessor的无参构造器、postProcessBeforeInitialization以及postProcessAfterInitialization打上断点.以xml的方式启动容…

秋招突击——8/15——新作{最大子数组和、合并区间、转轮数组、除自身以外的数组的乘积}

文章目录 引言新作最大子数组和个人实现参考实现 合并区间个人实现短板补充——自定义排序标准 参考实现 转轮数组最终实现 除自身以外数组的乘积个人实现 总结 引言 以前刷题的方式方法有问题&#xff0c;花太多时间了&#xff0c;应该先过一遍&#xff0c;然后再针对特定的题…

第一百九十四节 Java集合教程 - Java优先级队列

Java集合教程 - Java优先级队列 优先级队列是其中每个元素具有相关联的优先级的队列。具有最高优先级的元素将从队列中删除。 PriorityQueue 是一个实现类对于Java Collection Framework中的无界优先级队列。 我们可以使用在每个元素中实现的 Comparable 接口作为其优先事项。…

C# OnnxRuntime YoloV5 Demo

目录 效果 模型信息 项目 代码 Form1.cs YoloV5.cs 下载 效果 模型信息 Model Properties ------------------------- --------------------------------------------------------------- Inputs ------------------------- name&#xff1a;images tensor&#xff1a…

机器学习/人工智能中的学习证明

一、说明 在进行任何数学发展之前&#xff0c;我们必须首先了解学习的基础以及它如何与错误的概念密切相关。关于代价函数&#xff0c;它的工作原理是梯度下降原理。本文将回顾梯度下降原理。 二、假想的厨师 想象一下&#xff0c;在任何一天&#xff0c;你决定复制你在一家著名…

8.13 Day19 Windows服务器(Windows service 2008 R2)上域的搭建 (1)

域服务器&#xff08;DC&#xff09;&#xff1a;安装了活动目录服务的服务器就称为DC。 将三台设备配置在同一网络中&#xff0c;此处将外部网络隔离开&#xff0c;只将他们放在局域网中 服务端网络配置&#xff0c;此时与外部网络彻底隔绝开&#xff0c;且已无法和主机通信&…

XSS game复现(DOM型)

目录 1.Ma Spaghet! 2.Jefff 3.Ugandan Knuckles 4.Ricardo Milos 5.Ah Thats Hawt 6.Ligma 7.Mafia 8.Ok, Boomer 1.Ma Spaghet! 通过简单的尝试发现传递参数可以直接进入h2标签 接下来我们尝试传入一个alert(1) 可以看到并没有触发。原因是在innerHTML中官方禁用了sc…