基于Tree-LSTM网络语义表示模型

news2025/1/21 18:52:34

TC;DR

目前的LSTM仅能对序列信息进行建模, 但是自然语言中通常由词组成的短语形成了句法依存的语义树。为了学习到树结构的语义信息。论文中提出了两种Tree-LSTM模型Child-Sum、Tree-LSTM、和N-ary Tree LSTMs。实验部分的Tree-LSTM、对比多种LSTMs的变体,在语义相似性计算和情感分类任务超过有bselilnes

Model

LSTM

首先简单介绍下 LSTM提供的后续论文改进对比,主要模型结构如下所示:
在这里插入图片描述
每个门电路的计算方式如下:
f t = σ ( W f x t + U f h t − 1 + b f ) f_t = \sigma(W^{f}x_t + U^{f}h_{t - 1} + b^{f}) ft=σ(Wfxt+Ufht1+bf)
i t = σ ( W i x t + U i h t − 1 + b i ) i_t = \sigma(W^{i}x_t + U^{i}h_{t -1} + b^{i}) it=σ(Wixt+Uiht1+bi)
c t = i t ⊙ u t + f t ⊙ c t − 1 c_t =i_t \odot u_t + f_t \odot c_{t-1} ct=itut+ftct1
0 t = σ ( W 0 x t + U 0 h t − 1 + b 0 ) 0_t = \sigma(W^{0}x_{t} + U^{0} h_{t - 1} + b^{0}) 0t=σ(W0xt+U0ht1+b0)
h t = o t ⊙ t a n h ( c t ) h_t = o_t\odot tanh(c_t) ht=ottanh(ct)

总结

通过不断的门控单元和门控细胞,复杂的计算并一层一层的传递,。
此部分不再阐述,详细可以参考另一篇文章全部都将其搞定都行啦的样子与打算。
LSTM能够处理序列信息,但是无法处理带有树结构的数据,例如,下图所示的依存句法分析树。成分句法分析树等。
带 有 树 结 构 的 信 息 带有树结构的信息

在这里插入图片描述
在这里插入图片描述
以上仅表示两种自然语言分析中的两种语义表示格式,但是模型可以类推到其他树结构数据

Tree-LSTM

为了将树结构的数据作为输入训练RNN,论文提出了两种结构:
T r e e − S t r u c t u r e d L S T M Tree-Structured LSTM TreeStructuredLSTM

  • Child-SUM Tree-LSTMS(Dependency Tree-LSTMs)
  • 适用于子节点个数不定或子节点乱序的树结构
  • N-ary Tree-LSTM(Constituency Tree-LSTMs)
  • 适用于每个单元子单元的个数最多是N,且子单元之间是有序的
    在这里插入图片描述
    与标准的LSTM结构类似,Tree-LSTM中的每个cell ,都包括类似的输入门 i t i_t it,输出门 o t o_t ot,cell state c t c_t ct和隐藏输出 h t h_t ht.

不同的是Tree-LSTM单元中门向量和细胞状态更新依赖于所有与子相关的子单元的状态。另外, 相比较于标准的LSTM的单个遗忘门,Tree-LSTM拥有多个遗忘门 f j k f_{jk} fjk,分别对应当前单元的每个子单元 k k k,因此,Tree-LSTM可以选择地从子节点中获取信息,例如再情感分类中,去保**存语义信息更加丰富的子节点信息

**。
与标准的LSTM不同,每个Tree-LSTM单元会有一个输入向量 x J x_J xJ

x j x_j xj可以表示一个句子中单词的向量表示,每个节点的input word取决于网络的树结构,例如要处理的Dependency tree 的Tree-LSTM,那么Tree-LSTM树中的每个节点,将[head word],对应的向量当做输入,而在[constituency tree]中,将对应的词向量当做输入。
考虑到目前需要处理的数据类似于 Dependency Tree.因此,本文中仅介绍下**: Child-Sum Tree-LSTMs**。

Child-Sum Tree-LSTMs

给定树且另 C ( j ) C(j) C(j)表示节点 j j j的子节点集合。那么Child-SUM Tree-LSTMs的计算公式如下:
在这里插入图片描述
从上述计算公式即可:Tree-LSTM与LSTM间的区别包含两点:

  • LSTM只用到了上一步神经元的隐藏输出 h t − 1 h_{t - 1} ht1,而Tree-LSTM用了所有子节点的隐藏输出 h j ~ = ∑ k ∈ C j h k \widetilde{h_j} = \sum_{k \in C_{j}}h_k hj =kCjhk
  • Tree-LSTM使用多个遗忘门 f j k f_{jk} fjk来控制多个子节点:cell state candidate c k c_k ck

由于Child_Tree Tree-LSTMs将其子节点的状态 h k h_k hk进行累加,因此适合(多分枝、子节点无序的树。)例如:dependency tree, 一个 head 的 dependent 数量是高度可变的,因此我们将应用在dependency tree上的 Child-Sum Tree-LSTM称为 Dependency Tree-LSTM

介绍完Child-Sum Tree-LSTMS后即可将其应用于下游任务,论文中用于情感分类和语义相似性的计算任务中。

实验

即不同实验中模型参数如下所示:
在这里插入图片描述
情感分类任务:
在这里插入图片描述
语义相似性计算任务中:
在这里插入图片描述

总结

慢慢的将各种树结构,啥的全部都将其搞定,会自己学习各种树结构。
慢慢的整理即可,全部将其搞定都行啦的样子于打算。
还有都是慢慢的将自己的树结构啥的全部都将其搞定。学习各种树模型。慢慢的全部将其掌握都行啦的回事与打算。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/47423.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

09【MyBatis多表关联查询】

文章目录三、MyBatis多表关联查询3.1 表的关系3.2 一对一查询3.2.1 搭建环境3.2.2 需求分析3.2.3 dao接口3.2.3 mapper.xml3.2.4 测试3.2.5 配置MyBatis一对一关系1)传统映射:2)使用association标签映射3.3 一对多查询3.3.1 需求分析3.3.2 da…

Codeforces Round #799 (Div. 4) H. Gambling

翻译: 玛丽安在赌场。赌场里的游戏是这样的。 在每一轮之前,玩家在1到109之间选择一个数字。在那之后,一个有109个面的骰子被滚动,这样就会出现1到109之间的随机数。如果玩家猜对了数字,他们的钱就会翻倍&#xff0c…

C++原子操作和互斥锁性能(速度)对比

先说结论:原子操作性能(速度)强于互斥锁,下面用例子进行说明。 编写测试demo,开启两个线程,对全局变量n分别进行自增、自减操作,计算执行时间。 首先看没有用任何手段进行互斥的情况&#xff0c…

Springboot生成Word/EXECL/PPTX文档

目录 一、概述 二、使用介绍 第一种Poi-tl: 1、介绍 2、功能 第二种Poi: 什么是POI 二进制分布 源码分发 一、概述 Word模板引擎:使用Word模板和数据生成对应的Word文档。 方案移植性功能性易用性 Poi-tl Java跨平台 Word模板引擎&#…

【uniapp小程序】路由跳转navigator传参封装

文章目录🍍前言🍋正文1、看官网1.1 navigator API 介绍1.2、路由跳转参数传递1.3、五种常见的跳转方式1.3.1 uni.navigateTo(OBJECT)1.3.2 uni.redirectTo(OBJECT)1.3.3 uni.reLaunch(OBJECT)1.3.4 uni.switchTab(OBJECT)1.3.5 uni.navigateBack(OBJECT)…

Ensp用windows回环口连接cloud配置

Ensp模拟通过本机(windows)用python脚本批量配置华为数通设备时,为了避免对内网资源的浪费最好用回环口(loopback)。 一、windows开启loopback虚拟接口 概要: right click on window start menu icon an…

【C++】类型转换

目录 一、C语言风格类型转换 二、C风格类型转换 1.static_case 2.reinterpret_case 3、const_case 4、dynamic_case 三、RTTI 总结 一、C语言风格类型转换 在C语言中,如果赋值运算符左右两侧类型不同,或者形参与实参类型不匹配,或者返…

N-Gram模型介绍

N-gram是一种基于统计语言模型的算法,基本思想是将文本内容按照字节进行大小为N的滑动窗口操作,形成了长度是N的字节片段序列。 每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤&#xf…

PowerQuery:使用正则表达式

博客来源于我的语雀专栏:R 语言 语雀 更多内容同步更新请关注我的语雀:令平子 语雀 参考资料:部分已引用到各段落 在Power Query中使用正则表达式 Power query 自定义正则表达式函数 新建空白查询,粘贴以下代码,使用…

gcc: error trying to exec ‘cc1plus‘: execvp: no such file or directory

该问题是缺少gcc文件,或者gcc与g版本不匹配问题 问题来源1:系统文件的缺失或者不匹配 按照如下方法测试 安装主要是利用apt-get安装,如果没有root权限的话,只能下载源码进行编译安装,然后添加路径环境,安…

JavaWeb简单实例——Ajax请求

简单介绍: 在上一章节我们展示了关于jQuery的一些基本操作,接下来我们就要进行Ajax的一些基础操作,在真正执行操作之前,我们还需要一点前置的准备,就是关于发送和请求JSON数据的准备。 请求JSON数据: JS…

板卡测评 | 基于TI AM5708开发板——ARM+DSP多核异构开发案例分享

本次测评板卡是创龙科技旗下的TL570x-EVM,它是一款基于TI Sitara系列AM5708ARM Cortex-A15+浮点DSPC66x处理器设计的异构多核SOC评估板,由核心板和评估底板组成。核心板经过专业的PCB Layout和高低温测试验证,稳定可靠,可满足各种工业应用环境。 评估板接口资源丰富,引出…

你还不懂《顺序表》?那就不要错过这篇文章!!!

🎇🎇🎇作者: 小鱼不会骑车 🎆🎆🎆专栏: 《java练级之旅》 🎓🎓🎓个人简介: 一名专科大一在读的小比特,努力学习编程是我…

怎样翻译文本?这三种翻译方法我经常使用

大家是不是还在将收到的文本或资料一句一句地复制到浏览器去翻译,再将翻译结果粘贴回文内呢?这种方法固然可以,但要是遇到需要翻译的文本内容比较多的情况时,就会很浪费时间和精力,如果恰好被英语不好的小伙伴遇到这种…

NoSQL数据库之Redis2

Redis 事务 事务的基础概念 关于事务最常见的例子就是银行转账,A 账户给 B 账户转账一个亿 (T1),买一块地盖房子。在这种交易的过程中,有几个问题值得思考: 如何同时保证上述交易中,A账户总金额减少一个亿&#xff…

[附源码]Python计算机毕业设计Django的毕业生就业系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

蜂鸟E203学习笔记(四)——取指

1.1 取值概述 1.1.1 如何快速取指 首先要保证存储器的读延时足够小,通常使用指令紧耦合存储器(ITCM)和指令缓存器(ICache)。 ITCM通常使用离处理核很近的SRAM因此实现极短的延时。但是没有过大的存储空间&#xff0…

社区系统项目复盘-2

文章目录登录模块注册登录账号设置登录模块 重要知识点: ThreadLocal,Hostholder采用Threadlocal持有用户信息,用于代替session对象 ThreadLocal采用线程隔离的方式存放数据,可以避免多线程之间出现数据访问冲突。ThreadLocal提…

小程序全局配置文件以及常用配置项

一、window常用配置 1.小程序根目录下的app.json文件时小程序的全局配置文件。常用配置项如下: ① pages 记录当前小程序所有页面的存放路径 ② window 全局设置小程序窗口的外观 ③ tabBar 设置小程序底部的tabBar效果 ④ style 是否启用新版的组件样式 …

【Spring项目中的Service理解】

目录 1. Spring项目中的核心组成部分 2. Spring项目中的Service 2.1 Service的功能作用 2.2 Service的实现 1. Spring项目中的核心组成部分 项目的核心组成部分图解: 2. Spring项目中的Service 2.1 Service的功能作用 Service是项目中用于处理业务逻辑的&#x…