Aspect-Based Sentiment Analysis Model with Bi-Guide Attention Network 论文阅读笔记

news2025/1/19 13:04:38

一、作者

Xie Jun, Wang Yuzhu, Chen Bo, Zhang Zehua, and Liu Qin

College of Information and Computer, Taiyuan University of Technology, Jinzhong, Shanxi

二、背景

在应用于方面情感分析的深度神经网络中,序列型神经网络能捕获句子的上下文语义信息,但是对于词语之间的远距离依赖关系无法进行有效学习;而图神经网络虽然可以通过图结构聚合更多的属性依赖信息,但会忽略有序词语间的上下文语义联系。

三、创新点

作者将 BiLSTM 与 GCN 进行了集合,提出了一种基于双指导注意力网络的方面级情感分析模型,该模型通过交互指导注意力机制,同时关注到文本的上下文信息和远距离依赖信息,提高了模型对于方面级情感特征表示的学习能力。

四、具体实现

模型主要包括上下文信息编码、依赖信息编码、特征信息融合和情感分类四个模块。

1.上下文信息编码模块

给定单词序列 s = [ w 1 , w 2 , ⋯   , w a 1 , w a 2 , ⋯   , w n ] s = [w_1, w_2, \cdots, w_{a_1}, w_{a_2}, \cdots, w_n] s=[w1,w2,,wa1,wa2,,wn],其中 [ w a 1 , w a 2 , ⋯   , w a m ] [w_{a_1}, w_{a_2}, \cdots, w_{a_m}] [wa1,wa2,,wam] 为句子中的方面序列,通过 Glove 即可将单词序列 s s s 转换为词向量表示 e = ( e 1 , e 2 , ⋯   , e a 1 , e a 2 , ⋯   , e n ) e = (e_1, e_2, \cdots, e_{a_1}, e_{a_2}, \cdots, e_{n}) e=(e1,e2,,ea1,ea2,,en)。然后将 e e e 输入到 BiLSTM中,得到引入了上下文信息的句子表示 h c h_c hc,其计算过程如下图所示,包含前向隐藏状态序列和后向隐藏状态序列两部分。

接下来,通过 Zero-Mask 操作可以得到序列 h c h_c hc 的 Zero-Mask 嵌入表示 h M a s k c h_{Mask}^c hMaskc,该操作的目的是减少与评价对象无关的上下文信息的影响,在去除非方面词的句子成分后即可得到融合了上下文信息的方面隐藏状态序列 h A c h_{A}^c hAc

2.依赖信息编码模块

作者将依存关系树当作有向图来处理,并通过邻接矩阵进行存储,当两个单词之间存在边,即存在依存关系时对应位置置 1。构建好的邻接关系图将会由 GCNs 来进行捕获,GCNs 可以有效利用依存关系路径来进行信息传递,并通过对传递的信息进行聚合来更新节点的表示状态。其中节点 i 的状态更新公式如下,其中 h j l g c n − 1 h_j^{l_{gcn}-1} hjlgcn1 表示节点 j 在 GCNs 中第 l g c n − 1 l_{gcn}-1 lgcn1 层的输入隐含状态, W d W_d Wd 是线性变换权重矩阵, b d b_d bd 是偏置项, d i + 1 d_i + 1 di+1 是归一化常数,用来防止度大的节点具有过大的特征值,节点 i 的度计算公式是 d i = ∑ j = 1 n A i j d_i = \displaystyle \sum_{j = 1}^nA_{ij} di=j=1nAij σ \sigma σ 是非线性激活函数(作者采用的是ReLU)。

通过 GCNs 得到的依赖信息还需要进行 Zero-Mask 操作,最终得到的依赖信息为 h A d = ( h a 1 d , h a 2 d , ⋯   , h a m d ) h_A^d = (h_{a_1}^d, h_{a_2}^d, \cdots , h_{a_m}^d) hAd=(ha1d,ha2d,,hamd)

3.特征信息融合模块

此模块包括两个基于信息主导的注意力机制,分别为 DGA-Attention 和 CGA-Attention。其中 DGA-Attention 为以依赖信息指导的注意力,其思想是通过上下文信息状态 h a i c , i ∈ [ 1 , m ] h_{a_i}^c, i \in [1, m] haic,i[1,m] 从 GCNs 的输出 h j d , j ∈ [ 1 , n ] h_j^d, j \in [1, n] hjd,j[1,n] 中检索与方面相关的语义特征,并相应计算其注意力权重,最终得到基于依赖信息指导注意力的方面特征表示 h A d g a h_A^{dga} hAdga。与此类似,基于上下文信息指导的注意力 CGA-Attention 使用 h A d h_A^d hAd 作为查询序列对 BiLSTM 输出的隐藏状态序列 h c h^c hc 进行查询,可以得到基于上下文信息指导注意力的方面特征表示 h A c g a h_A^{cga} hAcga

4.情感分类模块

情感分类模块首先将 h A d g a h_A^{dga} hAdga h A c g a h_A^{cga} hAcga 进行拼接,得到了同时融合了上下文信息和依赖信息的属性特征 h A c d h_A^{cd} hAcd,然后通过多头注意力机制 MHA 和最大池化操作即可得到最终的聚合表示 h a h_a ha。最后,通过全连接层和 softmax 归一化处理即可得到最终的情感标签概率分布 p p p

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/378349.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

血脂高的全身表现,这几种吃法改善

血脂变化总是不知不觉的,很多人没有明显的不适,但是血脂已经慢慢升高,随之而来的就是各种心血管疾病。好在血脂高还有一些外在表现,出现这些变化,多加注意。经常头晕头痛、睡不好、健忘、手脚发麻、午后犯困、夜晚清醒…

TencentOS 3.1安装MySQL 8.0.32

到官网下载安装包:https://dev.mysql.com/downloads/mysql/ 使用如下命令解包。 tar xf mysql-8.0.32-1.el8.x86_64.rpm-bundle.tar 使用rpm -qa |grep mysql 和rpm -qa |grep mariadb检查是否安装过mysql 如果有,使用下命令移除: rpm -e …

6 集成学习及Python实现

1 主要思想 集成学习: 三个臭裨将, 顶个诸葛亮 Bagging: 数据随机重抽样, 并行构建分类器, 投票;Boosting: 关注被错分的样本, 串行构建分类器, 加权投票。 2 理论 AdaBoost (Adaptive Boosting)示意图1 错误率: εEN\varepsilon \frac{E}{N}εNE​ 其中NNN为…

【halcon】dev_set_part / set_part

前言: dev_set_part / set_part 其实功能是一样的。下面就set_part 进行讲解。 背景 我在写程序的时候需要一个诉求,我找了很多瑕疵,每个瑕疵都有一个位置,这些位置在一个数据的列表,我希望在列表点到瑕疵位置的时…

mysql数据库常用字符串函数

文章目录一、字符串函数详解二、文档下载地址一、字符串函数详解 1、ascii(str) 返回值为字符串str 的最左字符的数值,即取得最左字符的ascii码。假如str为空字符串,则返回值为 0 。假如str 为null,则返回值为 null。 2、bin(n) 返回值为n的二进制值的…

了解Maven的作用

专门用于管理和构建Java的工具,主要功能有如下: 1.提供一套标准化的项目结构 在不同的Java ide上面创建项目结构,比如说IDEA和eclipse这些ide上创建Java项目都有所不同 但是使用Maven创建项目可以使得项目结构标准化,如下图所示就是使用IDE…

LeetCode 700. 二叉搜索树中的搜索

LeetCode 700. 二叉搜索树中的搜索 难度:easy\color{Green}{easy}easy 难度:middle\color{orange}{middle}middle 难度:hard\color{red}{hard}hard 题目描述 给定二叉搜索树(BST)的根节点 rootrootroot 和一个整数值…

Go defer用法

defer概览 defer是go语言里的一个关键字,在 函数内部使用;defer关键字后面跟一个 函数或匿名函数; defer用法 执行一些资源的收尾工作,如 关闭数据库连接,关闭文件描述符,释放资源等等;结合recover()函数使用,防止函数内部的异常导致整个程序停止;defer在遇到panic后,仍然会…

Javascript的API基本内容(六)

一、正则表达式 1.定义规则 const reg /表达式/ 其中/ /是正则表达式字面量正则表达式也是对象 2.使用正则 test()方法 用来查看正则表达式与指定的字符串是否匹配如果正则表达式与指定的字符串匹配 ,返回true,否则false 3.元字符 比如&#xff0…

论文阅读:Self-Supervised Monocular Depth Estimation with Internal Feature Fusion

中文标题:基于内部特征融合的自监督单目深度估计 创新点 参照HR-Net在网络上下采样的过程中充分利用语义信息。设计了一个注意力模块处理跳接。提出了一个扩展的评估策略,其中方法可以使用基准数据中的困难的情况进行进一步测试,以一种自我…

【 PMU】信号生成、采样、分割、估计器应用和误差计算(Matlab代码实现)

👨‍🎓个人主页:研学社的博客💥💥💞💞欢迎来到本博客❤️❤️💥💥🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密…

Active Directory管理帮助台

随着组织规模扩大,需要大幅增加Active Directory帮助台指派。随着组织开始在新地点开设办事处,管理员管理所有地点的用户变得极为繁琐。在这样的情况下,帮助台指派需要横跨不同的域以方便多域管理。尝试使用本机AD工具或PowerShell执行帮助台…

HyperLPR3-五分钟搞定: 中文车牌识别光速部署与使用

简介HyperLPR在2023年初已经更新到了v3的版本,该版本与先前的版本一样都是用于识别中文车牌的开源图像算法项目,最新的版本的源码可从github中提取:https://github.com/szad670401/HyperLPR快速安装使用Python平台可以直接使用pip进行安装&am…

(五十二)大白话不断在表中插入数据时,物理存储是如何进行页分裂的?.md

上回我们讲到了数据页的物理存储结构,数据页之间是组成双向链表的,数据页内部的数据行是组成单向链表的,每个数据页内根据主键做了一个页目录 然后一般来说,你没有索引的情况下,所有的数据查询,其实在物理…

Java Map集合体系(HashMap、LinkedHashMap、TreeMap、集合嵌套)

目录Map集合体系一、Map集合的概述二、Map集合体系特点三、Map集合常用API四、Map集合的遍历4.1 Map集合的遍历方式一:键找值4.2 Map集合的遍历方式二:键值对4.3 Map集合的遍历方式三:lambda表达式五、Map集合案例-统计投票人数六、Map集合的…

Vue2.0开发之——ref引用实例-文本框和按钮的按需展示(42)

一 概述 文本框和按钮按需展示功能实现了解this.$nextTick的应用场景updated为啥不行 二 文本框和按钮按需展示功能实现 2.1 布局文件 <template><div class"app-container"><input type"text" v-if"inputVisible" blur"…

ffmpeg多路同时推流

一、ffmpeg常见使用方法1.1利用FFMPEG命令进行文件分割1.2转换格式1.3推流配置方法一&#xff1a;ngnix&#xff08;不推荐&#xff0c;推流不好使&#xff09;方法二&#xff1a;srs&#xff08;强烈推荐&#xff09;1.4查看nginx启动是否成功二、ffmpeg推流——>ngnix单路…

Shell高级——Linux中的文件描述符(本质是数组的下标)

以下内容源于C语言中文网的学习与整理&#xff0c;非原创&#xff0c;如有侵权请告知删除。 前言 Linux中一切接文件&#xff0c;比如 C 源文件、视频文件、Shell脚本、可执行文件等&#xff0c;就连键盘、显示器、鼠标等硬件设备也都是文件。 一个 Linux 进程可以打开成百上…

【项目管理PMP备考】PMP到底学习什么?

学习PMP的过程其实就是了解这样一种先进的管理思想、理念、方法&#xff0c;也就是学习新文化。PMP考试就是考核你对PMP管理规则、流程、方法的掌握程度&#xff0c;因此他要考察的内容一定是项目管理的要素&#xff0c;而且也一定是偏向与考核你对这种新文化的理解程度。我们如…

基于OMAPL138+FPGA核心板多核软件开发组件MCSDK开发入门(下)

本文测试板卡为创龙科技 SOM-TL138F 是一款基于 TI OMAP-L138(定点/浮点 DSP C674x + ARM9)+ 紫光同创 Logos/Xilinx Spartan-6 低功耗 FPGA 处理器设计的工业级核心板。核心板内部OMAP-L138 与 Logos/Spartan-6 通过 uPP、EMIFA、I2C 通信总线连接,并通过工业级 B2B连接器引…