论文地址
论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0925231220304689?via%3Dihub#/
论文首页
笔记框架
利用情感语义增强型多层次记忆网络进行讽刺检测
📅出版年份:2020
📖出版期刊:Neurocomputing
📈影响因子:6
🧑文章作者:Ren Lu,Xu Bo,Lin Hongfei,Liu Xikai,Yang Liang
📍 期刊分区:JCR分区: Q2 中科院分区升级版: 计算机科学2区 中科院分区基础版: 工程技术2区 影响因子: 6.0 5年影响因子: 6.0 EI: 是 CCF: C 南农高质量: B
🔎摘要:
讽刺检测是情感分析中一项具有挑战性的自然语言处理任务。现有的基于深度学习的讽刺检测模型没有充分考虑情感语义,但是情感语义对于提高讽刺检测的性能是必要的。为了解决这个问题,我们提出了一种利用情感语义捕捉讽刺表达特征的多层次记忆网络。在我们的模型中,我们使用第一级记忆网络来捕捉情感语义,并使用第二级记忆网络来捕捉情感语义与每个句子中的情况之间的对比。此外,我们还使用了改进的卷积神经网络,以在缺乏本地信息的情况下改进记忆网络。在互联网论证语料库(IAC-V1 和 IAC-V2)和 Twitter 数据集上的实验结果证明了我们模型的有效性。
🌐研究目的:
解决现有讽刺检测模型没有考虑情感语义问题。
📰研究背景:
讽刺检测是情感分析中一项具有挑战性的自然语言处理任务。现有的基于深度学习的讽刺检测模型没有充分考虑情感语义,但是情感语义对于提高讽刺检测的性能是必要的。
🔬研究方法:
🔩MMNSS模型架构:
MMNSS模型可以分为两部分,包括特征提取器和讽刺检测器。我们使用
两种不同的单元进行特征提取,包括基于情感语义的多级记忆网络单元和局部最大卷积神经网络(LM-CNN)单元。
输入编码层
特征提取器
多级记忆网络单元
-
捕获句子中的对比度以进行讽刺检测。
-
第一级记忆网络是捕获情感语义,为了捕获更多的情感语义,我们选择带有 SenticNet 的情感词作为这部分的输入。
-
第二级记忆网络是通过计算情感语义与句子中所有单词之间的内部注意力来捕获情感与情感或情感与情境之间的对比。
LM-CNN
-
为了弥补记忆网络中局部信息的缺乏
-
改进的卷积神经网络(CNN)可以捕获局部信息
-
使用局部最大池化层,它可以捕获有关局部特征的更多有用信息。
两个单元提取的特征连接起来并输入到后面的 MLP 中以获得最终的特征表示。然后将最终表示用作讽刺检测检测器的输入。
讽刺检测器
获得了三个特征,包括fCNN、fLSTM和记忆网络fmemory最后一跳的输出向量。
-
将这三个特征连接起来得到最终的特征表示ffeature。
-
softmax 层
-
MLP层
-
最小交叉熵损失
🧪实验:
📇 数据集:
互联网论证语料库(IAC-V1 和 IAC-V2)和 Twitter 数据集。
-
IAC 语料库旨在研究在线 BBS 上的政治辩论
-
Twitter 是一个社交网络和微博服务网站,通过文献[30]得到。
📏评估指标:
F1、召回率和精确度得分
📉 优化器&超参数:
使用预训练的 300 维全局向量(GloVe)[31] 作为词嵌入。
随机初始化 50 维位置向量得到词向量矩阵和情感词向量矩阵。
CNN模型参数Table2
IAC 数据集的本地池大小为 30,Twitter 数据集的本地池大小为 15。
💻 实验设备:
📊 消融实验:
第一级记忆网络(情感语义)提高了1.05个百分点。多级内存网络提升了1.84个百分点。 CNN cell 提高了 1.03 个百分点。 local-max-pooling 可以比 max-pooling 层提高 0.9 个百分点。
“70.93” (Ren 等, 2020, p. 325)
从表4的结果来看,我们可以看到在我们的模型中使用情感语义、记忆网络和 CNN 单元的有效性。
📋 实验结果:
Debates(IAC-V1和IAC-V2)上的结果表明CNN的性能优于LSTM。但 LSTM 在推文上的表现优于 CNN。
Attention LSTM 的性能通常优于 LSTM。
MIARN模型充分考虑了句内关系,取得了极具竞争力的性能。但MIARN模型缺乏情感考虑。
🚩研究结论:
提出了一种名为 MMNSS 的讽刺检测模型,该模型考虑了情感语义的高级表达。由于情感在讽刺检测中起着重要作用,我们从SenticNet中获取情感词,并使用记忆网络提取情感词的高级特征。这些高级特征作为下一个记忆网络的输入,进一步获得输入句子的高级特征。我们还使用局部最大池层代替传统的最大池层,以便保留输入句子的更多有用特征以用于讽刺检测。实验结果表明了我们模型的有效性。
📝总结
💡创新点:
-
提出了一种利用情感语义捕捉讽刺表达特征的多层次记忆网络MMNSS 模型。
-
我们使用改进的 CNN 在缺乏本地信息的情况下辅助记忆网络。
-
使用local-max-pooling层代替传统的max-pooling层,这样可以有效地保留更多有用的特征。
🖍️知识补充:
-
一般来说,讽刺表达涉及两个关键因素:(a)句子中情感极性的对比; (b)所传达的情绪与实际情况的对比。
-
讽刺检测的算法可以分为两类,包括特征工程方法和深度学习方法。
-
讽刺总是由积极情绪和消极情境产生,这表明讽刺具有不一致性。