Sarcasm detection论文解析 |# 利用情感语义增强型多层次记忆网络进行讽刺检测

news2024/11/21 0:37:21

论文地址

论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0925231220304689?via%3Dihub#/

论文首页

笔记框架

利用情感语义增强型多层次记忆网络进行讽刺检测


📅出版年份:2020
📖出版期刊:Neurocomputing
📈影响因子:6
🧑文章作者:Ren Lu,Xu Bo,Lin Hongfei,Liu Xikai,Yang Liang
📍 期刊分区:
JCR分区: Q2 中科院分区升级版: 计算机科学2区 中科院分区基础版: 工程技术2区 影响因子: 6.0 5年影响因子: 6.0 EI: 是 CCF: C 南农高质量: B


🔎摘要:

讽刺检测是情感分析中一项具有挑战性的自然语言处理任务。现有的基于深度学习的讽刺检测模型没有充分考虑情感语义,但是情感语义对于提高讽刺检测的性能是必要的。为了解决这个问题,我们提出了一种利用情感语义捕捉讽刺表达特征的多层次记忆网络。在我们的模型中,我们使用第一级记忆网络来捕捉情感语义,并使用第二级记忆网络来捕捉情感语义与每个句子中的情况之间的对比。此外,我们还使用了改进的卷积神经网络,以在缺乏本地信息的情况下改进记忆网络。在互联网论证语料库(IAC-V1 和 IAC-V2)和 Twitter 数据集上的实验结果证明了我们模型的有效性。


🌐研究目的:

解决现有讽刺检测模型没有考虑情感语义问题。

📰研究背景:

讽刺检测是情感分析中一项具有挑战性的自然语言处理任务。现有的基于深度学习的讽刺检测模型没有充分考虑情感语义,但是情感语义对于提高讽刺检测的性能是必要的。

🔬研究方法:


🔩MMNSS模型架构:

MMNSS模型可以分为两部分,包括特征提取器和讽刺检测器。我们使用

两种不同的单元进行特征提取,包括基于情感语义的多级记忆网络单元和局部最大卷积神经网络(LM-CNN)单元。

输入编码层

特征提取器

多级记忆网络单元

  • 捕获句子中的对比度以进行讽刺检测。

  • 第一级记忆网络是捕获情感语义,为了捕获更多的情感语义,我们选择带有 SenticNet 的情感词作为这部分的输入。

  • 第二级记忆网络是通过计算情感语义与句子中所有单词之间的内部注意力来捕获情感与情感或情感与情境之间的对比。

LM-CNN
  • 为了弥补记忆网络中局部信息的缺乏

  • 改进的卷积神经网络(CNN)可以捕获局部信息

  • 使用局部最大池化层,它可以捕获有关局部特征的更多有用信息。

两个单元提取的特征连接起来并输入到后面的 MLP 中以获得最终的特征表示。然后将最终表示用作讽刺检测检测器的输入。

讽刺检测器

获得了三个特征,包括fCNN、fLSTM和记忆网络fmemory最后一跳的输出向量。

  • 将这三个特征连接起来得到最终的特征表示ffeature。

  • softmax 层

  • MLP层

  • 最小交叉熵损失


🧪实验:

📇 数据集:

互联网论证语料库(IAC-V1 和 IAC-V2)和 Twitter 数据集。

  • IAC 语料库旨在研究在线 BBS 上的政治辩论

  • Twitter 是一个社交网络和微博服务网站,通过文献[30]得到。

📏评估指标:

F1、召回率和精确度得分

📉 优化器&超参数:

使用预训练的 300 维全局向量(GloVe)[31] 作为词嵌入。

随机初始化 50 维位置向量得到词向量矩阵和情感词向量矩阵。

CNN模型参数Table2

IAC 数据集的本地池大小为 30,Twitter 数据集的本地池大小为 15。

💻 实验设备:

📊 消融实验:

第一级记忆网络(情感语义)提高了1.05个百分点。多级内存网络提升了1.84个百分点。 CNN cell 提高了 1.03 个百分点。 local-max-pooling 可以比 max-pooling 层提高 0.9 个百分点。

“70.93” (Ren 等, 2020, p. 325)

从表4的结果来看,我们可以看到在我们的模型中使用情感语义、记忆网络和 CNN 单元的有效性。

📋 实验结果:

Debates(IAC-V1和IAC-V2)上的结果表明CNN的性能优于LSTM。但 LSTM 在推文上的表现优于 CNN。

Attention LSTM 的性能通常优于 LSTM。

MIARN模型充分考虑了句内关系,取得了极具竞争力的性能。但MIARN模型缺乏情感考虑。


🚩研究结论:

提出了一种名为 MMNSS 的讽刺检测模型,该模型考虑了情感语义的高级表达。由于情感在讽刺检测中起着重要作用,我们从SenticNet中获取情感词,并使用记忆网络提取情感词的高级特征。这些高级特征作为下一个记忆网络的输入,进一步获得输入句子的高级特征。我们还使用局部最大池层代替传统的最大池层,以便保留输入句子的更多有用特征以用于讽刺检测。实验结果表明了我们模型的有效性。


📝总结

💡创新点:

  • 提出了一种利用情感语义捕捉讽刺表达特征的多层次记忆网络MMNSS 模型。

  • 我们使用改进的 CNN 在缺乏本地信息的情况下辅助记忆网络。

  • 使用local-max-pooling层代替传统的max-pooling层,这样可以有效地保留更多有用的特征。

🖍️知识补充:

  • 一般来说,讽刺表达涉及两个关键因素:(a)句子中情感极性的对比; (b)所传达的情绪与实际情况的对比。

  • 讽刺检测的算法可以分为两类,包括特征工程方法和深度学习方法。

  • 讽刺总是由积极情绪和消极情境产生,这表明讽刺具有不一致性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1656935.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

预测市场?预测股票?如何让预测有更高的准确率?

我们发现在足球赛中,只要知道一个简单的讯息(主队过去的获胜机率超过一半),预测力就会明显好过随便乱猜。如果再加上第二个简单的讯息(胜负纪录较佳的队伍会略占优势),可以再进一步提升预测力。…

TinySeg:模型优化框架

TinySeg:模型优化框架 摘要Background & MotivationThe TinySeg Model OptimizerThe TinySeg RuntimeEvaluation TinySeg: Model Optimizing Framework for 摘要 图像分割是计算机视觉任务中的主要组成部分,适用于各种领域,如无人机的自主导航。然而…

合并果子

借助这一道题目来严谨证明一下Huffman树的构造方法的正确性 对任意一颗\(k\)叉huffman树,他都可以等价于一个类似于合并果子的过程,即每次取出最多\(k\)个点进行合并,然后\(k\)个点的权值和就是新的点的权值,然后把这个新的点加入…

5.9号模拟前端面试10问

5.9号模拟前端面试10问 1.html语义化的理解 HTML语义化是指使用具有明确含义的HTML标签来描述内容&#xff0c;而不仅仅是使用<div>和<span>等通用容器标签。语义化的HTML代码更易于阅读和维护&#xff0c;同时也有助于搜索引擎优化&#xff08;SEO&#xff09;。…

【微机原理及接口技术】存储器

【微机原理及接口技术】存储器 文章目录 【微机原理及接口技术】存储器前言一、半导体存储器技术1.半导体存储器概述2.半导体存储器的分类3.半导体存储器芯片的结构 二、半导体存储器芯片1.RAM芯片2.ROM芯片 三、半导体存储器与CPU的连接1.存储芯片数据线的连接2.存储芯片地址线…

Vue、React实现excel导出功能(三种实现方式保姆级讲解)

第一种&#xff1a;后端返回文件流&#xff0c;前端转换并导出&#xff08;常用&#xff0c;通常公司都是用这种方式&#xff09; 第二种&#xff1a;纯后端导出&#xff08;需要了解&#xff09; 第三种&#xff1a;纯前端导出&#xff08;不建议使用&#xff0c;数据处理放…

【2024华为HCIP831 | 高级网络工程师】刷题日记(16)

个人名片&#xff1a;&#x1faaa; &#x1f43c;作者简介&#xff1a;一名大三在校生&#xff0c;喜欢AI编程&#x1f38b; &#x1f43b;‍❄️个人主页&#x1f947;&#xff1a;落798. &#x1f43c;个人WeChat&#xff1a;hmmwx53 &#x1f413;每日一句&#xff1a;&…

软件接口测试规范流程

1、需求分析 1.1 确认测试目的和测试对象&#xff1a; 了解需求并明确测试目的&#xff0c;如测试一个本地 API 还是跨网站的远程 API。 1.2 确认测试的基本条件: 确定测试所需的测试数据&#xff0c;测试环境以及测试团队中的角色和职责。 1.3. 对接口文档进行验证&#xf…

「网络流 24 题」方格取数 【最大独立集、最小割】

「网络流 24 题」方格取数 思路 首先我们将每一个相邻关系抽象成边&#xff0c;问题就转化为&#xff1a;选择若干个点&#xff0c;并且满足所选点集内部没有边&#xff0c;那么这就是一个最大点权独立集的问题 如果点权全为一我们就可以利用二分图的匈牙利算法来解决&#x…

WEB基础--单元测试与三层架构

单元测试 为什么要进行单元测试 减少创建类&#xff0c;我们希望在一个类中&#xff0c;并且测试时不需要改代码&#xff0c;那么我们就要用到junit单元测试 常见测试分类 黑盒测试 黑盒测试也叫功能测试&#xff0c;主要关注软件每个功能是否实现&#xff0c;并不关注软件代…

【源码+文档+调试教程】基于微信小程序的电子购物系统的设计与实现

摘 要 由于APP软件在开发以及运营上面所需成本较高&#xff0c;而用户手机需要安装各种APP软件&#xff0c;因此占用用户过多的手机存储空间&#xff0c;导致用户手机运行缓慢&#xff0c;体验度比较差&#xff0c;进而导致用户会卸载非必要的APP&#xff0c;倒逼管理者必须改…

H5228 DCDC 6.5-75V LED升降压恒流芯片IC,支持12V24V36V48V60V PWM、模拟和数转模调光

PWM&#xff08;脉冲宽度调制&#xff09;、模拟和数转模调光DCDC电源管理芯片的工作原理涉及多个方面。 首先&#xff0c;对于PWM调光&#xff0c;其基本原理是通过控制脉冲的宽度来调节LED的亮度。具体来说&#xff0c;当PWM信号为高电平时&#xff0c;LED亮起&#xff1b;当…

数据结构的堆(c语言版)

一.堆的概念 1.堆的基本概念 在计算机科学中&#xff0c;堆是一种特殊的数据结构&#xff0c;通常用于实现优先队列和动态分配内存。 2.堆的特征 堆是一个完全二叉树&#xff0c;它具有以下两个主要特性&#xff1a; 堆序性&#xff1a;对于最大堆&#xff0c;在堆中的任意节…

LeetCode例题讲解:只出现一次的数字

给你一个 非空 整数数组 nums &#xff0c;除了某个元素只出现一次以外&#xff0c;其余每个元素均出现两次。找出那个只出现了一次的元素。 你必须设计并实现线性时间复杂度的算法来解决此问题&#xff0c;且该算法只使用常量额外空间。 示例 1 &#xff1a; 输入&#xff…

线程的常见方法

线程的常见方法 休眠&#xff1a; 让当前状态不再参与cpu的竞争&#xff0c;直到休眠结束&#xff1b; 结果&#xff1a;并不是完全交替进行的&#xff0c;因为只是休眠状态&#xff0c;也会存在争抢cpu 放弃&#xff1a; 让当前状态主动放弃时间片&#xff0c;下次再去争抢…

js原生手写一个拖拽小功能

先上效果图 附上代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><meta name"viewport" content"widthd…

压缩和归档库-LZ4介绍

1.简介 LZ4是一种快速的压缩算法&#xff0c;提供压缩和解压缩的速度&#xff0c;而牺牲了压缩率。它被设计用于快速的数据压缩和解压缩&#xff0c;特别是用于数据存储和传输。LZ4通常用于需要高速数据处理的场景&#xff0c;如数据库、日志文件处理和实时数据传输。 LZ4的特…

LeetCode例题讲解:快乐数

编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为&#xff1a; 对于一个正整数&#xff0c;每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为 1&#xff0c;也可能是 无限循环 但始终变不到 1。如果这个过程 结果为 1&#xff0c…

C++青少年简明教程:基础知识

C青少年简明教程&#xff1a;基础知识 电脑程序设计&#xff08;Computer programming&#xff09;&#xff0c;或称程序设计&#xff08;programming&#xff09;&#xff0c;是给出解决特定问题程序的过程&#xff0c;程序设计往往以某种程序设计语言为工具&#xff0c;给出这…

每周一算法:传递闭包

题目描述 不等式排序 给定 n n n个变量和 m m m个不等式。其中 n n n小于等于 26 26 26&#xff0c;变量分别用前 n n n 的大写英文字母表示。 不等式之间具有传递性&#xff0c;即若 A > B A>B A>B 且 B > C B>C B>C&#xff0c;则 A > C A>C …