论文阅读——Recognizing Emotion Cause in Conversations

news2024/11/16 23:35:51

文章目录

  • 摘要
  • 引言
  • 相关工作
  • 任务定义
  • 构造RECCON数据集
  • 情绪原因的类型
  • 实验
    • 任务1:Causal Span Extraction
      • 模型
    • 任务2:Causal Emotion Entailment
      • 模型
  • 面临的挑战


摘要

识别文本中情绪背后的原因是NLP中一个未被探索的研究领域。这个领域的发展具有着改善情感模型可解释性和性能的潜力。由于说话者之间的动态交互性,对话中的话语级情绪原因识别极具挑战性。为此,我们引入对话中的情绪原因识别任务,并提出一个该任务的数据集RECCON,此外,我们根据原因的来源定义了不同的原因类型,并且在RECCON中的两个子任务:1)Causal Span Extranction 和 2)Causal Emoiton Entailment上建立了较强的基于transformer的基线。数据集地址为: https://github.com/declare-lab/RECCON.

引言

情感理解是AI中的一个关键部分,而语言经常暗示了一个人的情感。因此,考虑到情感识别在意见挖掘,推荐系统,医疗和其它领域的广泛应用,情感识别在NLP中受到了广泛关注。
文本或视频中的情感探测和分类方面已经有了很大的进展,然而到目前为止,关于情绪的进一步推理,比如理解一个说话者情绪的背后原因仍然很少被探索。
在这篇论文中,我们关注的是对话中的情绪原因识别。特别地,我们会在对话上下文中寻找能够触发目标话语中的情绪的events, situations, opinions or experiences。除了上述提及的事件,原因也可以是一个说话者对另一个说话者所关心事件的对应反应(人际交往之间的情绪影响)。
我们引入了对话中的情绪原因识别任务,这个原因可能出现在当前话语或者历史话语中。
所做贡献如下所示:

  • 我们提出了一个新的任务,并深入发掘了这个任务中的很多特性,而且定义了情绪原因的类型。
  • 我们为这个任务构造了一个数据集RECCON。
  • 我们提出了两个极具挑战性的子任务和对应的基线。

相关工作

主要是文本中的情感识别以及文本中的情绪原因识别(ECE和ECPE),而且在数据集中标注了多个片段来充分表示原因,同时提供了负样本:不包含原因片段的上下文。
作者在这块提到了数据集标注中遇到的挑战,包括:对话中的情绪并不总是显示的;对话非正式,很多原因是隐式的,需要推理;原因很可能距离目标华语非常远,识别它需要复杂的推理和指代消解。

任务定义

目标话语Ut、对话历史H(Ut)、原因片段集合CS(U)、utterane-causal span(UCS) pair即话语-原因片段对,S属于CS(U)。
该任务的目标是识别出给定文本中的所有的UCS对。如果这个对中的S属于CS(U),那么这个对就是positive example,如果不属于,那么这个对就是negative example。

构造RECCON数据集

考虑数据集:IEMOCAP和DailyDialog,两个数据集都有话语级的情感标签。
IEMOCAP是两人对话数据集,使用6个情感标签:happy,sad,netural,anger,excited,frustrated。数据集中的每个对话超过50个话语。
DailyDialog是一个覆盖日常生活话题的人类自然对话数据集,使用7个情感标签:anger,disgust,fear,happy,netural,sad,surprise。但是这个数据集超过83%都是中性标签,所以我们随机选择至少有4个非中性话语的对话。数据集中的每个对话平均8个话语。

标注者要求抽取原因片段,如果原因是隐式的,那么标注者将认为的原因写下来。每个话语由两个标注者标注。标注分成两个阶段,阶段1通过majority voting来决定哪个话语是原因话语,阶段2进行span-level的标注,我们会选择片段的并集作为最终原因片段,如果两个片段不重合,那么引入第三个标注者来决定最终的片段。
计算卡帕和宏F1来说明标注结果。
RECCON数据集统计信息

情绪原因的类型

根据原因的来源不同,观察到5种主要的类型:

  • No Context:原因显示地出现在目标话语当中。
  • Inter-personal Emotional Influence:原因出现在另一个说话者话语中,两种子类型:一种是另一个说话者提到地事件或概念;另一种是受到另一个说话者对于某些事件或场景地情绪影响。
  • Self-Contagion:自我情绪的传染,很多情况下,说话者会保持之前对话轮次的情绪。
  • Hybrid:第二种类型和第三种类型联合引发了情绪。
  • Unmentioned Latent Cause:目标话语及其对话历史中找不到显示的原因。

实验

任务1:Causal Span Extraction

任务1旨在识别目标话语的情绪原因片段。在我们的实验设置中,我们将该任务形式化为机器阅读理解任务,并提出两种片段抽取设置:带有上下文;不带上下文。

  • With Conversational Context:我们将构造实例(Context,Question,Answer),其中目标话语的对话历史中的所有话语拼接作为Context;在这里插入图片描述
    CS(Ut)中的Span作为Answer。
  • Without Conversational Context:此时Context只有Ui。

模型

  • RoBERTa Base:我们使用roberta-base和一个作用与隐藏层状态上的线性层用于计算开始和结束的位置。
  • SpanBERT Fine-tuned on SQuAD:我们使用在SQuAD 2.0上微调的SpanBERT base模型作为第二个基线模型。

评价指标有EMpos、F1pos、F1neg、F1。
在这里插入图片描述

任务2:Causal Emotion Entailment

任务2旨在识别出对话历史中触发目标话语情绪的原因话语。跟任务1的两种设置相同:带有上下文和不带上下文。

  • With Conversationnal Context:我们将这个问题看作一个三元做分类问题,三元组为(Ut,Ui,H(Ut)),如果Ui是原因话语,那么三元组分类为positive,否则为negative。
  • Without Conversational Context:二元句子对分类任务,(Ut,Ui)被分类为positive如果Ui为原因话语,否则为negative。

模型

  • Roberta Base/Large

评价指标为Pos.F1、Neg.F1、macro F1。
在这里插入图片描述

面临的挑战

  • 片段的数量:能够充分抽取出触发情绪的原因片段的集合是一个主要的挑战,这些片段应该能够形成一个逻辑推理。
  • 情绪的动态性:理解对话中的情绪动态性对于原因识别很重要,我们可以观察到很多对话中的原因是由另一个说话者谈到的事件或概念引起,或者是自我的一个影响。并且我们也可以看到它有时距离目标话语很多轮次远,因此还需要具有建模长期信息的能力。而且在标注中发现,情感信息非常重要。
  • 常识知识:常识知识在抽取情绪原因中发挥着重要作用,尤其当情绪原因是隐式的。
  • 复杂的共指消解:对话中的指代关系经常隐式。
  • 对话的非正式性和复杂的特性使得抽取出的原因并非最exact,而是perceived cause。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/139313.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker基础1-3

Docker基础1-3 时间:2023-01-02 https://www.bilibili.com/video/BV1gr4y1U7CY/ xmind文档:https://www.aliyundrive.com/s/6iaQt9zLDVm 一、Docker简介 1、Docker解决了什么问题 Docker打破了过去「程序即应用」的观念。透过镜像(images)将作业系统核心除外&am…

LeetCode:15. 三数之和

15. 三数之和1)题目2)思路3)代码4)结果1)题目 给你一个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ,同时还满足 nums[i] nums[j] nums[k] …

【Nginx】核心配置文件结构

文章目录Nginx核心配置文件结构全局块user指令work process指令其他指令events块events指令配置实例http块定义MIME-Type自定义服务日志其他配置指令server块和location块Nginx服务器基础配置实例Nginx核心配置文件结构 从前面的内容学习中,我们知道Nginx的核心配置…

给力!低代码开发平台广州流辰信息科技助您增辉创价值!

低代码平台开发公司流辰信息深耕行业多年,一直以市场为导向,凭借敏锐的市场洞察力砥砺前行、拼搏进取,提升研发创新能力,广州流辰信息科技与各新老客户朋友风雨同舟,携手共创宏伟新蓝图! 一、熔铸前沿科技 …

kettle的安装以及注意(迭代中....)

1、下载 kettle的官网下载地址:Pentaho from Hitachi Vantara - Browse Files at SourceForge.net 如果需要下载其他版本: 直接点击对应的版本Name(8.0以下的实在Data Integration文件夹里面)进去,再选择client-too…

【C++】代码调试的学习笔记

1. IO输出调试:输出重定向 在《第八期-C基础与深度解析》课程中,老师使用了“输出重定向”的语句来查看cout和cerr的结果: ./HelloWorld >txt1 2>txt2 代码含义:将程序HelloWorld的标准输出stdout重定向至文件txt1&#xf…

百趣代谢组学分享:从SWATH到MRM:一种新型高覆盖度靶向代谢组学技术

百趣代谢组学文献分享,SWATHtoMRM: Development of High-Coverage Targeted Metabolomics Method Using SWATH Technology for Biomarker Discovery,是由中国科学院生物与化学交叉研究中心,Dr. Zheng-Jiang Zhu课题组发表在AC上的一篇技术型文…

verilog学习笔记- 3)SignalTap II 软件的使用

目录 SignalTap II简介: SignalTap II使用: SignalTap II简介: SignalTap II 全称 SignalTap II Logic Analyzer,是第二代系统级调试工具,可以捕获和显示实时信号,是 一款功能强大且极具实用性的 FPGA 片…

IO模型详解

什么是IO呢?什么是阻塞非阻塞IO?什么是同步异步IO?什么是IO多路复用?select/epoll跟IO模型有什么关系?有几种经典IO模型呢?BIO、NIO、AIO到底有什么区别的? 什么是IO呢? IO,英文全称是Input/Output,翻译过来就是输入/输出。平时我们听得挺多,就是什么磁盘IO,网络I…

LCHub:2023年低代码开发平台市场规模将增长25%至100亿美元

随着企业希望变得更加敏捷、业务流程更加自动化,并创建新的Web和移动应用来满足消费者的需求,自动化开发工具正在成为关键因素,尤其在IT人才持续短缺的情况下。 根据调研机构最近进行的一项研究,面对持续的IT技能短缺,低代码和无代码平台等能够实现流程自动化并使员工能…

便捷生活,你我共享 | 美格智能Cat.1模组为共享经济赋能

近年来,共享经济在国内的兴起,主要基于两大优势,一是资源共享,为人们的生活带来便捷;二是绿色低碳,符合社会的发展潮流。作为近年来经济发展的新业态,共享经济的快速普及,以及带来的…

SpringMVC的请求参数传递

1,简单参数类型 单个参数 发送: http://localhost/commonParam?nameitcast接收: Controller public class UserController {RequestMapping("/commonParam")ResponseBodypublic String commonParam(String name){System.out.pr…

LeetCode:12. 整数转罗马数字

12. 整数转罗马数字1)题目2)思路3)代码4)结果1)题目 罗马数字包含以下七种字符:I, V, X, L,C,D 和 M。 字符 数值 I 1 V …

带有数字化伪装外观,全新ID.7轿车即将全球首发

一切就绪,ID.7即将出场!今年的CES展会将于2023年1月5日至8日在拉斯维加斯举行。展览期间,大众汽车集团(美国)将展出基于模块化电驱动平台(MEB)打造的首款纯电三厢轿车。展车将采用智能伪装外观&…

Vue3+TS封装axios

1.实现最基础的封装 将其封装为一个类,而不是一个函数的原因是因为类可以创建多个实例,适用范围更广,封装性更强一些。 index.ts // index.ts import axios from axios import type { AxiosInstance, AxiosRequestConfig } from axiosclas…

爬虫学习-selenium模块

与爬虫的关联可以便携的获取网站中动态加载的数据便携实现模拟登录基于游览器自动化的一个模块(按键精灵脚本)使用流程环境安装pip install selenium下载一个游览器的驱动程序:谷歌浏览器驱动安装 - 琳达的博客 - 博客园 (cnblogs.com)from s…

测试开发 | TestNG 与 Junit 对比,测试框架如何选择?

TestNG 和 Junit 作为两大流行的测试框架,有哪些区别?各有哪些优缺点?该如何选择呢?这里简要总结下:1. Junit 更适合隔离性比较强的单元测试;2. TestNG 是比 Junit 涵盖功能更全面的测试框架,具…

世界第一虚拟乐队举办了一场 AR 音乐会 #Gorillaz

“世界第一虚拟乐队” 是谁?23 年前,一支名为 Gorillaz 的乐队在英国埃塞克斯横空出世。和当时主流乐队形式不同的是,这支乐队以虚拟形象出现,凭借着过硬的音乐制作实力和别具一格的虚拟乐队形象,不久后就席卷了全球&a…

如何打造敏捷项目管理团队?【金曼说4】

曾经乔布斯说过他此生最骄傲的事不是创造了苹果,而且团队。由此也说明团队的重要性。一支优秀的团队能打造出无数优秀的产品和项目。无论是在商场还是战场上,快速反应和适应能力都至关重要,在技术和干扰性力量导致变革速度加快的时代更是如此…