MER 2024 第二届多模态情感识别挑战赛

news2024/12/24 21:40:56

      多模态情感识别是人工智能领域的一个活跃研究课题。它的主要目标是整合多种模态来识别人类的情绪状态。当前的工作通常为基准数据集假设准确的情感标签,并专注于开发更有效的架构。然而,现有技术难以满足实际应用的需求。

     清华大学陶建华教授联合中国科学院自动化研究所连政,帝国理工学院Björn W. Schuller,奥卢大学赵国英,南洋理工大学Erik Cambria联合在IJCAI2024上举办多模态情感识别挑战赛MER24,并在ACM MM2024上组织多模态与可靠性情感计算研讨会MRAC24。这两项活动旨在联合情感计算领域的研究人员,深入探讨最新研究进展和未来发展方向,促进这项技术在真实场景中的落地应用。

       去年MER2023,专注于三个主题:多标签学习、噪声鲁棒性和半监督学习。今年MER2024除了扩大数据集的大小,引入了一个新的开放式词汇情绪识别赛道MER-OV。这个赛道的主要考虑是现有数据集通常固定标签空间,并使用多数投票来增强注释者的一致性,但这个过程可能限制了模型描述微妙情绪的能力。在这个赛道中,我们鼓励参与者生成任意数量的标签,在任何类别中,目标是尽可能准确地描述情绪状态

1、三个赛道

1.1 MER-SEMI(半监督学习赛道)

目标:这个赛道的目标是探索和改进半监督学习策略,以便更好地利用未标记数据来提高情绪识别的性能。

挑战:在实际应用中,获取大量带有情绪标签的数据是困难且成本高昂的。半监督学习是一种减少对标记数据依赖的方法。

方法:参与者被鼓励使用未标记数据以及有限的标记数据来训练他们的模型,并探索有效的半监督学习技术。

评估:评估主要基于模型在未标记数据集上的表现,以及其泛化能力。

样本:包含1169个已标注样本和115595个未标注样本。

1.2 MER-NOISE(噪声鲁棒性赛道)

目标:这个赛道旨在提高情绪识别系统对于噪声的鲁棒性,特别是在音频和视觉数据中常见的噪声类型。

挑战:真实世界的数据往往伴随着各种噪声,如背景噪音和图像模糊,这些噪声可能会影响情绪识别的准确性。

方法:参与者需要开发能够抵御或减少噪声影响的模型,可能涉及数据增强、降噪技术或其他创新方法。

评估:评估将基于模型在含有噪声的数据集上的表现,特别是音频加性噪声和图像模糊噪声。

样本:包含1170个已标注样本和115595个未标注样本。

1.3 MER-OV(开放式词汇情绪识别赛道)

目标:这个赛道的目的是推动情绪识别技术的发展,使其能够识别和描述更细微、更开放的情绪状态,而不仅仅局限于预定义的离散情绪类别。

挑战:传统的情绪识别数据集通常限制在少数几个情绪标签上,这限制了模型识别更丰富情绪状态的能力。

方法:参与者被鼓励生成任意数量的标签,尝试以最准确的方式描述情绪状态。这可能涉及使用大型语言模型(LLMs)或其他先进的自然语言处理技术。

评估:评估将基于模型生成的标签的准确性和多样性,以及其对情绪状态的描述能力。

样本:332个开放式情感标注样本

2、挑战数据集

2.1 MER2023数据集

  • 包含4个子集:Train&Val、MER-MULTI、MER-NOISE和MER-SEMI
  • Train&Val包含大量已标注的样本
  • MER-MULTI和MER-NOISE包含噪声样本
  • MER-SEMI包含大量未标注的样本

2.2 MER2024数据集

MER2024是MER2023的扩展版本,通过以下方式进行了扩展:

  • 将MER2023中的所有已标注样本合并到Train&Val,使其样本量更大;
  • 收集更多未标注样本,构建了MER-SEMI和MER-NOISE两个子集;
  • 从Train&Val中选取332个样本进行开放式情感标注,构建了MER-OV子集;
  • MER-SEMI包含1169个已标注样本,同时包含115595个未标注样本;
  • MER-NOISE包含1170个已标注样本,同时包含115595个未标注样本;
  • MER-OV包含332个开放式情感标注样本。

要下载数据集,参与者需要填写最终用户许可协议(EULA)。它要求参与者仅将此数据集用于学术研究,不得编辑或上传到互联网。对于 MER-SEMI 和 MER-NOISE,每个团队需要提交 6 个候选标签(即担忧、快乐、中性、愤怒、惊讶和悲伤)中最有可能的离散标签。对于 MER-OV,每个团队可以提交任何类别中的任意数量的标签。同时要求参与者不能为 MER-OV 使用闭源模型(例如 GPT )

3、评估指标

针对不同的赛道,制定了相应的评估指标来衡量参与者模型的性能。以下是对各个赛道评估指标的详细介绍:

3.1 MER-SEMI 和 MER-NOISE 评估指标

对于这两个赛道,主要使用了两个广泛用于情绪识别的评估指标:

准确率(Accuracy):这是最直观的性能指标,表示模型正确预测情绪类别的比例。对于多标签情绪识别,准确率可能需要针对每个标签分别计算,然后取平均值。

加权平均 F 分数(Weighted Average F-score, WAF):考虑到情绪类别可能存在不平衡的情况,加权平均 F 分数是一种更为公平的评估指标。它结合了精度(Precision)和召回率(Recall),并根据每个类别的支持数量进行加权,以确保所有类别在评估中具有相同的重要性。

3.2 MER-OV 评估指标

对于开放式词汇情绪识别赛道,由于标签空间是开放的,传统的分类指标(如准确率和召回率)不再适用。因此,定义了以下集级别(set-level)的评估指标:

集级别准确率(Set-Level Accuracy):这个指标衡量的是预测情绪标签集合与真实标签集合之间的匹配程度。具体来说,它计算两个集合交集的大小与预测集合大小的比例。

集级别召回率(Set-Level Recall):与集级别准确率相对应,集级别召回率衡量的是预测集合与真实标签集合交集的大小与真实标签集合大小的比例。

平均值(Avg):为了最终排名,MER-OV 赛道选择集级别准确率和集级别召回率的平均值作为最终的评估指标。

计算公式为:

4、关键日期

2024.4.30

MER24数据及基线开放

2024.6.30

MER24结果提交开放

2024.7.10

MER24结果提交截止

2024.7.19

MRAC24论文提交截止

2024.8.5

MRAC24论文接收通知

5、相关网址

Baseline paper: https://arxiv.org/abs/2404.17113
Baseline code: MERTools/MER2024 at master · zeroQiaoba/MERTools · GitHub

官网:MER24@IJCAI and MRAC24@ACM MM

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1704900.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

体育赛事直播系统源码开发:社区论坛模块如何实现引流与增收双赢

在当今数字化时代,体育直播平台不仅是赛事观看的窗口,更是一个互动和交流的社区,以及是一场关于用户体验、用户粘性以及商业模式创新的综合较量。为了在这片红海市场中脱颖而出,平台必须采取更加精细化和多元化的运营策略。其中&a…

2024最新下载kettle方法

1.点击链接进入官网 Pentaho from Hitachi Vantara download | SourceForge.netDownload Pentaho from Hitachi Vantara for free. End to end data integration and analytics platform. Pentaho Community Edition can now be downloaded from https://www.hitachivantara.…

python中import的搜索路径

文章目录 前言 一 python中import的搜索路径1. python中import的搜索路径先判断是否内置模块根据sys.path查找1.1 脚本当前目录和所属项目目录1.2 环境变量1.3 标准库1.4 .pth 文件1.5 第三方库 2. 解决ModuleNotFoundError 前言 码python时经常会遇到找不到包或者找不到模块的…

Brewer Science将在CS Mantech进行展示

在风景如画的亚利桑那州图森市举办的CS Mantech盛会上(2024年5月20日至23日),杰出化合物半导体材料企业Brewer Science,将带来一场名为“化合物半导体制造的创新材料解决方案”的演讲盛宴。这一演讲,定于五月二十一日星…

今日好料推荐(数据资产+数字化案例)

今日好料推荐(数据资产数字化案例) 参考资料在文末获取,关注我,获取优质资源。 数字化的介绍 数字化(Digitization)是指将模拟信息转换为数字格式的过程。这一过程包括将文字、图像、音频、视频等信息转…

sqpserver——利用scott库练习内连接(一)

一.查找每个员工的姓名&#xff0c;部门编号&#xff0c;薪水和薪水等级 select emp.ename, emp.deptno, emp.sal, SALGRADE.GRADE from emp join SALGRADE on emp.sal>LOSAL and emp.sal<HISAL; 二.查找每个部门的编号&#xf…

SwiftUI中TabView(PageTabViewStyle的用法及无限滚动组件infinity carousel)

上一篇文章主要介绍了TabView的基本用法以及一些外观样式的设置&#xff0c;本篇文章主要介绍一下PageTabViewStyle样式下的TabView&#xff0c;该样式下的TabView允许用户整页滑动界面&#xff0c;在UIKit中我们用UIScrollView和UICollectionView制作滚动组件&#xff0c;本文…

C++进阶 | [4] map and set

摘要&#xff1a;set&#xff0c;multiset&#xff0c;map&#xff0c;multimap 前言 1. 容器 序列式容器&#xff1a;只存储数据&#xff0c;数据之间无关联关系。例如&#xff0c;vector、list、deque、……关联式容器&#xff1a;不仅存储数据&#xff0c;且数据之间有关联…

Chrome谷歌浏览器如何打开不安全页面的禁止权限?

目录 一、背景二、如何打开不安全页面被禁止的权限&#xff1f;2.1 第一步&#xff0c;添加信任站点2.2 第二步&#xff0c;打开不安全页面的权限2.3 结果展示 一、背景 在开发过程中&#xff0c;由于测试环境没有配置 HTTPS 请求&#xff0c;所以谷歌浏览器的地址栏会有这样一…

《Python侦探手册:用正则表达式破译文本密码》

在这个信息爆炸的时代&#xff0c;每个人都需要一本侦探手册。阿佑今天将带你深入Python的正则表达式世界&#xff0c;教你如何像侦探一样&#xff0c;用代码破解文本中的每一个谜题。从基础的字符匹配到复杂的数据清洗&#xff0c;每一个技巧都足以让你在文本处理的领域中成为…

代码随想录——最大二叉树(Leetcode654)

题目链接 递归 二叉树 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNode rig…

Django Celery技术详解

文章目录 简介安装和配置创建并调度任务启动Celery Worker在视图中调用异步任务拓展功能 简介 Django Celery 是一个为Django应用程序提供异步任务处理能力的强大工具。它通过与消息代理&#xff08;如RabbitMQ、Redis&#xff09;集成&#xff0c;可以轻松地处理需要长时间运…

[C#]winform部署官方yolov10目标检测的onnx模型

【框架地址】 https://github.com/THU-MIG/yolov10 【算法介绍】 今天为大家介绍的是 YOLOv10&#xff0c;这是由清华大学研究团队最新提出的&#xff0c;同样遵循 YOLO 系列设计原则&#xff0c;致力于打造实时端到端的高性能目标检测器。 方法 创新 双标签分配策略 众所…

shell脚本-函数

一、函数 1.函数的定义和格式 函数定义&#xff1a;封装的可重复利用的具有特定功能的代码 先定义函数&#xff0c;再调用函数&#xff0c;注意顺序 函数类似于命令的别名&#xff0c;别名一些简单的小命令 函数是某一个脚本的别名&#xff0c;有些脚本会重复使用 函数格…

【链表】Leetcode 92. 反转链表 II【中等】

反转链表 II 给你单链表的头指针 head 和两个整数 left 和 right &#xff0c;其中 left < right 请你反转从位置 left 到位置 right 的链表节点&#xff0c;返回 反转后的链表 。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], left 2, right 4 输出&#x…

【一刷《剑指Offer》】面试题 24:二叉搜索树的后序遍历系列

力扣对应题目链接&#xff1a;LCR 152. 验证二叉搜索树的后序遍历序列 - 力扣&#xff08;LeetCode&#xff09; 牛客对应题目链接&#xff1a;二叉搜索树的后序遍历序列_牛客题霸_牛客网 (nowcoder.com) 核心考点 &#xff1a; BST 特征的理解。 一、《剑指Offer》对应内容 二…

NASA数据集——严格校准的臭氧(O3)、甲醛(HCHO)、二氧化碳(CO2)和甲烷(CH4)混合比,以及包括三维风在内的气象数据

Alpha Jet Atmopsheric eXperiment Meteorological Measurement System (MMS) Data 阿尔法喷气式大气实验气象测量系统&#xff08;MMS&#xff09;数据 简介 Alpha Jet Atmospheric eXperiment (AJAX) 是美国国家航空航天局艾姆斯研究中心与 H211, L.L.C. 公司的合作项目&a…

LAMP网络服务架构

目录 LAMP 网站服务架构 LAMP的组成部分 LAMP的构建顺序 安装论坛 0.电脑已编译安装Apache&#xff0c;MySQL&#xff0c;PHP 1.创建数据库&#xff0c;并进行授权 2.上传论坛压缩包到 /opt ,并解压 3.上传站点更新包 4.更改论坛目录的属主 5.浏览器访问验证 LAMP 网…

2024年03月 Python(四级)真题解析#中国电子学会#全国青少年软件编程等级考试

Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,共50分) 第1题 运行如下代码,若输入整数3,则最终输出的结果为?( ) def f(x):if x==1:s=1else:s

各种情况下的线缆大小选择

开口线鼻子和导线对应大小 开口铜鼻子对应线径大小 变压器容量对应高压侧电流大小 开关电流线缆功率对照表 家庭/工业最常用电线铜线电流承载功率 电工常用名词对应符号 导线面积承载的安全载流量及允许负荷对照表 漏电保护器选择参考表 电动机功率换算电流 电机功…