车载多通道语音识别挑战赛(ICMC-ASR)丨ICASSP2024

news2025/1/23 4:46:36

希尔贝壳理想汽车西工大音频语音与语言处理研究组新加坡南洋理工大学天津大学WeNet开源社区微软中国信通院等单位发起的“车载多通道语音识别挑战赛(ICMC-ASR)将作为IEEE声学、语音与信号处理国际会议(ICASSP2024)的旗舰赛事,正式启动。报名参加此次赛事,您将获得:

  • 业界首个新能源车智能座舱多通道实录语音数据集;

  • 超百人的车内驾驶员和乘客间语音对话数据,覆盖不同驾驶场景;

  • 测试车载语音识别的真实技术水平;

  • 顶会 ICASSP2024 受邀论文和报告机会;

  • 与国际语音学术和产业界深度交流技术前沿的机会。

  官网:https://icmcasr.org

背景

随着汽车成为人们日常生活中不可或缺的一部分,而驾驶舱中传统的触摸交互方式容易分散驾驶员的注意力,存在安全风险,因此,车内基于语音的交互方式得到重视。与通常家庭或会议场景中的语音识别系统不同,驾驶场景中的系统面临更加独特的挑战,缺乏大规模的公共真实车内数据一直是该领域发展的主要障碍。因此,特推出车载多通道语音识别挑战赛(ICMC-ASR)

本次赛事发布一个真实的车内多通道语音语料库,包含约 1000小时、车内真实录制的多通道普通话语音数据,收音设备包含车内分布式麦克风收集的远场数据,以及参与者的头戴麦克风收集的近场数据。更多赛事数据的详细信息请参考官方网站的数据介绍。

数据集样例:

demo1

demo2

赛 道

ICMC-ASR 设立了两个不同的赛道:

• Track I Automatic Speech Recognition (ASR): 

提供评估集的真实的说话人日志结果。任务目标是开发基于多通道多说话人语音识别系统。参与者需要关注不同通道数据信息融合、背景噪声抑制以及多说话人重叠等。

•  Track II Automatic Speech Diarization and Recognition (ASDR): 

去除说话人日志的先验知识(如说话人的分割、说话人标签以及说话人人数),参与者需要使用说话人日志和识别技术对评估集中的每个会话进行分割和转录。该任务接受端到端系统以及允许更多的系统灵活性。

有任何问题,可联系:icmcasr_challenge@aishelldata.com 。

重要日期

9.12

注册开放

9.30

训练集发布,注册截止

10.7

验证集和基线系统发布

12.5

测试集发布,榜单开启

12.19

最终结果提交截止

12.30

系统说明提交截止

注册

ICMC-ASR 赛事对高校、公司和科研机构开放,并邀请排名靠前的队伍基于竞赛系统形成论文,在 ICASSP2024 上发表。参赛者在9月30日前可登录赛事官网 (https://icmcasr.org) 进行注册,请按照以下要求注册挑战赛:

  1. 机构或者公司邮箱注册,个人邮箱如 163.com、qq.com等不可;

  2. 提供团队名称、隶属机构、参与赛道信息。

主办方将在3个工作日内通过电子邮件通知符合条件的参赛团队,团队必须遵守赛事官网上发布的挑战规则。本次赛事最终解释权归组委会。

组织者 

  • Lei Xie, Northwestern Polytechnical University
  • Eng Siong Chng, Nanyang Technological University
  • Zhuo Chen, Microsoft Corporation
  • Jian Wu, Microsoft Corporation
  • Longbiao Wang, Tianjin University
  • Hui Bu, AIShell Inc and AIShell Foundation

  • Xin Xu, AIShell Inc
  • Binbin Zhang, WeNet Open Source Community 
  • Wei Chen,  Li Auto

  • Pan Zhou, Li Auto

  • He Wang, Northwestern Polytechnical University

  • Pengcheng Guo, Northwestern Polytechnical University

  • Sun Li, China Academy of Information and Communication Technology

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1006981.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

随机数问题

你知道 C 中的 rand() 函数是怎么实现的吗?你知道怎么在一维 / 二维 / 三维空间中等可能地随机取点吗? 随机数是一系列看似无规律、无法预测的数字或值的序列,其产生过程具有一定程度的不确定性。在计算机中,真正的绝对随机数是很…

当你的公司突然开始大量的裁员,被留下的你,真的准备好面对以后了吗?

留下来的,也是迷茫的 最近公司突然开始大量裁员,裁了一多半,作为唯一留下的APP 端开发人员,也开始陷入了焦虑,开始了思考,未来究竟何去何从,是否再去转到原生,从事原生的开发工作&a…

元服务那些事儿 | 挥剑解决隐私声明,激发开发豪情

话说元服务初上的年间,鸿蒙江湖高手云起,都是一顿键盘手猛敲,元服务推陈出新,创意层出不穷,无不风生水起。 江湖规矩:每个元服务必须提供规范的隐私声明,否则提交元服务发布上架后,将…

AI 为我制作了 5 份简历,过程太美好了

现在,每个人都在使用人工智能 (AI) 来让自己的生活变得更轻松——从订购杂货、找到丢失的钥匙到撰写完美的简历。人工智能简历生成器是令人惊叹的工具,但选择合适的工具可能是一项挑战。 人工智能简历写作工具的市场正在迅速扩大,并且越来越…

【Linux环境】编译器 gcc/g++的使用

​👻内容专栏: Linux操作系统基础 🐨本文概括: 预处理、编译、汇编、链接、动静态库、gcc选项等。 🐼本文作者: 阿四啊 🐸发布时间:2023.9.13 背景知识 预处理(进行宏替换…

element-ui文件下载(单个)

1. 单个附件下载 <el-buttontype"text"size"small"click.native.prevent"download(scope.row)" >下载</el-button>export default {data() {return {downloadUrl: http://127.0.0.1:8881/XX/XX, // 下载接口}},methods: {download(…

骨传导耳机怎么听到声音?骨传导耳机是否会对听力造成损害?

其实骨传导耳机让我们听到的的传声原理很简单&#xff0c;而且骨传导现象很常见&#xff0c;简单的来说&#xff0c;就是像我们平时吃薯片或者挠头发&#xff0c;无论声音再小&#xff0c;自己也能听见&#xff0c;这就是骨传导的现象&#xff0c;也是为啥骨传导耳机不需要入耳…

【SpringMVC】JSON注解异常处理的使用

&#x1f389;&#x1f389;欢迎来到我的CSDN主页&#xff01;&#x1f389;&#x1f389; &#x1f3c5;我是Java方文山&#xff0c;一个在CSDN分享笔记的博主。&#x1f4da;&#x1f4da; &#x1f31f;在这里&#xff0c;我要推荐给大家我的专栏《Spring MVC》。&#x1f3…

【Axure高保真原型】日历日期原型模板

今天和大家分享日历日期的原型模板&#xff0c;包括月计划、周计划、日计划的原型案例&#xff0c;以及日期、时间、月份、区间选择器……具体效果可以点击下方视频观看 【原型预览及下载地址】 Axure 原型 备用地址&#xff1a;Untitled Document 【原型效果】 【原型效果…

ABAP 获取信贷超额函数

业务需求&#xff1a;在创建销售订单时&#xff0c;信贷超额不会影响单据正常生成&#xff0c;前台信贷超额消息时前台弹框式警告&#xff0c;故而不会在BAPI RETURN中返回&#xff0c;也许需要获取这类消息&#xff0c;返回给外围系统。 函数&#xff1a;SD_DELIVERY_CREDIT_C…

利用面向对象方法,处理数据文件【Python】

题目背景&#xff1a;处理两份数据文件&#xff08;文本数据和JSON数据&#xff09;&#xff0c;用面向对象的方法&#xff0c;效果图用柱状图呈现。 本题思路&#xff1a; 1.首先&#xff0c;创建一个【基础数据类】&#xff0c;名为Record&#xff0c;它将包含成员属性和成员…

【数据结构-堆】堆

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

嵌入式行业这个领域是否值得坚持

今日话题&#xff0c;嵌入式行业&#xff0c;特别是对于嵌入式新人&#xff0c;是否值得坚持这个领域&#xff1f;对于想要进入嵌入式行业的人来说&#xff0c;坚持是明智的选择。这个领域涉及硬件和软件&#xff0c;技术更新较慢&#xff0c;但它也为你提供了积累经验的机会。…

mysql学习查缺补漏1---基础部分(小滴课堂)

举例&#xff1a; DDL&#xff1a;建库&#xff0c;建表。 DML&#xff1a;对表的数据进行增删改操作。 DQL&#xff1a;对数据进行查询。 DCL&#xff1a;对用户的权限进行设置。 create table teacher as select * from student where 12; 该条语句只用于复制表结构&…

Kubernetes 使用configmap挂载卷给Pod内的nginx容器

目录 实验&#xff1a;使用configmap挂载卷给Pod内的nginx容器 1、创建nginx.conf配置文件&#xff08;必须由nginx镜像里的nginx.conf修改而来&#xff0c;防止出现配置不相似的情况出现&#xff0c;导致访问不了nginx网页&#xff09; 2、通过nginx.conf文件创建configmap容…

Java 代理模式之静态代理与动态代理

1&#xff0c;代理模式 代理模式给某一个对象提供一个代理对象&#xff0c;并由代理对象控制对原对象的引用。通俗的来讲代理模式就是我们生活中常见的中介。 代理模式的目的&#xff1a; &#xff08;1&#xff09;通过引入代理对象的方式来间接访问目标对象&#xff0c;防…

对话式人工智能(Conversational AI):提高模型的智能程度和扩展能力

对话式人工智能的趋势与挑战 对话式人工智能 (AI) 已经出现在许多家庭的客厅、汽车和在线购物体验中。聊天机器人、语音助手、智能扬声器、交互式语音识别系统&#xff1a;所有这些都是对话式 AI 的示例。由于该领域通过增强的客户体验提供了更多可访问性&#xff0c;因此吸引…

PHP自己的框架2.0结合容器技术(重构篇二)

目录 1、使用容器实现框架加载类运行 2、 创建框架容器类core/fm/Di.php 3、框架使用容器类来执行public/index.php 4、运行效果还是一样 1、使用容器实现框架加载类运行 2、 创建框架容器类core/fm/Di.php 什么是容器&#xff1f;容器就相当于盒子&#xff0c;把很多类放里…

录音怎么转换成mp3格式?支持二十多种格式

录音怎么转换成mp3格式&#xff1f;在我们的日常生活和工作中&#xff0c;录音是一项非常有用的工具&#xff0c;随着手机以及录音设备越来越普及化&#xff0c;让录音这件事情变得非常的简单&#xff0c;录音可以帮助我们解决非常多的事情。例如通过录音&#xff0c;我们可以记…

Linux C++ OpenVINO 物体检测 Demo

目录 main.cpp #include <iostream> #include <string> #include <vector> #include <openvino/openvino.hpp> #include <opencv2/opencv.hpp> #include <dirent.h> #include <stdio.h> #include <time.h> #include …