中文读唇总动员：CNVSRC 2023 视觉语音识别挑战赛启动

中文读唇总动员：CNVSRC 2023 视觉语音识别挑战赛启动

news2026/2/12 23:42:01

由 NCMMSC 2023 组委会发起，清华大学、北京邮电大学、海天瑞声、语音之家共同主办的 CNVSRC 2023 中文连续视觉语音识别挑战赛即日启动，诚邀参与报名。

赛事官网：http://cnceleb.org/competition

视觉语音识别，也称唇语识别，是一项通过口唇动作来推断发音内容的技术。该技术在公共安全、助老助残、视频验真等领域具有重要应用。当前，唇语识别的研究方兴未艾，虽然在独立词、短语等识别上取得了长足进展，但在大词表连续识别方面仍面临巨大挑战。特别是对于中文而言，由于缺乏相应的数据资源，该领域的研究进展受到了限制。为此，清华大学在2023年发布了CN-CVS数据集[1]，成为首个大规模的中文视觉语音识别数据库，为进一步推动大词表连续视觉语音识别 (LVCVSR) 提供了可能。关于CN-CVS数据集的更多信息，可访问数据库官网 http://cnceleb.org 。

为推动这一研究方向的发展，清华大学联合北京邮电大学、海天瑞声和语音之家将在 NCMMSC 2023 举办中文连续视觉语音识别挑战赛 (CNVSRC, Chinese Continuous Visual Speech Recognition Challenge)。本次赛事以 CN-CVS 中文视觉语音识别数据库为基础数据，评估在录音室朗读 (Reading) 和网络演讲 (Speech) 两类场景下的 LVCVSR 系统的性能。比赛结果将在 NCMMSC 2023 会议上宣布并颁奖。

图1 CN-CVS 数据库官网 http://cnceleb.org

任务设置

CNVSRC 2023 共设有两个任务：

T1：特定说话人视觉语音识别 (Single-speaker VSR)
T2：多个说话人视觉语音识别 (Multi-speaker VSR)

前者侧重于针对某一特定说话人进行大量数据调优后的性能，后者侧重于系统对非特定说话人的基础性能。每个任务根据训练数据不同，又分为固定赛道 (Fixed Track) 和开放赛道 (Open Track)。

固定赛道仅允许使用 CN-CVS 数据集即各任务发布的开发集作为训练集，旨在验证算法的先进性。开放赛道则可以使用任何数据进行训练，旨在验证当前技术能够达到的性能上限。清华大学将提供固定赛道上的基线系统代码，供参赛者作为参考。

参赛方式

CNVSRC 2023 对任何个人和机构开放。目前，竞赛官网已经启动并接受报名。关于竞赛规则、时间节点等更多信息，可进入竞赛官网。

浏览器访问： http://cnceleb.org/competition

[1] C. Chen, D. Wang, T.F. Zheng, CN-CVS: A Mandarin Audio-Visual Dataset for Large Vocabulary Continuous Visual to Speech Synthesis, ICASSP, 2023.

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1049893.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

为什么我的Windows 10笔记本电脑明明什么软件都没开，风扇却一直在转？

为什么我的Windows 10笔记本电脑明明什么软件都没开，风扇却一直在转？

2023年9月29日，周五上午这两天我的笔记本电脑一开机，风扇就一直在转，而且还没停过，挺吵的即使什么软件都没开，还在那转，莫名其妙的。后来我去任务管理器按照CPU使用情况来排序，发现原来是W…

阅读更多...

如何自动转发接收的请求报头？

如何自动转发接收的请求报头？

了解OpenTelemetry的朋友应该知道，为了将率属于同一个请求的多个操作（Span）串起来，上游应用会生成一个唯一的TraceId。在进行跨应用的Web调用时，这个TraceId和代表跟踪操作标识的SpanID一并发给目标应用，W3…

阅读更多...

经过认证的工具链对安全关键型应用意味着什么？

经过认证的工具链对安全关键型应用意味着什么？

作者：IAR 安全关键型应用，在很多人看来是个专业的词汇，但其实它离我们的日常生活很近，比如汽车驾驶系统、飞机控制系统、电梯运行系统、医疗设备等与我们息息相关的事物都可以纳入安全关键型应用的范畴。对于这类应用&#xff…

阅读更多...

SAP入门到放弃系列之QM检验计划-Part1

SAP入门到放弃系列之QM检验计划-Part1

文章目录一、概述1.1、检验计划抬头1.2、检验计划工序二、系统操作2.1、测试数据准备：2.2、创建检验计划一、概述检验计划是用来描述如何对一种或多种物料进行质量检验操作的主数据。在检验计划中，可以定义检验的工序顺序以及可用于检验特征的数据规…

阅读更多...

排序：归并（Merge）排序算法分析

排序：归并（Merge）排序算法分析

1.归并操作归并:把两个或多个已经有序的序列合并成一个。 2路归并：二合一k路归并：k合一结论:m路归并，每选出一个元素需要对比关键字m-1次。 2.算法思想核心操作:把数组内的两个有序序列归并为一个。例如： 3.代码实现将…

阅读更多...

数据集笔记： Porto

数据集笔记： Porto

数据来源：Taxi Trajectory Data_数据集-阿里云天池 (aliyun.com) 1 数据介绍葡萄牙波尔图市运行的所有442辆出租车的全年轨迹（从2013年7月1日至2014年6月30日） 2 读取数据 import pandas as pdtrapd.read_csv(C:/Users/16000/Download…

阅读更多...

C语言中动态内存管理

C语言中动态内存管理

前言：为什么存在动态内存分配，为什么要用动态内存分配，动态内存分配的意义。鸡汤：有了坚持不一定成功,但没有坚持，就注定失败，各位也要努力坚持提升自己！ 动态内存分配动态内存函数&#xff1a…

阅读更多...

【Linux】 du 命令使用

【Linux】 du 命令使用

问题 No space left on device 请求接口返回 java.io.IOException: No space left on device 设备上没有剩余空间怎么解决问题： 查看这篇文章：一次 linux 服务器磁盘使用情况排查我们提到命令：du -sh * 到底这个命令是干什么的咱们…

阅读更多...

EXPLAIN 语句输出的各个列解释

EXPLAIN 语句输出的各个列解释

title: “EXPLAIN 语句输出的各个列解释” createTime: 2022-03-06T15:52:4108:00 updateTime: 2022-03-06T15:52:4108:00 draft: false author: “ggball” tags: [“mysql”] categories: [“db”] description: “” EXPLAIN 语句输出的各个列解释列名描述id在一个大的查…

阅读更多...

多线程(基础)

多线程(基础)

文章目录 1. 线程的声明周期1.1 JDK 中用 Thread.State 枚举表示了线程的几种状态1.2 线程状态转换图 2. 线程的同步2.1 Synchronized 线程同步机制 3. 互斥锁3.1 注意事项和细节3.2 守护线程 setDaemon()方法 4. 线程的死锁5. 释放锁6. 课后练习 1. 线程的声明周期 1.1 JDK 中…

阅读更多...

四通道信息融合下的齿轮箱故障诊断（Python代码，SVM模型和CNN模型进行对比实验，解压缩即可运行，有详细中文注释）

四通道信息融合下的齿轮箱故障诊断（Python代码，SVM模型和CNN模型进行对比实验，解压缩即可运行，有详细中文注释）

1.效果运行视频：四通道信息融合下的齿轮箱故障诊断（Python代码，SVM模型和CNN模型进行对比实验）_哔哩哔哩_bilibili 用到的库： 2.数据集介绍：数据免费下载链接（不要积分）&#xff1a…

阅读更多...

什么是跨站请求伪造（CSRF）攻击？如何防止它？

什么是跨站请求伪造（CSRF）攻击？如何防止它？

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 什么是跨站请求伪造（CSRF）攻击？⭐ 如何防止CSRF攻击？⭐ 写在最后 ⭐ 专栏简介前端入门之旅：探索Web开发的奇妙世界欢迎来到前端入门之旅！感兴趣的可以订阅本专栏哦…

阅读更多...

xxl-job 2.2之后版本高版本executor未授权访问漏洞

xxl-job 2.2之后版本高版本executor未授权访问漏洞

xxl-job 低版本executor未授权访问低版本的executor未授权访问漏洞是 POST /run HTTP/1.1 Host: your-ip:9999 Accept-Encoding: gzip, deflate Accept: */* Accept-Language: en User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like G…

阅读更多...

26663-2011 大型液压安全联轴器课堂随笔

26663-2011 大型液压安全联轴器课堂随笔

声明本文是学习GB-T 26663-2011 大型液压安全联轴器. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围本标准规定了大型液压安全联轴器的分类、技术要求、试验方法及检验规则等。本标准适用于联接两同轴线的传动轴系，可起到限制…

阅读更多...

基于Linux 系统聊天室登录与注册实现（03）

基于Linux 系统聊天室登录与注册实现（03）

上一篇我们已经讲了如何搭建一个多线程的服务器模型，可以支持多个客户端同时连接服务器，本篇我们来实现多个客户端，如何实现向服务器注册信息，并实现登录的功能。数据结构接着上一篇的实例代码继续增加功能。要实现注册和登录…

阅读更多...

（Java）关于easyExcel合并单元格

（Java）关于easyExcel合并单元格

今天过客遇到一个需要合并单元格的业务，但是之前过客用的一直是easyExcel框架，所以这次也不想去使用其他的框架，今天就跟大家讲讲easyExcel怎么进行单元格的合并。首先使用easyExcel进行导出的实体类一样是依据之前那样写，之后在…

阅读更多...

宠物玩具在欧洲销售CE认证EN71测试标准

宠物玩具在欧洲销售CE认证EN71测试标准

CE认证的EN71测试宠物玩具办理： 宠物玩具是用来给宠物玩耍，基于将宠物作为人类伙伴关系而诞生的一种玩具类型，这种玩具的存在就是让人类和自己的宠物真正的互动起来，在情感上面得到更大的交流和互动。那么宠物玩具出口到欧盟市场…

阅读更多...

支付宝电脑网站支付，异步通知

支付宝电脑网站支付，异步通知

一：异步通知是支付宝回调商户的服务器，所以这个地址需要通过外网访问，在真实项目中都会有对应的服务器，但是在测试中只有使用内网穿透工具推荐使用NATAPP-内网穿透基于ngrok的国内高速内网映射工具配置好内网穿透之后不要忘记…

阅读更多...

目标检测如何演变：从区域提议和 Haar 级联到零样本技术

目标检测如何演变：从区域提议和 Haar 级联到零样本技术

目录一、说明二、目标检测路线图 2.1 路线图（一般） 2.2 路线图（更传统的方法） 2.3 路线图（深度学习方法） 2.4 对象检测指标的改进三、传统检测方法 3.1 维奥拉-琼斯探测器 (2001) 3.2 HOG探测器…

阅读更多...

最大内切圆算法计算裂缝宽度

最大内切圆算法计算裂缝宽度

本文这里是对CSDN上另一位博主的代码进行了整理： 基于opencv的裂缝宽度检测算法（计算轮廓最大内切圆算法） 我觉得这位博主应该是上传了一个代码草稿，我对其进行了重新整理，并添加了详细的注释。 import cv2 import …

阅读更多...

推荐文章

最新文章