【语音之家】AI产业沙龙 —— 三星语言智能团队ICASSP2023论文分享会

news2024/7/6 19:49:02

 由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组三星电子中国研究院语音之家希尔贝壳共同主办的【语音之家】AI产业沙龙——三星语言智能团队ICASSP2023论文分享会,将于2023年4月25日18:30-20:20线上直播。

沙龙简介

三星电子中国研究院专注于人工智能、5G/6G通信技术研究和标准化等前沿技术,并与清华大学、北京大学、中国科学院、上海交通大学等十余所国内一流大学及科研机构建立长期合作,成立联合实验室、联合培养博士后人才等。进行先行研究的同时,三星电子中国研究院将语言技术的语音识别、唤醒、合成、自然语言理解和人脸识别、Camera等计算机视觉的核心技术在三星的旗舰产品中商用落地,给用户带来最好的移动智能体验。

三星电子中国研究院在ICASSP2023上共有8篇论文被接收,涉及多种信号处理,包括音频、文本、图像、视频、多模态等,从声音分离、音频事件检测、文本预训练、人脸检测、图像语义分割、视频编解码及身份识别等多个任务上探索前沿技术。除此之外,三星电子中国研究院还在首届e-Prevention challenge中获得第一名。在本次沙龙中,三星语言智能团队将对其中语音文本以及多模态信号处理方面的成果进行分享。

主持人

钱彦旻  上海交通大学计算机科学与工程系教授,博士生导师,国家优秀青年基金获得者

钱彦旻

上海交通大学计算机科学与工程系教授,博士生导师,国家优秀青年基金获得者

简介:钱彦旻,上海交通大学计算机科学与工程系教授,博士生导师。清华大学博士,英国剑桥大学工程系博士后。国家优秀青年基金、吴文俊人工智能自然科学奖一等奖(第一完成人)获得者。现为IEEE高级会员、ISCA会员,同时也是国际开源项目Kaldi语音识别工具包的13位创始成员之一。担任InterSpeech, ISCSLP等国际会议的领域主席和TPC委员;IEEE T-ASLP, IEEE J-STSP, IEEE SPL, ICASSP, InterSpeech等期刊和国际会议审稿人。有10余年从事智能语音及语言处理、人机交互、模式识别及机器学习的研究和产业化工作经验。在本领域的一流国际期刊和会议上发表学术论文200余篇,Google Scholar引用总数10000余次,申请60余项中美专利,合作撰写和翻译多本外文书籍。3次获得领域内国际权威期刊和会议的最优论文奖,3次带队获得国际评测冠军。作为负责人和主要参与者参加了包括国家自然科学基金、国家脑科学计划、国家重点研发计划、国防JKW、国家863、英国EPSRC等多个项目。目前的研究领域包括:语音识别,说话人和语种识别,语音抗噪与分离,语音情感感知,自然语言理解,深度学习建模,多媒体信号处理等。

报告嘉宾

杨 磊

三星电子中国研究院音频算法工程师、首席技术专家

嘉宾简介:杨磊,三星电子中国研究院音频算法工程师、首席技术专家,主要从事通话中的语音增强、语音分离等领域的研究和商用化落地。

分享主题:超短注册时间的目标说话人提取模型

摘要:目标说话人提取任务是从多个说话人的混合语音中提取目标说话人的声音。该技术可应用于语音通话、视频会议、视频编辑、会议纪要、目标人语音提取等场景。使用该技术时需要提前注册目标说话人的语音,但是在实际应用中,注册时的语音过长会降低用户使用的积极性。因此,研究超短注册时间的目标说话人提取技术是必要的。对此,三星电子中国研究院的音频算法团队提出了一种新的VE-VE框架来支持超短注册语音,本次分享将围绕该技术进行介绍。

徐 亮

三星电子中国研究院实习生、北京理工大学研究生

嘉宾简介:徐亮,北京理工大学研究生、三星电子中国研究院实习生。实习期间,在王立众和王晶老师共同指导下,分别在InterSpeech2022和ICASSP2023各发表论文一篇,主要研究方向为声音事件检测、AI 语音编解码等。

分享主题:加入预训练模型的半监督声音事件检测

摘要:声音事件检测已经应用到了消费、医疗、工业中,为计算机、嵌入式设备与外界的智能交互提供了技术支撑。在当前,由于相关数据标签的标注困难,以及目标事件本身容易被外界噪声所掩盖,声音事件检测仍然存在不小的挑战。而预训练网络所提取的深层特征能够提供更丰富、更泛化的特征,为声音事件检测带来新的可能。本次分享将围绕半监督的声音事件检测任务,加入预训练网络特征,进一步提高声音事件检测的准确度。

庄毅萌

三星电子中国研究院自然语言处理算法工程师

嘉宾简介:庄毅萌,三星电子中国研究院自然语言处理算法工程师,主要负责语言理解和机器翻译等技术的研发和落地。

分享主题:文本表征预训练中的启发式掩码方案

摘要:掩码语言模型预训练提供了一种学习上下文语义表征的标准化方法,该方法通过估计给定上下文的随机掩码词元的条件概率来重建损坏的文本序列。我们试图利用模型本身的语言知识,以轻量级和动态的方式增强其预训练。我们研究了一种启发式的词元掩码方案,其中深度网络和浅层网络预测不一致的词元更有可能被掩码。该方法可应用于掩码语言模型预训练中,同时保证训练效果和效率。实验表明,用启发式掩码方案预训练的掩码语言模型在各种下游任务中优于先前的方案。

温 亮

三星电子中国研究院音视频算法工程师

嘉宾简介:温亮,三星电子中国研究院音视频算法工程师,主要从事基于人工智能的音视频编码以及语音增强等领域的研究和成果落地工作。

分享主题:面向视频编码的畸变感知的神经网络插值滤波器

摘要:视频是用户感知、记录、传播和接收的重要媒体形式,涉及日常录像、视频通话到专业影视节目制作等多种应用领域,需要满足多样性的质量和传输需求。随着视频的分辨率以及帧率的提升,视频压缩的需求也越来越迫切。视频编码通过对视频帧的预测、变换、滤波等工具对视频数据进行压缩以满足用户存储和传输需求。随着人工智能与神经网络技术的发展,基于神经网络的视频编码成为火热的研究方向。本次分享将介绍三星电子中国研究院在视频编码中的帧间预测工具中采用神经网络方法的探索工作。

武金婷

三星电子中国研究院多模态算法工程师

嘉宾简介:武金婷,三星电子中国研究院多模态算法工程师,主要负责生理信号处理、健康状态监测等技术的研究及健康相关应用的开发。

分享主题:ICASSP 2023 E-Prevention竞赛分享——基于可穿戴设备数据的用户身份识别系统

摘要:近年来,借助可穿戴设备采集的生理信号和日常行为进行运动追踪和健康监测已成为各大科研机构和厂商的研究热点。然而,利用生理信号推断心理状态和精神疾病的研究仍在探索中。其中难点之一在于用户的日常行为习惯和生理表征不同,信号存在很大的个体偏差,进而影响健康相关功能的准确性和鲁棒性。ICASSP 2023 E-Prevention(Person Identification and Relapse Detection from Continuous Recordings of Biosignals)竞赛提供了一个包含长期连续生物信号记录的数据集,试图通过挖掘用户数据中的个体差异性和独特性来解决这个问题。我们参与了该竞赛Track 1,即识别智能手表佩戴者的赛道的角逐,并获得了第一名。本次分享将围绕我们在竞赛中构建的基于可穿戴设备数据的用户身份识别系统展开介绍。

沙龙议程

 

参加方式

直播将通过CSDN进行直播,手机端、PC端可同步观看

👇👇👇

https://live.csdn.net/room/weixin_48827824/fmWHziYn

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/450516.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ERP系统有哪些功能模块?

一、ERP系统是什么 现在市面上的管理软件有很多,不少企业都会去选择一些操作简单便捷的软件,优化工作流程,提高工作效率,其中ERP系统就是常见的一种,ERP是企业资源计划(Enterprise Resource Planning)的简称&#xff…

深入了解Lock同步锁的优化

大家好,我是易安。 今天我们来简单谈谈在JDK1.5之后,Java提供的Lock同步锁。 相对于需要JVM隐式获取和释放锁的Synchronized同步锁,Lock同步锁(以下简称Lock锁)需要的是显示获取和释放锁,这就为获取和释放锁…

防止机械/移动硬盘休眠 - NoSleepHD

防止机械/移动硬盘休眠 - NoSleepHD 前言解决方案计算机硬盘移动硬盘 前言 机械硬盘休眠后唤醒需要一定时间,且频繁的启动和停止并不有利于硬盘的寿命,因此可根据自身需求防止机械硬盘休眠,下文以Win10系统为例介绍解决方案。 值得一提的是…

Java核心技术 卷1-总结-9

Java核心技术 卷1-总结-9 使用异常机制的技巧为什么要使用泛型程序设计定义简单泛型类泛型方法类型变量的限定 泛型类型的继承规则 使用异常机制的技巧 1.异常处理不能代替简单的测试。 使用异常的基本规则是:只在异常情况下使用异常机制。 2.不要过分地细化异常。…

第三章(3):深入理解Spacy库基本使用方法

第三章(3):深入理解Spacy库基本使用方法 本章主要介绍了Spacy库的基本使用方法,包括安装、加载语言模型、分句、分词、词性标注、停用词识别、命名实体识别、依存分析和词性还原等内容。重点介绍了每个步骤的具体实现方式和应用场…

【TortoiseGit】安装和配置

转自 【TortoiseGit】TortoiseGit安装和配置详细说明_No8g攻城狮的博客-CSDN博客 一、TortoiseGit 简介 TortoiseGit 是基于 TortoiseSVN 的 Git 版本的 Windows Shell 界面。它是开源的,可以完全使用免费软件构建。 TortoiseGit 支持你执行常规任务,…

出道即封神的ChatGPT,现在怎么样了?ChatGPT想干掉测试人员,做梦去吧

从互联网的普及到智能手机,都让广袤的世界触手而及,如今身在浪潮中的我们,已深知其力。 前阵子爆火的ChatGPT,不少人保持观望态度。现如今,国内关于ChatGPT的各大社群讨论,似乎沉寂了不少,现在…

Mosquitto vs NanoMQ | 2023 MQTT Broker 对比

引言 Mosquitto 和 NanoMQ 都是用 C/C 开发的快速轻量的开源 MQTT Broker,完全支持 MQTT 3.1.1 和 5.0。 虽然 Mosquitto 和 NanoMQ 都具有轻量级和低资源消耗的特点,但它们的架构设计却截然不同。Mosquitto 采用单线程模式,而 NanoMQ 则基…

数据结构:单向链表(无头非循环)

朋友们、伙计们,我们又见面了,本期来给大家解读一下数据结构方面有关链表的相关知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! C语言专栏:C语言:从入门到…

【云原生】prometheus监控告警之安装部署alertmanager实战

前言 🏠个人主页:我是沐风晓月 🧑个人简介:大家好,我是沐风晓月,阿里云社区博客专家😉😉 💕 座右铭: 先努力成长自己,再帮助更多的人 &#xff0c…

Python基础知识:绝对/相对路径等

1 Python处理相对/绝对路径 由于本人在导入数据时,十分喜欢相对路径(在数据的上一级文件中,新建文件夹保存处理整个代码处理过程),因此,将首先简单介绍下Python中相对/绝对路径的处理。 1.1 绝对路径 一…

状态压缩DP-蒙德里安的梦想

题意 求把 NM 的棋盘分割成若干个 12 的长方形,有多少种方案。 例如当 N2,M4 时,共有 5 种方案。当 N2,M3 时,共有 3 种方案。 如下图所示: 输入格式 输入包含多组测试用例。 每组测试用例占一行&#xff0…

Jupyter notebook安装教程

文章目录 前言一、安装步骤1、安装 Python 编译器2、安装 jupyter3、运行 Jupyter notebook 二、 更改打开文件位置和快捷启动方式1、更改打开文件位置2、创建快捷启动方式 前言 Jupyter Notebook 是以网页的形式打开,可以在网页页面中直接编写代码和运行代码&…

20230421 | 203. 移除链表元素、707. 设计链表、206. 反转链表

1、203. 移除链表元素 方法1:不添加虚拟节点方式,但是要注意处理删除头部的数据 时间复杂度 O(n) 空间复杂度 O(1) /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}* List…

婚恋交友app开发中需要注意的安全问题

前言 随着移动设备的普及,婚恋交友app已经成为了人们生活中重要的一部分。但是,这些应用的开发者需要确保应用的安全性,以保护用户的隐私和数据免受攻击。本文将介绍在婚恋交友app开发中需要注意的安全问题。 在当今数字化时代,…

狗屁不通文章生成器下载-狗屁不通生成器网址

狗屁不通文章生成器 狗屁不通文章生成器(也称为“吹牛生成器”)是使用自然语言处理技术和机器学习算法生成随机文章的工具。这些文章往往没有意义,因为它们是从各种不相关的话语中随机组合而成的。 虽然这些文章看起来毫无意义,…

显卡GPU与CUDA

文章目录 1 什么是GPU1.1 独立显卡1.2 核心显卡 2 驱动3 深度学习显卡CUDA4 GPU VS CPU5 深度学习环境配置中各软件的关系windows下判断有无NVIDIA GPU16G512G8核14核 1 什么是GPU GPU就是显卡Graphics Processing Unit 图像处理单元显卡主要用于在屏幕上显示图像,…

ROS学习第二十六节——机器人仿真相关组件

1.URDF URDF是 Unified Robot Description Format 的首字母缩写,直译为统一(标准化)机器人描述格式,可以以一种 XML 的方式描述机器人的部分结构,比如底盘、摄像头、激光雷达、机械臂以及不同关节的自由度.....,该文件可以被 C 内置的解释器…

服务(第十篇)Nginx和tomcat反向代理(动静分离)

正向代理: 当用户想访问某一网址时,用户先访问代理服务器,然后由代理服务器向目标网址发送请求最终将数据返回代理服务器,最后代理服务器将数据返回给用户这一过程我们称之为正向代理。 反向代理:基本流程是与正向代理…

毕业-单片机-嵌入式~三年经历回顾

入行嵌入式软件开发 20年6月疫情第一次缓和、实操51单片机;20年9月郑州实习、温湿度采集类低功耗产品、初次接触ARM Cortex M0/M3 单片机;21年5月毕业来到杭州、不懂应届生的宝贵青春!匆匆忙忙进厂~人生中第一个项目:…