第一期

news2026/2/16 12:08:35

ICASSP 2023 论文预讲会是由CCF语音对话与听觉专委会、语音之家主办，旨在为学者们提供更多的交流机会，更方便、快捷地了解领域前沿。活动将邀请 ICASSP 2023 录用论文的作者进行报告交流。

ICASSP （International Conference on Acoustics, Speech, and Signal Processing）是IEEE信号处理学会（Signal Processing Society）的学术年会，是全世界规模最大、最全面的声学、语音和信号处理及其应用方面的国际会议，也是语音技术领域最具影响力的顶级国际会议。内容涵盖语音识别、语音合成、语音增强、自然语言处理、机器学习等多个领域。

ICASSP 2023 论文预讲会第一期邀请到清华大学语音与音频技术实验室（THUsatlab）做本次会议的专场分享，欢迎大家观看。

实验室概况

语音与音频技术实验室（SATLab，Speech and Audio Technology Lab）致力于研究语音、音频、音乐、听觉信息处理的理论、方法及其应用。主要研究方向为语音识别与分析（包括语音识别、关键词检索、语种识别、声纹识别、情感识别等）、音频识别与分析（包括音频检索、音频事件检测、音频场景识别等）、音乐与声学信号处理，机器学习等。

清华大学语音与音频技术实验室（THUsatlab）专场

时间：5月10日 19:00 ~ 20:00

形式：线上

议程：每位嘉宾分享30分钟（含5分钟QA）

嘉宾&主题

姜安柏

嘉宾简介：姜安柏，清华大学电子系一年级博士生，本科毕业于清华大学电子系，研究方向为机器音频的异常检测

分享主题：基于GAN的无监督机器音频异常检测与定位

摘要：传统的自编码器与PCA具有相似的降噪功能，不利于异常检测。本文引入了一个判别器，为自编码器提供语义层面的梯度。两个网络按照GAN的模式对抗训练，从两个角度进行异常检测。相比于其它无监督模型，我们的模型在DCASE异常检测数据集上取得明显提升。

陈旭初

嘉宾简介：陈旭初，清华大学电子系三年级研究生，研究方向为音频事件检测、阿尔茨海默症检测等。研究生期间，参加了DCASE2022、ICASSP ADReSS-M等比赛，均取得了较好的名次。

分享主题：基于副语言特征和预训练特征的跨语言阿尔茨海默症检测

Cross-lingual Alzheimer's Disease detection based on paralinguistic and pre-trained features

摘要：阿尔茨海默症，俗称“老年痴呆”，是一种严重的神经退行性疾病，现有的治疗手段仅能维持或减缓患者认知能力衰退的速度，不能逆转已经恶化的痴呆。这种疾病的最初症状之一是语言能力的恶化，随着患者病情的加重，患者的失语、表达困难等症状更加明显，因此,基于语音的阿尔兹海默症检测成为一个比较火热的研究方向。ICASSP 2023 ADReSS-M（Multilingual Alzheimer's Dementia Recognition through Spontaneous Speech）比赛提供了一个包含多语种的语音数据集，用以研究哪些特征可以用于跨语言阿尔茨海默症检测。本次分享介绍了清华大学语音与音频技术实验室在副语言特征和预训练特征方面的探索工作。