AI视野·今日CS.Sound 声学论文速览
Mon, 25 Sep 2023
Totally 1 papers
👉上期速览✈更多精彩请移步主页
Daily Sound Papers
Deepfake audio as a data augmentation technique for training automatic speech to text transcription models Authors Alexandre R. Ferreira, Cl udio E. C. Campelo 为了训练产生可靠结果的转录器模型,需要大量且多样化的标记数据集。找到具有必要特征的此类数据是一项具有挑战性的任务,尤其是对于不如英语流行的语言。此外,生成此类数据需要付出巨大的努力,而且通常还需要金钱。因此,缓解此问题的策略是使用数据增强技术。在这项工作中,我们提出了一个基于深度伪造音频的数据增强框架。为了验证生成的框架,使用现有的深度伪造和转录模型进行了实验。选择了印度人用英语制作的语音克隆器和数据集,确保数据集中存在单一口音。 |
Chinese Abs From Machine Translation |
Papers from arxiv.org
更多精彩请移步主页
pic from pexels.com