自动化构音障碍严重程度分类:声学特征与深度学习技术的研究
文章目录
- 自动化构音障碍严重程度分类:声学特征与深度学习技术的研究
-
- 思维导图
- 摘要
- I. 引言
-
- A. 动机与相关工作
- II. 数据库
- III. 实验设计
-
- A. 分析 MFCC 和 CQCC
- B. 分析语言障碍特定特征
- C. 分析 i-向量
- IV. 特征设计
- V. 分类器设计
-
- A. 基线分类器
- B. 深度学习分类器
- VI. 结果与讨论
-
- A. 分析 MFCC 和 CQCC (E1)
- B. 分析语言障碍特定特征 (E2)
- C. 分析 i-向量 (E3)
- D. 评估模型的说话者依赖性
- E. 讨论
- VII. 结论
原文直达传送门:Automated Dysarthria Severity Classification:A Study on Acoustic Features and Deep Learning Techniques
思维导图
摘要
- 评估构音障碍的严重程度可以提供患者改善的见解,并协助治疗计划的制定。
- 本研究比较了使用各种深度学习架构和声学特征的构音障碍严重程度分类。
- 评估的架构包括:DNN、CNN、GRU 和 LSTM,使用基本特征如 MFCC 和 CQCC。
- 分析了来自韵律、发音、音质和声门功能的演讲障碍特定特征。
- 探索通过 i-向量实现低维特征表示,并使用 DNN 进行分类。
- 在说话者依赖情况中实现了 93.97% 的准确率,而在说话者独立情况下实现了 49.22% 的准确率。