首次使用回声状态网络 (ESN) 和语音特征进行帕金森病 (PD) 预测

news2025/1/14 18:02:27

       帕金森病(Parkinson's disease, PD)是一种使人衰弱的神经退行性疾病,它需要进行精确和早期的诊断,以便为患者提供有效的治疗和护理。这种疾病是由James Parkinson在1817年首次确定的,其特征是多巴胺生成神经元的退化。多巴胺的不足导致了一系列症状,包括静止性震颤、肌肉僵硬、运动迟缓(姿势不稳定)、以及其他重要特征,如睡眠障碍、心律失常、便秘和语音变化,这些都是帕金森病的关键指标。

      帕金森病的准确及时诊断对于有效管理症状和适当的治疗至关重要,因为错误或延迟的诊断可能会给患者带来巨大的身体和经济成本。相反,一个精确的诊断可以防止不必要的干预措施,并减少整体的医疗开支。因此,帕金森病诊断领域的研究人员和医疗专业人员正在积极寻找新的解决方案,这些方案提供高诊断准确性和最优的效率。

    目前关于帕金森病诊断的研究大致可以分为以下三个主要类别

  • 第一类是基于临床症状和实验室测试来诊断PD,例如单光子发射计算机断层扫描(SPECT)测量和基于RNA的方法。然而,这些医学测试可能成本高昂且不易获得。此外,这些测试的分析和解释通常需要专业知识,引入了结果解释中可能出现人为错误的可能性。
  • 第二类侧重于专家对受影响个体展示的身体状况进行检查。然而,专家的可用性可能受限,并且人为错误仍然是一个因素。
  • 第三类涉及利用人工智能(AI)技术来分析症状并协助诊断。已经探索了各种方法,包括应用Relief技术来分析三维SPECT图像,以及使用卷积神经网络对脑电图(EEG)图像进行分类。然而,这些方法通常需要昂贵的设备来进行图像记录和准备。

      研究表明,89%的帕金森病患者经历了语音障碍,其特征是表达不清、声音刺耳和气喘,以及音调单一。因此,最近基于AI的研究已经集中在将语音分析作为诊断帕金森病的一种手段前面介绍的《PPINtonus (深度学习音调分析)帕金森病早期检测系统》也属于这个范畴。

      ESN在语音识别以及在诊断各种疾病(如乳腺癌、预测I型糖尿病的血糖浓度和检测口腔癌)中具有多种能力,但在帕金森病诊断的语音分析背景下,ESN的使用,特别是与特征缩减结合使用,尚未得到广泛探索本文提出一种诊断模型,能够在保证高准确率的同时,最小化假阴性率(即漏诊率),核心思想就是利用回声状态网络 (ESN) 和特征选择技术,从语音特征中提取信息,实现 PD 的诊断。

1 方法

1.1 数据准备

数据集涉及一个包含31名个体的数据库,其中23人被诊断出患有帕金森病(PD),并在牛津大学寻求治疗。科罗拉多州丹佛的国家声音与语言中心记录了这些参与者的语音信号。从每个受试者那里收集了多种类型的语音样本,包括持续元音、数字、单词和短句,总共得到了195个语音录音(每个患者大约六个录音)。从这些录音中提取了一组22个线性和时/频基础特征,这些特征并非相互独立的。

为了减少分类器过拟合的风险,现有数据被随机划分为两个不同的集合:一个包含156个样本的训练集和一个包含39个样本的测试集。这种划分方法允许分类器在训练数据上进行训练,并随后使用独立的测试数据进行评估。

1.2 回声状态网络结构  

回声状态网络 (Echo State Network, ESN)是一种为预测非线性时间序列和分析复杂系统而设计的递归神经网络(RNN)。ESN 由三个层次组成:

  • 输入层: 接收输入数据,例如语音信号的声学特征。
  • 隐藏层(池): 也称为“池”,包含大量稀疏连接的内部单元。池的权重是随机初始化的,并且在训练过程中保持不变。
  • 输出层: 也称为“读取层”,包含输出神经元,其权重可以通过学习进行调整。

1.2.1 工作原理

  • 初始化: 随机初始化输入层和池的权重,以及池的泄漏率。
  • 状态更新: 对于每个输入数据点,根据输入权重和池的权重计算池的激活状态。池的激活状态会根据泄漏率进行更新,以保留之前的激活状态。
  • 输出计算: 使用池的激活状态和输出权重计算输出值。
  • 训练: 通过最小化输出值与目标值之间的差异来调整输出权重。

1.2.2 ESN 的优势

  • 简单易用: 结构简单,训练过程相对容易,并且可以快速收敛。
  • 非线性能力: 可以处理非线性数据,并捕捉数据中的复杂模式。
  • 泛化能力: 具有良好的泛化能力,可以在新的数据上表现良好。
  • 鲁棒性:对输入噪声和权重初始化不敏感。

1.3 特征选择

1.3.1 为什么需要进行特征选择

  • 样本数量有限: 本研究中,训练数据样本数量有限,因此需要避免过拟合,选择最具代表性的特征。
  • 减少模型复杂性: 特征选择可以减少模型的输入维度,降低模型的复杂性和计算量,提高模型的训练和推理效率。
  • 提高诊断精度: 选择最具影响力的特征可以提高模型的诊断精度,减少误诊和漏诊的风险。

1.3.2 特征选择方法

  • 方差分析(ANOVA): ANOVA 是一种统计方法,用于评估多个组之间的均值是否存在显著差异。在本研究中,ANOVA 用于评估每个特征与目标变量(健康或帕金森病)之间的统计显著性。
  • F-值: ANOVA 分析会生成每个特征的 F-值,F-值越高,表明该特征与目标变量之间的关系越强。

1.3.3 特征选择过程

  • 计算 F-值: 对每个特征进行 ANOVA 分析,并计算其 F-值。
  • 选择特征: 根据 F-值选择最具影响力的特征。本研究中,选择了 F-值最高的 4 个特征:MDVP:Fo(Hz)、spread1、spread2 和 PPE。

1.4 模型训练

2.2 评估过程

2.3 评估结果

  • 初始化: 随机初始化 ESN 的输入权重、池权重和泄漏率。
  • 贝叶斯优化: 使用贝叶斯优化方法来调整 ESN 的超参数,例如池的大小、泄漏率等,以获得最佳性能。
  • 状态更新: 对于每个输入数据点,根据输入权重和池的权重计算池的激活状态。池的激活状态会根据泄漏率进行更新,以保留之前的激活状态。
  • 输出计算: 使用池的激活状态和输出权重计算输出值。

    2 评估

    2.1 评估指标

  • 准确率 (Accuracy): 衡量模型正确预测的比例,即正确预测的样本数占总样本数的比例。
  • 精确率 (Precision): 衡量模型正确预测为正类的比例,即正确预测为正类的样本数占预测为正类的样本数的比例。
  • 召回率 (Recall): 衡量模型正确识别所有正类的比例,即正确预测为正类的样本数占实际正类样本数的比例。
  • 假阴性率 (False Negative Rate): 衡量模型错误地将正类预测为负类的比例,即错误预测为负类的正类样本数占实际正类样本数的比例。
  • 数据划分: 将数据集划分为训练集和测试集,用于训练和评估模型。
  • 模型训练: 使用训练集数据训练模型,并调整模型的参数。
  • 模型评估: 使用测试集数据评估模型的性能,并计算各种评估指标。
  • 模型比较: 将 ESN 与其他分类算法进行比较,分析其优缺点。

2.3.1 准确率

  • KNN 方法在准确率方面表现最佳,但与其他高准确率方法(ESN、RF 和 XGBoost)的差异并不显著。
  • ESN、RF 和 XGBoost 方法在准确率方面也表现出色,与 KNN 方法相当。
  • 所有方法的准确率都存在一定的波动,这与数据集的固有不平衡性有关。

2.3.2 精确率

  • ESN 和 RF 方法的精确率略高于其他方法。
  • 所有方法的精确率都保持在较高水平,说明模型对 PD 的识别能力较强。

2.3.3 召回率(灵敏度)

  • ESN 方法的召回率最高,说明其能够有效识别出 PD 患者,减少漏诊。
  • 其他方法的召回率也较高,说明模型对 PD 的诊断能力较强。

2.3.4 假阴性率

  • ESN 方法的假阴性率最低,在 83% 的情况下假阴性率低于 8%。
  • 其他方法的假阴性率相对较高,说明 ESN 在减少误诊方面具有显著优势。
  • 假阴性率是 PD 诊断中非常重要的指标,因为漏诊可能导致患者错过最佳治疗时机,造成严重后果。

2.3.5 模型比较

  • ESN 在准确率、精确率和召回率方面与其他高准确率方法相当,但在假阴性率方面具有显著优势。
  • ESN 在处理有限数据集方面具有优势,能够在保持高准确率的同时,最大限度地减少误诊。
  • KNN 方法在准确率方面表现最佳,但在假阴性率方面不如 ESN。
  • RF 和 XGBoost 方法在准确率、精确率和召回率方面表现良好,但假阴性率略高于 ESN。
  • SVM 和决策树方法的性能略低于其他方法。

2.3.6 总体结论

  • ESN 是一种有效的 PD 诊断方法,尤其在假阴性率方面具有显著优势。
  • 特征选择对于提高 ESN 模型的性能至关重要。
  • ESN为基于人工智能的 PD 诊断提供了新的思路,有望提高诊断准确率和效率,减少误诊和漏诊,改善患者预后。

3 相关知识

3.1 声学特征

3.1.1 基频特征

  • MDVP:Fo(Hz): 平均声带振动频率,即基频的平均值。
  • MDVP:Fhi(Hz): 基频的最大值。
  • MDVP:Flo(Hz): 基频的最小值。

3.1.2 振幅特征

  • MDVP:Jitter(%): 抖动,即基频周期之间差异的百分比。
  • MDVP:Jitter(Abs): 抖动的绝对值,即基频周期之间差异的平均值(以微秒为单位)。
  • MDVP:RAP: 相对振幅扰动,即基频振幅之间差异的百分比。
  • MDVP:PPQ: 五点周期扰动商,即基频周期之间差异的百分比。
  • Jitter:DDP: 周期差异差异的平均绝对值除以平均周期,用于评估基频的稳定性。
  • MDVP:Shimmer: 闪烁,即基频振幅之间差异的百分比。
  • MDVP:Shimmer(dB): 闪烁的分贝值。
  • Shimmer:APQ3: 三点振幅扰动商,即基频振幅之间差异的百分比。
  • Shimmer:APQ5: 五点振幅扰动商,即基频振幅之间差异的百分比。
  • MDVP:APQ: 十一点振幅扰动商,即基频振幅之间差异的百分比。
  • Shimmer:DDA: 连续周期之间振幅差异的平均绝对值。

3.1.3 谐波特征

  • NHR: 噪声谐波比,即噪声能量与谐波能量之比。
  • HNR: 谐波噪声比,即谐波能量与噪声能量之比。

3.1.4 其他特征

  • RPDE: 再现周期密度熵,用于评估基频的稳定性。
  • DFA: 去趋势波动分析,用于评估语音信号的复杂性。
  • D2: 相关系数维数,用于评估语音信号的非线性特性。
  • PPE: 基频周期熵,用于评估基频的随机性。
  • Spread1: 一种基频变化的非线性度量。
  • Spread2: 另一种基频变化的非线性度量。

3.2 常用分类器

  • 随机森林(RF)是一种利用决策树集成的机器学习算法。与其他方法不同,它通过构建多个决策树,并为每棵树随机选择特征子集。这些树的预测结果通过聚合它们的投票来组合,得票数最多的类别成为最终预测。RF以其能够减轻过拟合和捕捉变量的非线性和交互效应而闻名。训练过程的并行化显著减少了所需的训练时间。通过组合每棵树的预测结果,RF有效地降低了方差,提高了整体预测精度。
  • K-最近邻(KNN)是一种基于最近邻规则的简单分类算法。它通过计算测试样本与所有训练样本之间的距离,将测试样本分配给其k个最近邻居中最普遍的类别。KNN已应用于分析PD患者的不同声音特征,包括抖动、闪烁和谐波噪声比,并在检测帕金森病方面显示出适度的准确率
  • 支持向量分类器(SVC)是一种传统的监督机器学习技术,广泛用于分类和回归任务。它依赖于核方法,以其能够分割决策边界,有效地分离数据点类别而著称。在PD检测的背景下,SVC通过分析各种运动特征,如震颤幅度、加速度和快速度,展示了高准确率
  • 极端梯度提升(XGBoost)是一种集成学习算法,结合了多个机器学习模型,特别是梯度提升决策树。它基于不同的决策标准构建多个决策树,类似于随机森林。XGBoost以其速度和效率而闻名,使其成为各种应用的首选

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1853950.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每日一题——Python代码实现力扣1. 两数之和(举一反三+思想解读+逐步优化)五千字好文

一个认为一切根源都是“自己不够强”的INTJ 个人主页:用哲学编程-CSDN博客专栏:每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 菜鸡写法 代码分析 时间复杂度分析 空间复杂度分析 改进建议 我要更强 方法1: 使…

项目训练营第四天

项目训练营第四天 前端部分修改 前端用的是WebStorm和Ant Design Pro框架 Ant Design Pro是比较流行的一个前端登陆、注册、管理框架,能帮我们快速实现前端界面的开发 效果大致如图 使用起来也极为方便,首先在WebStorm 控制台中输入如下命令 # 使用…

Linux的基本指令第二篇

1.cat - 查看文件 语法:cat [选项] [文件] 功能: 查看目标文件的内容 -b 对非空输出行编号 -n对输出的所有行编号 -s不输出多行空行 现有一个文件test.c cat -n test.c cat -b test.c cat -s test.c 创建一个新文件 加入源文件的内容 || …

力扣每日一题 6/23 字符串/模拟

博客主页:誓则盟约系列专栏:IT竞赛 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ 520.检测大写字母【简单】 题目: 我们定义,在以下…

飞行堡垒系列_键盘灯开关

飞行堡垒系列键盘灯可以通过键盘上的"Fn 方向键"控制 演示机型品牌型号:飞行堡垒8 系统版本:Windows 11 飞行堡垒键盘灯可通过键盘上的"Fn方向键"控制。 " Fn 下方向键 "为减弱键盘灯光,多按几次键盘灯就可…

软考初级网络管理员__软件单选题

1.在Excel 中,设单元格F1的值为56.323,若在单元格F2中输入公式"TEXT(F1,"¥0.00”)”,则单元格F2的值为()。 ¥56 ¥56.323 ¥56.32 ¥56.00 2.要使Word 能自动提醒英文单…

web安全渗透测试十大常规项(一):web渗透测试之JAVA反序列化

渗透测试之PHP反序列化 1. Java反序列化1.1 Java安全-反序列化-原生序列化类函数1.1.1 原生序列化类函数:1.2 Java安全-SpringBoot框架-泄漏&CVE1. Java反序列化 1、序列化与反序列化 序列化:将内存中的对象压缩成字节流 反序列化:将字节流转化成内存中的对象2、为什么…

Springboot整合MinIO实现系统文件的便捷式管理实例

一、MinIO简介 1.基础描述 MinIO 是一个高性能的对象存储系统,用于存储大量非结构化数据。它以简洁、高效、可靠和高扩展性著称,能够胜任各种数据密集型任务。MinIO 采用了与 Amazon S3 兼容的 API,使得用户无需额外学习即可上手使用。下面…

PriorityQueue详解(含动画演示)

目录 PriorityQueue详解1、PriorityQueue简介2、PriorityQueue继承体系3、PriorityQueue数据结构PriorityQueue类属性注释完全二叉树、大顶堆、小顶堆的概念☆PriorityQueue是如何利用数组存储小顶堆的?☆利用数组存储完全二叉树的好处? 4、PriorityQueu…

SpringBoot-通过注解@Vuale从全局配置文件中获取数据

除了通过注解ConfigurationProperties让JavaBean的所有属性和全局配置文件中配置项建立关联关系外,我们spring提供了一个Value注解,获取全局配置文件中的某个配置项的数据 接下来,我们重点说一下两个注解的的区别: Configuration…

汽车网络安全 -- 漏洞该如何管理

目录 1.漏洞获取途径汇总 2.CAVD的漏洞管理规则简析 2.1 通用术语简介 2.2 漏洞评分指标 2.3.1 场景参数 2.3.2 威胁参数 2.3.3 影响参数 2.3 漏洞等级判定 ​3.小结 在汽车网络安全的时代背景下,作为一直从事车控类ECU基础软件开发的软件dog,…

【html】用html写一个博物馆首页

效果图&#xff1a; 二级导航&#xff1a; 源码&#xff1a; <!DOCTYPE html> <html lang"zh"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><l…

基于Java作业管理系统设计和实现(源码+LW+调试文档+讲解等)

&#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者&#xff0c;博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌&#x1f497; &#x1f31f;文末获取源码数据库&#x1f31f; 感兴趣的可以先收藏起来&#xff0c;…

八爪鱼现金流-029,网站裂变解决方案,10hongbao

现在完成renwu&#xff0c;可以得10hongbao &#xff01;&#xff01;&#xff01; 八爪鱼现金流 八爪鱼 背景&#xff1a; 个人开发者tuiguang 项目。一个用户推给两个用户&#xff0c;两个用户又分别推给两个用户&#xff0c;就实现了指数级增长。 业务场景分析&#xff1a;…

LeetCode 算法:翻转二叉树 c++

原题链接&#x1f517;&#xff1a;翻转二叉树 难度&#xff1a;简单⭐️ 题目 给你一棵二叉树的根节点 root &#xff0c;翻转这棵二叉树&#xff0c;并返回其根节点。 示例 1&#xff1a; 输入&#xff1a;root [4,2,7,1,3,6,9] 输出&#xff1a;[4,7,2,9,6,3,1] 示例 …

示例:WPF中推荐一个支持折叠展开的GridSpliter自定义控件GridSplitterBox

一、目的&#xff1a;推荐一个支持折叠展开的GridSpliter自定义控件GridSplitterBox 二、效果 实现功能&#xff1a;设置菜单显示位置&#xff0c;最小宽度&#xff0c;最大宽度&#xff0c;位置持久化保存 三、环境 VS2022 Net7 四、使用方式 1、安装nuget包&#xff1a;H…

Kafka~基础原理与架构了解

Kafka是什么 Kafka我们了解一直认为是一个消息队列&#xff0c;但是其设计初&#xff0c;是一个&#xff1a;分布式流式处理平台。流平台具有三个关键功能&#xff1a; 消息队列&#xff1a;发布和订阅消息流&#xff0c;这个功能类似于消息队列&#xff0c;这也是 Kafka 也被…

Windows Api如何创建一个快捷方式并且在开始菜单搜索到自己的应用

原文链接&#xff1a;http://cshelloworld.com/home/detail/1804473083243925504 当我们点击win10系统搜索框的时候&#xff0c;输入名称 &#xff0c;win10会帮助我们匹配到对应的应用。这里搜索框实际上就是windows系统的开始菜单。 接下来我们随便找一个应用&#xff0c;右…

如和完全免费快速访问外网?有亿点点不便利罢了

很鸡肋&#xff0c;但是可以试试 这个手机是真的可以使用谷歌的 不得不说有点意思&#xff0c;但肯定没啥用 地址跳转

光纤传感器十大品牌

十大光纤传感器品牌-光纤光栅传感器厂家哪家好-Maigoo品牌榜