基础1-用于癫痫发作预测的卷积门控递归神经网络

news2025/1/20 10:57:48

A Convolutional Gated Recurrent Neural Network for Epileptic Seizure Prediction

ABSTRACT

在本文中,我们提出了一种卷积门控递归神经网络(CGRNN)来预测癫痫发作,基于从EEG数据中提取的代表信号的时间方面和频率方面的特征。使用波士顿儿童医院收集的数据集,CGRNN可以提前35分钟至5分钟预测癫痫发作。我们的实验结果表明,CGRNN的性能因患者而异。对于数据集中的患者,我们实现了89%的平均灵敏度和75.6%的平均准确度,平均假阳性率(FPR)为每小时1.6。

Introduction

在本文中,我们提出了一种新的卷积门控递归神经网络(CGRNN)来预测癫痫发作。它是CNN和GRU的结合。所提出的方法是一种针对患者的预测器,允许我们根据大脑的电活动(EEG信号)预测癫痫发作。我们的CGRNN考虑了EEG信号的时间方面以及频率方面。使用波士顿儿童医院收集的数据集,CGRNN可以提前35分钟至5分钟预测癫痫发作。我们的实验结果表明,CGRNN的性能因患者而异。对于数据集中的13名患者,我们实现了89%的平均灵敏度和75.6%的平均准确度,FPR范围为0到6.57每小时。

Background

--发作前期 是指癫痫发作前的一段时间[15]。

发作期 从癫痫发作的初始症状(包括先兆)持续到异常活动结束。

发作后期 发作结束时出现发作后阶段。这是癫痫症状的恢复期[4]。

发作间期 是癫痫患者的正常状态(一生中的99%)。在这一阶段,这些人在脑电图记录中出现与癫痫症状无关的异常波形[15]。

相关工作

3.1癫痫发作检测

Thodoroff等人[20]提出了特定患者和交叉患者癫痫发作检测器。两者都基于从EEG记录的空间、时间和频率信息中提取的特征。EEG数据首先被转换成整合了空间域知识(即,电极的位置)的图像表示。然后,数据被输入到一个递归卷积神经网络,该网络结合了CNN和LSTM网络。

袁等人[23]提出的方法检测癫痫发作。它结合了从手工工程方法和深度学习方法中提取的特征。作者使用短时傅立叶变换(STFT)进行基于图像的表示,使用堆叠稀疏去噪自动编码器(SSDA)进行数据分类。采用基于SSDA的通道选择过程,通过考虑脑电信号通道的相关性来降低特征维数。

Talathi [19]提出了一个用于癫痫发作检测的深度学习框架。他开发了一个RNN与GRU隐藏单元的分类任务。原始输入数据在经过最少的预处理步骤后直接使用。该模型在验证数据集上实现了99.6%的准确性,并且可以在事件的前5 s内检测到大约98%的癫痫发作。

戈尔穆哈马迪等人[8]提出了两种用于癫痫检测的RNN变体:LSTM和GRU。这两种反复出现的变体都基于手工制作的特征,并且它们中的每一个都被集成到CNN中。实验表明,卷积LSTM网络的结果略好于卷积GRU网络。事实上,这两个网络都达到了30%的灵敏度,但是LSTM每天有6个错误警报(F A/24h ),而GRU每天有21个错误警报

Choi等人[3]提出了一种具有双向GRU模型的多尺度3D-CNN,用于跨患者癫痫检测。作者使用STFT从脑电信号中获得频谱和时间特征。他们还考虑了从电极位置提取的空间特征。建议的模型[3]在两个数据集上进行评估:波士顿儿童医院麻省理工学院头皮脑电图数据集(CHB-MIT)和首尔国立大学医院(SNUH)头皮脑电图数据集。该方法在第一个数据库上以0.5/小时的FPR获得了89%的灵敏度,在SNUH数据上以0.6/小时的FPR获得了89%的灵敏度。

3.2癫痫发作预测

Truong等人[21]将CNN应用于三个数据库:(1)弗莱堡医院颅内脑电图(iEEG)数据集,(2)chb-MIT数据集,以及(3)美国癫痫协会(AES)癫痫发作预测挑战数据集。他们在考虑CHBMIT数据库时,仅考虑了24个病例中13名患者的数据。这些患者每天发作少于10次,发作间期信号至少为3小时。STFT已应用于原始数据,以建立光谱图。提出的模型是面向病人的。对于上述3个数据集,它分别实现了81.4%、81.2%和75%的灵敏度以及0.06/小时、0.16/小时和0.21/小时的FPR。

在Kaggle组织的AES癫痫发作预测挑战赛中,Korshunova [11]实施了两种癫痫发作预测模型。她提出了一个CNN架构,还开发了一个基于逻辑回归和线性判别分析的分类器。比赛中使用的iEEG数据记录自5只狗和2个人。在输入模型之前,通过应用离散傅立叶变换(DFT)将其转换成光谱图。

Larmuseau [12]比较了三种用于癫痫发作预测的RNN:香草RNN、GRU和LSTM。使用了四个受试者的iEEG数据。他得出结论,GRU层优于其他网络,也比LSTM更快。RNNs在分析连续iEEG数据中是有效的,但是结果并不比现有技术中使用的其他方法更好

Hosseini等人[10]提出了一种基于云的实时癫痫发作预测方法。这项工作遵循三个主要步骤:(1)降维以降低算法计算复杂性并获得更快的响应,(2)堆叠式自动编码器作为自动特征提取和分类的深度学习方法,以及(3)云计算系统用于iEEG信号的实时分析。作者实现了94%的准确性和0.05/小时的FPR

Shahbazi和Aghajan [17]提出了一种基于CNN-LSTM和STFT的原始数据转换方法。只有当10个连续样本中的至少8个被检测为发作前信号时,才预期癫痫发作。该模型在CHB-MIT数据集上进行了评估。它的平均灵敏度为98.21%,FPR为0.13/h,平均预测时间为44.74分钟。

癫痫发作是在时间上划分为几个连续阶段的事件。在这个事件中,EEG片段是相关的。因此,神经网络中的递归方面被证明在癫痫发作预测中是重要的。事实上,当t时刻的输出依赖于前一个时,通常使用RNNs。关于不同的建议网络[3,8,12,19],GRU被证明是有效的脑电图数据分析。

4 CGRNN

为了以面向病人的方式在脑电信号的基础上预测癫痫发作,我们提出了一个基于CNN和GRU网络组合的深度学习模型,称为卷积门控递归神经网络(CGRNN)。

如图2所示,我们的方法遵循两个步骤:数据准备和数据分析。

数据准备步骤包括细化数据并将原始脑电图转化为频谱图,这使我们能够捕捉到代表癫痫发作的频谱和时间模式。数据分析步骤包括深度学习模型由一个CNN和一个GRU组成。卷积网络扮演了一个特征提取器的角色。它将基于图像的EEG表示作为输入,并将图像减少到更容易处理的形式,而不丢失基本特征。GRU从提取的特征中学习癫痫发作模式,以做出最终决定。

4.1数据准备

癫痫发作预测可以建模为一个二元分类问题。因此,在引入使用的数据集(CHB-MIT头皮脑电图数据库)后,我们选择了两个合适的类。在数据转换之前,我们还从数据集中排除了未使用的信号。

数据库:本文使用CHB-MIT头皮脑电图数据库。它是由麻省理工学院的一个团队与波士顿儿科医院合作收集的,可以从Physionet平台[7]下载。数据集由大约1136小时的大脑活动记录和198次癫痫发作组成。它包括多种类型的癫痫发作,并从不同年龄的两性中收集。五分之一的数据来自3至22岁的男性。

其余数据涉及年龄在1.5岁至19岁之间的女性。少数记录中还记录了其他非eeg信号,如心电图(ECG)或迷走神经刺激(VNS)。此外,我们在一些记录中使用了不同于国际10-20系统的电极位置和命名法。因此,要做的一个步骤是数据改装,以便为所有文件获得相同的通道。数据采样速率为每秒256个采样[7]。

数据提炼:利特等人。[13]证明复杂的癫痫样放电在癫痫发作前7小时是常见的,而类似癫痫发作的活动在实际发作前2小时变得更加频繁。此外,在发作状态前的50分钟内,累积的能量增加[13]。大多数现有的研究认为发作前阶段是癫痫发作开始前一小时。在我们的工作中,我们认为发作间期和发作前信号是两个最相关的分类,如图3所示。发作间期信号被定义为发作结束后1小时至下一次发作前1小时之间的时间段。

 

基于Truong等人的研究。[21]发作前信号是在癫痫发作前35分钟至5分钟提取的,这使我们能够采取必要的预防措施。此外,考虑到癫痫发作可能发生得非常近,我们有兴趣预测主要的危机,距离下一次危机大约不到30分钟。

在考虑了这两个类别后,我们得到了每个患者发作前和发作间期数据之间的不同比率,这是因为记录的癫痫发作次数不同。考虑到癫痫发作是罕见的事件,发作间期记录的数量高于发作前的数量。因此,我们得到了所有情况下不平衡的数据集。大多数机器学习算法假定来自不同类别的数据是均匀分布的。如果我们有不平衡的数据,我们的分类器就会偏向于实例比其他类多的类[9]。因此,为了解决这一问题,我们采用了与训练数据重叠的采样技术,以获得更多的发作前片段。对于每个患者,我们计算发作前和发作间期之间的比率。然后,我们在所有发作前记录上沿时间轴滑动一个30秒的窗口。

原始数据转换:根据脑电记录中的脑电节律检测异常的大脑活动。这些信号是根据它们的频率范围进行分类的,因此频率方面和时间方面在脑电数据分析中的重要性。时频特征通常用信号谱图来研究[1]。这是一种用于可视化信号频谱随时间变化的工具。它在一个二维图中表示三个参数。时间和频率是图形的两个轴。第三个参数表示特定时间特定频率的幅度,并通过中每个点的颜色来区分这个图片。光谱图是使用傅里叶变换生成的。本文在剔除无用信号的基础上,利用短时傅立叶变换将原始脑电信号转化为具有时间和频率轴的二维矩阵,这是一种适合于CNN的输入。短时傅立叶变换是一种常用的时频分析方法。在美洲大陆,脑电记录受到60赫兹电力线噪声的污染。

因此,使用了频率范围为57-63赫兹和117-123赫兹的带通滤波器。0赫兹分量也不包括在内。

4.2数据分析

我们使用图4所示的CGRNN模型进行数据分析。该模型的第一部分是具有3个卷积块的CNN。每个块包括具有校正的线性单元激活(RELU)的卷积层。最大池化层数用于减少计算次数,并防止模型在训练期间过度拟合。我们还在层之间使用批量归一化,以确保无论前一层的变化如何,每一层的输入分布都是相同的。然后,数据被展平和重塑,以被输送到具有256个单元的第一个门控递归层。下一个完全连接层使用Sigmoid激活功能。紧随其后的是具有100个单元的第二个门控递归层。该层的输出被馈送到Softmax层,以预测输入数据的分类概率。门控递归层的丢失率为0.5,以减少过拟合。

5 实验评估

建议的CGRNN是在使用TensorFlow 1.9.0后端和Kera 2.2的Python3.5中实现的。不同患者的模型被配置为在NVIDIA GeForce GTX 1080图形处理器上运行。

我们使用了25%的数据进行验证,75%用于训练。采用范畴交叉熵作为损失函数,对ADAM算法进行了优化采用算法对模型进行优化。它是随机梯度下降的推广。为了测试我们的模型,我们认为一个信号片段只有在该序列的10个连续样本中至少有8个被检测到为癫痫发作前时才是癫痫发作之前。计算出的指标是准确性、敏感度和fpr。我们还实现了一个CNN模型,其体系结构与Truong等人提出的相同。[21]。该模型考虑了文献[21]中定义的相同类别:发作前和发作后约4小时的发作间歇信号和发作前信号为发作前35分钟至5分钟的时间段。因此,实现的CGRNN和CNN模型都可以提前预测35min到5min之间的癫痫发作。

对于癫痫发作预测任务,最关键的部分是确定所有阳性病例。错过一名癫痫发作但未被发现的患者将是至关重要的。此外,我们收到的错误警报越少,解决方案就越好。因此,我们的模型评估主要基于敏感度和FPR值,对Truong等人所考虑的13例患者的研究结果。[21]表1所示。Truong等人提出的指标之间的差异。[21]而用实现的CNN得到的结果是由于数据的预处理步骤以及神经网络中权值的随机初始化。

模型的表现因病人而异。事实上,对于患者1,2,10,18,19,我们的CGRNN取得了更好的分类结果。对于3,13和20例患者,我们获得了比CNN方法更好的敏感性值,但我们获得了更高的FPR。我们的模型对患者14和21取得了类似的结果,对患者3、9和23的敏感性值较低。13例患者的平均准确率为75.6%,平均敏感性为89%。FPR范围为0 - 6.57 /小时,平均FPR为1.6 /小时。每个患者的表现差异与可用数据的特征有关,即记录的癫痫发作次数和事件之间的时间间隔。

6 结论

我们提出了一种新的卷积门控复发神经网络(CGRNN)来预测癫痫发作。所提出的方法是一种患者特异性预测器,使我们能够在脑电图信号的基础上预测癫痫发作,同时考虑到时间方面以及信号频率内容。我们的实验评估使用了公开可用的数据集CHB-MIT。

我们的CGRNN可以提前预测35分钟到5分钟之间的癫痫发作,对数据集中的13例患者的平均敏感性为89%,平均准确率为75.6%,平均FPR为1.6 /小时。这证明了所提方法在癫痫发作预测任务中的有效性。

未来的工作有几个方面。首先,我们想要研究实现的神经网络的权重初始化和正则化技术是否对评估指标有影响,例如零和He初始化。此外,我们计划在大规模数据集上训练模型,以实现更高的性能,例如弗莱堡医院iEEG数据集和TUH EEG癫痫语料库。同时,我们计划通过记录突尼斯Sfax大学医院的脑电图信号来建立一个真实的数据库。最后,我们还打算研究基于注意机制的通道选择技术和设计神经架构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/155149.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

priority_queue的介绍及使用(18)

目录 1、priority_queue的介绍 2、priority_queue的使用 3、priority_queue的模拟实现 1、简单实现一个大堆的 2、带仿函数的 1、初识仿函数 2、priority_queue带仿函数版本 3、其他 1、priority_queue的介绍 1、优先队列是一种容器适配器,根据严格的弱排序…

Unity 3D 物理引擎简介 || Unity 3D 物理材质|| Unity 3D 力(AddForce)

Unity 3D 物理引擎简介 早期的游戏并没有强调物理引擎的应用,当时无论是哪一种游戏,都是用极为简单的计算方式做出相应的运算就算完成物理表现,如超级玛丽和音速小子等游戏。 较为常见的物理处理是在跳跃之后再次落到地上,并没有…

百万级数据的导出解决方案

一、传统POI的的版本优缺点比较首先我们知道POI中我们最熟悉的莫过于WorkBook这样一个接口,我们的POI版本也在更新的同时对这个几口的实现类做了更新;HSSFWorkbook : 这个实现类是我们早期使用最多的对象,它可以操作Excel2003以前&#xff08…

SAP 系统内核版本详解

前言:之前两篇简单介绍了ABAP 7.40的新特性,那么有的时候会有这样的情况,根据新特性写代码的时候校验会不通过,这又是为啥呢?会不会跟SAP的版本有关系呢? 那么,首先我们就来看一下在SAP系统中如…

基于TC397的Bootloader开发过程中遇到的问题记录

问题11 现象:刷新流程结束之后上位机通过22服务AFFC读取刷新计数时,刷新计数会偶发地置12 分析思路:尝试用单步调试的方法复现该现象,程序中涉及到刷新计数的更新有两处,一是在34服务中擦flash前,二是在31服…

【数据结构】栈及其经典面试题详解

目录前言一、栈的介绍二、数据类型重定义三、栈的结构四、栈中的常见操作五、测试栈六、栈的常见面试题前言 前面学习的线性表中包含顺序表和链表,这两种数据结构允许在任意位置进行插入和删除,那么有没有一种数据结构是不能在任意位置进行插入删除&…

全面解读MinION纳米孔测序技术及应用

全面解读MinION纳米孔测序技术及应用 link:https://www.seqchina.cn/467.html 【测序中国】 paper:The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community https://pubmed.ncbi.nlm.nih.gov/27887629/ 纳米孔测序技术…

知识蒸馏 Knowledge distillation(学习笔记)

知识蒸馏概述 蒸馏:把大的 复杂的东西变成小的纯净的东西 在知识蒸馏中 大的模型为 教师模型(teacher)臃肿 集成 牛逼 复杂的 小的 为 学生模型(student)小的精干的 轻量化的 这里有一个知识的迁移 因为落地实…

相关性模型与回归模型(例题代码)

一、相关性模型(SPSS) 相关性模型涉及到两种最为常用的相关系数: 皮尔逊person相关系数斯皮尔曼spearman等级相关系数 1、皮尔逊相关系数 相关性可视化 总结: 1.如果两个变量本身就是线性的关系,那么皮尔逊相关系…

儿子小伟再婚,新儿媳紧锁眉头,农民歌唱家大衣哥有些过分了

虽然都知道大衣哥儿子小伟结婚,这一天早晚都要到来,但是却没有想到来得那么快,大衣哥儿子小伟的婚礼,在悄无声息中结束了。说起大衣哥儿子小伟,这已经不是第一次结婚了,因为结过婚有经验,这一次…

Linux CFS调度器之pick_next_task函数

文章目录前言一、pick_next_task二、pick_next_task_fair参考资料前言 在内核执行__schedule函数,进程任务切换的时候,__schedule函数函数会调用pick_next_task让调度器从就绪队列中选择最合适的一个进程运行,如下所示: static …

Nerdctl 原生支持 Nydus 加速镜像

文|李楠(GitHub ID : loheagn) 北京航空航天大学 21 级研究生 云原生底层系统的开发和探索工作。 本文 6369 字 阅读 16 分钟 OSPP 开源之夏是由中科院软件研究所“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动。旨在鼓励在…

关于whl,你想知道的

一、whl是什么?whl文件时以wheel格式保存的python安装包,Wheel是Python发行版的标准内置包格式。WHL文件包含Python安装的所有文件和元数据,其中还包括所使用的Wheel版本和打包的规范。WHL文件使用Zip压缩进行压缩,实际上也是一种…

二、TCO/IP---Ethernet和IP协议

TCP/ip协议栈 OSI模型TCP/IP协议栈应用层,表示层,会话层应用层传输层主机到主机层(传输层)网络层网络层数据链路层,物理层网络接入层 Ethernet协议 以太网,实现链路层的数据传输和地址封装(MA…

【Qt】Qt中的拖放操作实现——拖放文件以及自定义拖放操作

文章目录Qt的拖放操作使用拖放打开文件自定义拖放操作文章参考《Qt Creator快速入门(第三版)》。 Qt的拖放操作 拖放操作分为拖动Drag和放下Drop,Qt提供了强大的拖放机制,可在帮助文档中通过Drag and Drop关键字查看。 在Qt中&a…

ArcGIS基础实验操作100例--实验78按栅格分区统计路网

本实验专栏参考自汤国安教授《地理信息系统基础实验操作100例》一书 实验平台:ArcGIS 10.6 实验数据:请访问实验1(传送门) 高级编辑篇--实验78 按栅格分区统计路网 目录 一、实验背景 二、实验数据 三、实验步骤 (…

【数据结构】队列详解

前言 前面我们学习了一种数据结构:栈,栈是一种只允许在一端尽进行插入删除的数据结构,而今天我们将学习另一种数据结构:队列,队列是一种支持在一端进行插入,在另一端进行删除的数据结构。 一、队列的介绍…

PHP反序列化字符串逃逸

PHP反序列化字符串逃逸 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录PHP反序列化字符串逃逸前言一、关于反序列化和序列化二、[0ctf 2016]unserialize二、prize_p5[NSSCTF]前言 例如:最近日常刷题玩…

常用的传输码介绍

文章目录前导知识1.AMI码2.HDB3码3.PST码4.数字双相码5.CMI码6.nBmB码前导知识 在介绍常用的传输码之前,先简单介绍一下直流分量。 信号的直流分量就是信号的平均值,它是一个与时间无关的常数,直流分量的数学公式表示为: 判断有…

基于轻量级YOLOv5+Transformer的汽车车损检测识别分析系统

将传统NLP领域提出来的Transformer技术与yolo目标检测模型融合已经成为一种经典的做法,早在之前的很多论文里面就有这种组合应用的出现了,本文主要是借鉴前文的思路,开发基于yolov5transformer的汽车车损检测识别模型,首先看下效果…