A Convolutional Gated Recurrent Neural Network for Epileptic Seizure Prediction
ABSTRACT
在本文中,我们提出了一种卷积门控递归神经网络(CGRNN)来预测癫痫发作,基于从EEG数据中提取的代表信号的时间方面和频率方面的特征。使用波士顿儿童医院收集的数据集,CGRNN可以提前35分钟至5分钟预测癫痫发作。我们的实验结果表明,CGRNN的性能因患者而异。对于数据集中的患者,我们实现了89%的平均灵敏度和75.6%的平均准确度,平均假阳性率(FPR)为每小时1.6。
Introduction
在本文中,我们提出了一种新的卷积门控递归神经网络(CGRNN)来预测癫痫发作。它是CNN和GRU的结合。所提出的方法是一种针对患者的预测器,允许我们根据大脑的电活动(EEG信号)预测癫痫发作。我们的CGRNN考虑了EEG信号的时间方面以及频率方面。使用波士顿儿童医院收集的数据集,CGRNN可以提前35分钟至5分钟预测癫痫发作。我们的实验结果表明,CGRNN的性能因患者而异。对于数据集中的13名患者,我们实现了89%的平均灵敏度和75.6%的平均准确度,FPR范围为0到6.57每小时。
Background
--发作前期 是指癫痫发作前的一段时间[15]。
–发作期 从癫痫发作的初始症状(包括先兆)持续到异常活动结束。
–发作后期 发作结束时出现发作后阶段。这是癫痫症状的恢复期[4]。
–发作间期 是癫痫患者的正常状态(一生中的99%)。在这一阶段,这些人在脑电图记录中出现与癫痫症状无关的异常波形[15]。
相关工作
3.1癫痫发作检测
Thodoroff等人[20]提出了特定患者和交叉患者癫痫发作检测器。两者都基于从EEG记录的空间、时间和频率信息中提取的特征。EEG数据首先被转换成整合了空间域知识(即,电极的位置)的图像表示。然后,数据被输入到一个递归卷积神经网络,该网络结合了CNN和LSTM网络。
袁等人[23]提出的方法检测癫痫发作。它结合了从手工工程方法和深度学习方法中提取的特征。作者使用短时傅立叶变换(STFT)进行基于图像的表示,使用堆叠稀疏去噪自动编码器(SSDA)进行数据分类。采用基于SSDA的通道选择过程,通过考虑脑电信号通道的相关性来降低特征维数。
Talathi [19]提出了一个用于癫痫发作检测的深度学习框架。他开发了一个RNN与GRU隐藏单元的分类任务。原始输入数据在经过最少的预处理步骤后直接使用。该模型在验证数据集上实现了99.6%的准确性,并且可以在事件的前5 s内检测到大约98%的癫痫发作。
戈尔穆哈马迪等人[8]提出了两种用于癫痫检测的RNN变体:LSTM和GRU。这两种反复出现的变体都基于手工制作的特征,并且它们中的每一个都被集成到CNN中。实验表明,卷积LSTM网络的结果略好于卷积GRU网络。事实上,这两个网络都达到了30%的灵敏度,但是LSTM每天有6个错误警报(F A/24h ),而GRU每天有21个错误警报
Choi等人[3]提出了一种具有双向GRU模型的多尺度3D-CNN,用于跨患者癫痫检测。作者使用STFT从脑电信号中获得频谱和时间特征。他们还考虑了从电极位置提取的空间特征。建议的模型[3]在两个数据集上进行评估:波士顿儿童医院麻省理工学院头皮脑电图数据集(CHB-MIT)和首尔国立大学医院(SNUH)头皮脑电图数据集。该方法在第一个数据库上以0.5/小时的FPR获得了89%的灵敏度,在SNUH数据上以0.6/小时的FPR获得了89%的灵敏度。
3.2癫痫发作预测
Truong等人[21]将CNN应用于三个数据库:(1)弗莱堡医院颅内脑电图(iEEG)数据集,(2)chb-MIT数据集,以及(3)美国癫痫协会(AES)癫痫发作预测挑战数据集。他们在考虑CHBMIT数据库时,仅考虑了24个病例中13名患者的数据。这些患者每天发作少于10次,发作间期信号至少为3小时。STFT已应用于原始数据,以建立光谱图。提出的模型是面向病人的。对于上述3个数据集,它分别实现了81.4%、81.2%和75%的灵敏度以及0.06/小时、0.16/小时和0.21/小时的FPR。
在Kaggle组织的AES癫痫发作预测挑战赛中,Korshunova [11]实施了两种癫痫发作预测模型。她提出了一个CNN架构,还开发了一个基于逻辑回归和线性判别分析的分类器。比赛中使用的iEEG数据记录自5只狗和2个人。在输入模型之前,通过应用离散傅立叶变换(DFT)将其转换成光谱图。
Larmuseau [12]比较了三种用于癫痫发作预测的RNN:香草RNN、GRU和LSTM。使用了四个受试者的iEEG数据。他得出结论,GRU层优于其他网络,也比LSTM更快。RNNs在分析连续iEEG数据中是有效的,但是结果并不比现有技术中使用的其他方法更好
Hosseini等人[10]提出了一种基于云的实时癫痫发作预测方法。这项工作遵循三个主要步骤:(1)降维以降低算法计算复杂性并获得更快的响应,(2)堆叠式自动编码器作为自动特征提取和分类的深度学习方法,以及(3)云计算系统用于iEEG信号的实时分析。作者实现了94%的准确性和0.05/小时的FPR
Shahbazi和Aghajan [17]提出了一种基于CNN-LSTM和STFT的原始数据转换方法。只有当10个连续样本中的至少8个被检测为发作前信号时,才预期癫痫发作。该模型在CHB-MIT数据集上进行了评估。它的平均灵敏度为98.21%,FPR为0.13/h,平均预测时间为44.74分钟。
癫痫发作是在时间上划分为几个连续阶段的事件。在这个事件中,EEG片段是相关的。因此,神经网络中的递归方面被证明在癫痫发作预测中是重要的。事实上,当t时刻的输出依赖于前一个时,通常使用RNNs。关于不同的建议网络[3,8,12,19],GRU被证明是有效的脑电图数据分析。
4 CGRNN
为了以面向病人的方式在脑电信号的基础上预测癫痫发作,我们提出了一个基于CNN和GRU网络组合的深度学习模型,称为卷积门控递归神经网络(CGRNN)。
如图2所示,我们的方法遵循两个步骤:数据准备和数据分析。
数据准备步骤包括细化数据并将原始脑电图转化为频谱图,这使我们能够捕捉到代表癫痫发作的频谱和时间模式。数据分析步骤包括深度学习模型由一个CNN和一个GRU组成。卷积网络扮演了一个特征提取器的角色。它将基于图像的EEG表示作为输入,并将图像减少到更容易处理的形式,而不丢失基本特征。GRU从提取的特征中学习癫痫发作模式,以做出最终决定。
4.1数据准备
癫痫发作预测可以建模为一个二元分类问题。因此,在引入使用的数据集(CHB-MIT头皮脑电图数据库)后,我们选择了两个合适的类。在数据转换之前,我们还从数据集中排除了未使用的信号。
数据库:本文使用CHB-MIT头皮脑电图数据库。它是由麻省理工学院的一个团队与波士顿儿科医院合作收集的,可以从Physionet平台[7]下载。数据集由大约1136小时的大脑活动记录和198次癫痫发作组成。它包括多种类型的癫痫发作,并从不同年龄的两性中收集。五分之一的数据来自3至22岁的男性。
其余数据涉及年龄在1.5岁至19岁之间的女性。少数记录中还记录了其他非eeg信号,如心电图(ECG)或迷走神经刺激(VNS)。此外,我们在一些记录中使用了不同于国际10-20系统的电极位置和命名法。因此,要做的一个步骤是数据改装,以便为所有文件获得相同的通道。数据采样速率为每秒256个采样[7]。
数据提炼:利特等人。[13]证明复杂的癫痫样放电在癫痫发作前7小时是常见的,而类似癫痫发作的活动在实际发作前2小时变得更加频繁。此外,在发作状态前的50分钟内,累积的能量增加[13]。大多数现有的研究认为发作前阶段是癫痫发作开始前一小时。在我们的工作中,我们认为发作间期和发作前信号是两个最相关的分类,如图3所示。发作间期信号被定义为发作结束后1小时至下一次发作前1小时之间的时间段。
基于Truong等人的研究。[21]发作前信号是在癫痫发作前35分钟至5分钟提取的,这使我们能够采取必要的预防措施。此外,考虑到癫痫发作可能发生得非常近,我们有兴趣预测主要的危机,距离下一次危机大约不到30分钟。
在考虑了这两个类别后,我们得到了每个患者发作前和发作间期数据之间的不同比率,这是因为记录的癫痫发作次数不同。考虑到癫痫发作是罕见的事件,发作间期记录的数量高于发作前的数量。因此,我们得到了所有情况下不平衡的数据集。大多数机器学习算法假定来自不同类别的数据是均匀分布的。如果我们有不平衡的数据,我们的分类器就会偏向于实例比其他类多的类[9]。因此,为了解决这一问题,我们采用了与训练数据重叠的采样技术,以获得更多的发作前片段。对于每个患者,我们计算发作前和发作间期之间的比率。然后,我们在所有发作前记录上沿时间轴滑动一个30秒的窗口。
原始数据转换:根据脑电记录中的脑电节律检测异常的大脑活动。这些信号是根据它们的频率范围进行分类的,因此频率方面和时间方面在脑电数据分析中的重要性。时频特征通常用信号谱图来研究[1]。这是一种用于可视化信号频谱随时间变化的工具。它在一个二维图中表示三个参数。时间和频率是图形的两个轴。第三个参数表示特定时间特定频率的幅度,并通过中每个点的颜色来区分这个图片。光谱图是使用傅里叶变换生成的。本文在剔除无用信号的基础上,利用短时傅立叶变换将原始脑电信号转化为具有时间和频率轴的二维矩阵,这是一种适合于CNN的输入。短时傅立叶变换是一种常用的时频分析方法。在美洲大陆,脑电记录受到60赫兹电力线噪声的污染。
因此,使用了频率范围为57-63赫兹和117-123赫兹的带通滤波器。0赫兹分量也不包括在内。
4.2数据分析
我们使用图4所示的CGRNN模型进行数据分析。该模型的第一部分是具有3个卷积块的CNN。每个块包括具有校正的线性单元激活(RELU)的卷积层。最大池化层数用于减少计算次数,并防止模型在训练期间过度拟合。我们还在层之间使用批量归一化,以确保无论前一层的变化如何,每一层的输入分布都是相同的。然后,数据被展平和重塑,以被输送到具有256个单元的第一个门控递归层。下一个完全连接层使用Sigmoid激活功能。紧随其后的是具有100个单元的第二个门控递归层。该层的输出被馈送到Softmax层,以预测输入数据的分类概率。门控递归层的丢失率为0.5,以减少过拟合。
5 实验评估
建议的CGRNN是在使用TensorFlow 1.9.0后端和Kera 2.2的Python3.5中实现的。不同患者的模型被配置为在NVIDIA GeForce GTX 1080图形处理器上运行。
我们使用了25%的数据进行验证,75%用于训练。采用范畴交叉熵作为损失函数,对ADAM算法进行了优化采用算法对模型进行优化。它是随机梯度下降的推广。为了测试我们的模型,我们认为一个信号片段只有在该序列的10个连续样本中至少有8个被检测到为癫痫发作前时才是癫痫发作之前。计算出的指标是准确性、敏感度和fpr。我们还实现了一个CNN模型,其体系结构与Truong等人提出的相同。[21]。该模型考虑了文献[21]中定义的相同类别:发作前和发作后约4小时的发作间歇信号和发作前信号为发作前35分钟至5分钟的时间段。因此,实现的CGRNN和CNN模型都可以提前预测35min到5min之间的癫痫发作。
对于癫痫发作预测任务,最关键的部分是确定所有阳性病例。错过一名癫痫发作但未被发现的患者将是至关重要的。此外,我们收到的错误警报越少,解决方案就越好。因此,我们的模型评估主要基于敏感度和FPR值,对Truong等人所考虑的13例患者的研究结果。[21]表1所示。Truong等人提出的指标之间的差异。[21]而用实现的CNN得到的结果是由于数据的预处理步骤以及神经网络中权值的随机初始化。
模型的表现因病人而异。事实上,对于患者1,2,10,18,19,我们的CGRNN取得了更好的分类结果。对于3,13和20例患者,我们获得了比CNN方法更好的敏感性值,但我们获得了更高的FPR。我们的模型对患者14和21取得了类似的结果,对患者3、9和23的敏感性值较低。13例患者的平均准确率为75.6%,平均敏感性为89%。FPR范围为0 - 6.57 /小时,平均FPR为1.6 /小时。每个患者的表现差异与可用数据的特征有关,即记录的癫痫发作次数和事件之间的时间间隔。
6 结论
我们提出了一种新的卷积门控复发神经网络(CGRNN)来预测癫痫发作。所提出的方法是一种患者特异性预测器,使我们能够在脑电图信号的基础上预测癫痫发作,同时考虑到时间方面以及信号频率内容。我们的实验评估使用了公开可用的数据集CHB-MIT。
我们的CGRNN可以提前预测35分钟到5分钟之间的癫痫发作,对数据集中的13例患者的平均敏感性为89%,平均准确率为75.6%,平均FPR为1.6 /小时。这证明了所提方法在癫痫发作预测任务中的有效性。
未来的工作有几个方面。首先,我们想要研究实现的神经网络的权重初始化和正则化技术是否对评估指标有影响,例如零和He初始化。此外,我们计划在大规模数据集上训练模型,以实现更高的性能,例如弗莱堡医院iEEG数据集和TUH EEG癫痫语料库。同时,我们计划通过记录突尼斯Sfax大学医院的脑电图信号来建立一个真实的数据库。最后,我们还打算研究基于注意机制的通道选择技术和设计神经架构。