核磁机器学习 | 基于机器学习的fMRI分类

导读

本文通过提取最显著的特征，将大脑图像分类为正常和异常，并对大脑各种状态的磁共振成像(MRI)进行了研究。本文描述了一种基于小波变换的方法，首先对图像进行分解，然后使用各种特征选择算法从MRI图像中提取最显著的大脑特征。演示了如何使用不同的分类器从公开的神经成像数据集中检测异常的大脑图像。基于小波的特征提取，然后使用主成分分析(PCA)/二次判别分析(QDA)选择最显著的特征，并使用基于学习的分类器进行分类。与先前报告的研究相比，本研究结果的准确率有了显著提高，并且有助于更好地了解大脑异常情况。

磁共振成像(MRI)

磁共振成像(MRI)是一种用于神经成像和临床研究的先进技术，是研究人脑各种状态的有效工具。MRI图像提供了大脑各种状态的丰富信息，可用于对大脑进行研究、诊断和临床分析，以确定大脑是否正常或异常，以及处于哪种状态。从图像中提取的原始数据集非常大，很难对数据进行分析以得出结论。在这种情况下，可以使用各种图像分析工具对MRI图像进行分析，并提取结论性的诊断信息来对大脑异常进行分类。MRI图像的细节水平正在迅速提高，该技术能够提供体内各器官的二维(2D)和三维(3D)图像。

当需要进行软组织描绘时，MRI通常是医学成像方法的首选。MR成像最重要的优点是它是一种非侵入性技术。目前，计算机技术在医疗决策支持中的应用十分普遍。基于MRI的正常和病变人脑的全自动分类对于临床研究具有重要意义。有研究表明，通过人工神经网络和支持向量机(SVMs)等监督技术，以及结合特征提取技术的自组织映射(SOM)和模糊c均值聚类等非监督分类技术，可以对人脑MR图像中的异常情况进行分类。其他监督分类技术，如k-最近邻(k-NN)，也根据每个特征图像中的相似性对像素进行分组，并且可用于分类正常/病理性T2加权MRI图像。本研究采用有监督的机器学习算法将图像分为两类：正常或异常。

利用MRI图像进行诊断的方法多种多样，MRI可以产生高分辨率图像，用于图像分割和从MRI图像中识别大脑异常情况。MRI还用于在不同医疗条件下生成不同器官的详细、准确的图像。使用高场和低场MRI图像还可以使医生看到非常小的撕裂以及韧带和肌肉损伤。MRI是基于电磁频谱无无线电范围内的能量吸收和发射。从2D医学图像数据中获得的精确3D解剖模型，可提供关于关键解剖结构与病理之间空间关系的精确信息，而这些关系通常是肉眼无法区分的。Corso等人(2008)使用贝叶斯公式将软模型分配纳入亲和度的计算中，并使用加权聚合算法将得到的模型感知亲和度集成到多级分割中，随后应用于检测和分割多通道磁共振(MR)体积中的大脑异常。

本文介绍了研究者开展的关于大脑各种状态的MRI研究，通过提取最显著的特征来分类为正常和异常的大脑图像。本研究提出了一种基于小波变换的方法，首先对图像进行初步分解，然后使用各种特征选择算法从MRI图像中提取出最显著的大脑特征。通过使用不同的分类器从公开的神经成像数据集中检测大脑图像的异常，研究结果发现，与先前的研究报告相比，采用基于小波的特征提取的原则方法，然后使用PCA/QDA技术选择最显著的特征，并使用基于学习的分类器进行分类，准确率有了显著提高。

相关背景

两种类型的乘性噪声通常会出现在几种成像模式中：散斑噪声和泊松噪声。这两种类型都被称为乘性噪声，是因为它们的方差不是恒定的，而是取决于要估计的参数。MRI扫描后噪声去除方法的最终目标是在保持组织边界的同时，在均匀组织区域获得分段常数或缓慢变化的信号。在文献显示，统计方法和扩散滤波方法都被用于去除数字图像中的噪声。有研究对小波在生物医学图像处理中的应用进行了综述，包括一些关于fMRI的早期工作，通过检测血流的相关变化来测量大脑活动。时间序列小波分析中的统计问题已得到全面的解决。Alexander等人(2000)详细阐述了小波分析分形信号的一般最优性。Zaroubi等人(2000)描述了小波方法在S-PLUS中的实现。一些研究率先将小波应用于功能磁共振成像数据分析中的各种问题。迄今为止最流行的应用是图像压缩或去噪。Barra等人(2000)探索了二维和三维小波变换作为使用正电子发射断层扫描(PET)测量的放射性配基结合势图的空间滤波器，PET使用核医学成像技术产生体内功能过程的三维图像。Barra等人的研究工作就报告了一种基于小波系数模糊聚类的脑组织分类或结构MRI分割技术。

材料和方法

数据集

输入数据集由轴向T2加权、256×256像素MR大脑图像组成(图1)。这些图像是从哈佛医学院网站下载的公开数据集。本研究只考虑侧脑室清晰可见的大脑部分。输入数据集中的MR大脑图像数量为60张，其中正常脑6张，异常脑54张。异常的大脑图像集包括患有阿尔茨海默症等疾病的大脑图像。正常人脑的显著特征是它在轴向和冠状面图像上具有对称性。轴向MR大脑图像的不对称强烈提示存在异常。因此，轴向MRI图像的对称性是判断MR图像是正常还是异常脑时需要考虑的重要特征。正常和异常的T2加权MRI脑图像分别如图2和3所示。异常脑MR图像中对称性的缺失在图3中清晰可见。超过一定程度的不对称性是大脑患病的明确迹象，这在本研究的工作中被用于初步的粗略分类。

图1.T2加权轴向MR脑图像。

图2.小波分解后正常脑的T2加权轴向MR图像。

图3.异常脑的T2加权轴向MR图像。

使用小波分解图像

小波是一种将数据分解为不同频率分量的数学函数，然后以与其尺度匹配的分辨率研究每个分量。小波已经成为分析复杂数据集的强大工具。傅里叶变换仅根据图像的频率内容提供图像的表征。因此，这种表征不是空间局域化的，而小波函数是空间局域化的。傅里叶变换将信号分解为频谱，而小波分析是空间(时间)和频率的局部变换，通过伸缩和平移等运算功能可对信号进行多尺度的细化分析。因此，小波变换提供了图像在不同分辨率下的表征，是一种更好的图像特征提取工具。

离散小波变换(DWT)

DWT是小波变换的一种实现，它使用一组离散的小波尺度和平移，并遵循一些既定规则。在实际计算中，需要对小波变换进行离散化处理。尺度参数在对数网格上离散化。然后，平移参数(τ)相对于尺度参数进行离散化；也就是说，抽样是在二元抽样网格上进行的(对数的底数通常选为2)。离散尺度和转换参数为s=2-m和t=n2-m，其中m，n∈Z，取整数集。因此，小波函数族表示为：

将DWT分别应用于图像的每个维度。这导致图像Y被分解为一级近似分量和细节分量、和，分别对应于水平、垂直和对角线细节。下列公式描述了将图像分解为近似和细节分量的过程。

近似分量(Ya)包含图像的低频分量，而细节分量(Yh, Yv和Yd)包含高频分量。因此：

在每个分解级别，分解信号的长度是前一阶段信号长度的一半。因此，对N×N图像进行一级分解得到的近似分量大小为N/2×N/2，第二级分解得到的近似分量大小为N/4×N/4，以此类推。随着分解级别的增加，可以获得图像更紧凑但更粗略的近似。因此，小波为解释图像信息提供了一个简单的层次框架。

特征选择

二次判别分析(QDA)

二次判别分析(QDA)将一个类的可能性描述为高斯分布，然后使用后验分布估计来估计给定测试向量的类。这种方法的函数为：

Σk是协方差矩阵，x是测试向量，μk为均值向量，p(k)是类k的先验概率。每个类的高斯参数都可以从训练数据集中估计，因此，Σk和μk的值用其估计值

和替代。然而，当训练样本的数量较少时，与训练向量的维数相比，协方差估计可能是不适定的。解决不适定估计的方法是正则化协方差矩阵Σk。

主成分分析(PCA)

过多的特征会增加计算时间和存储内存，有时会导致分类过程变得更加复杂。这种结果被称为维度诅咒。需要一种策略来减少分类中使用的特征数量。PCA是一种有效的工具，可以降低由大量相关变量组成的数据集的维数，同时保留最重要的变化。这是通过根据数据集的差异程度或重要性将其转换为一组新的有序变量来实现的，如图4所示。

图4.MRI图像的PCA特征。

使用不同的分类器进行分类

支持向量机(SVM)分类器

支持向量机(SVM)是由Vapnik(1995)提出的一个著名的大间距分类器。SVM分类器的基本概念是在特征空间中寻找一个最优的分离超平面来分离两个类。二元SVM的决策函数为：

其中b是一个常数，yi∈{1，1}，0≤αi≤C，I=1，2，…，N是非负拉格朗日乘子，C是一个成本参数，xi是支持向量，K(xi，x)是核函数。

采用一对一法将SVM应用于多类问题。它在Knerr等人(1990)的研究中被首次引入，并在Friedman(1996)和Krebel(1999)中首次将该方法用于支持向量机。该方法构造k(k-1)/2个分类器，其中每个分类器训练来自两个类的数据。对于第i类和第j类的训练数据，解决以下二元分类问题。本研究使用投票策略，如果sign((wij)Tθ(x)+bij)表示x在第i类中，那么对第i类的投票增加1。否则，第j类加1。然后，最大的投票决定了变量x的具体类别。

采用LIBSVM软件库进行实验。LIBSVM是支持向量分类和回归的通用库，可在网址http://www.csie.ntu.edu.tw/ cjlin/libsvm/获得。如上所述，有不同的函数将数据映射到高维空间，实际上我们需要选择核函数K(xi；xj)=θ(xi)Tθ(xj)。有几种类型的核可用于解决各种问题。每个核对于不同的问题有不同的参数；例如，一些众所周知的具有大量特征的问题，如文本分类、蛋白质折叠和图像处理问题，有研究表明使用线性核可以更正确地进行分类。本研究使用了径向基函数(RBF)核，它是一种实值函数，其值仅取决于与原点的距离。具有RBF核的学习器通常在泛化能力方面并不比其他学习器差。本研究进行了一些简单的比较，观察到当使用RBF核时，其性能略好于线性核K(xi；xj)=θ(xi)Tθ(xj)对于学过的所有问题。因此，对于这三个数据集，与其停留在原始空间，不如对高维空间进行非线性映射。另一个重要问题是参数的选择。对于SVM训练，必须事先确定一些参数，例如惩罚参数C、RBF函数的核参数等。支持向量机参数的优化是SVM设计的重要环节。可以使用不同参数的交叉验证来进行模型选择。

使用自组织映射进行分类

人工神经网络(ANNs)受到生物学的启发。它们由许多并行运行的非线性计算元素组成，并以类似于生物神经网络的模式排列。ANNs会根据环境调整其行为，从经验中学习，并从以前学习过的例子中推广到新的例子。ANNs已经成为一大类模式识别任务的首选技术。Lippmann提供了关于人工神经网络的全面综述。自组织映射(SOM)是一种无监督算法，用邻近函数来保持输入空间的拓扑性质，具有其他网络无法比拟的优势，它可以自动形成相似性图，可以在训练样本的输入空间中学习到数据的低维表征。

自组织映射可以推广到非矢量数据，例如符号数据，而其他网络则不行。SVM是一种机器学习技术，起源于统计理论，用于图像分类。它的主要优点是能够对高度非线性的系统建模，并且决策面的特殊性质确保了非常好的泛化。SVM因其计算效率高、泛化性能好，而在模式识别中得到了广泛的应用。因此，人工神经网络和支持向量机在识别和分类任务中非常有吸引力。在这里，本文比较了这两种方法的结果。

结果

小波分解层级

本文获得了60张大脑MR图像的小波系数，每张图像的大小为256×256。对大脑MRI图像进行一级HAR小波分解，得到16384个小波近似系数，这些小波近似系数是一组重新缩放的方形函数，它们共同构成一个小波族或基，而二级和三级分别产生4096和1024个小波系数。第三级小波分解大大减小了输入向量的大小，但分类率较低。在第一级分解中，向量大小(16384)太大，无法作为分类器的输入。通过MATLAB仿真对小波系数进行了系统的实证分析，得出二级特征最适合用于神经网络、自组织映射和支持向量机分类器，而一级和三级特征的分类精度较低。二级小波分解不仅在测试阶段给出了近乎完美的结果，而且还具有合理的、可管理的特征数量(4096)，分类器可以很容易地处理这些特征。本研究还应用Daubechies-4(DAUB4)母小波，它是定义离散小波变换的正交小波基，其特征是在给定的支持下有最大的消失矩，以获得二级MRI图像的分解系数，从而提供两种小波类型分解的分类精度比较。

使用自组织映射(SOM)分类

采用小波分解的特征提取，然后用PCA降维，并通过基于自组织映射神经网络进行分类。利用MATLAB中的小波工具箱获取MR图像的小波系数。利用MATLAB编写了自组织神经网络程序。在第一阶段被标记为异常的图像在第二阶段将不被考虑，以避免对这些图像进行小波分解所花费的昂贵计算成本。获得二级DAUB4和HAR小波近似系数，并作为自组织神经网络分类器的输入。分类结果如表1和表2所示。输入数据集中的MR大脑图像数量为60张，其中正常脑6张，异常脑54张。实验采用了不同层级的小波分解。自组织映射分类后得到的最终类别取决于输入向量呈现给网络的顺序。因此，本研究对输入图像的呈现顺序进行随机化。实验重复进行，每次输入呈现顺序不同，所有实验均获得相同的分类百分比和正常异常类别。

表1.不同方法的比较。

表2.在HAR和Daubechies小波上采用多种特征选择和分类算法得到的识别率。

使用支持向量机(SVM)分类

本研究在Weka 3.6.6中执行SVM，输入为小波编码图像，使用LIBSVM库进行分类。这是一种二维分类技术。在本文中，研究者将MR大脑图像的分类视为一个两类模式分类问题。在每个小波编码的MR图像中，应用分类器来确定它是正常还是异常。如前所述，SVM的使用包括用特定的核函数训练和测试支持向量机，而这个核函数又有特定的核参数。该分类采用RBF和多项式函数作为支持向量机的核。线性核也用于支持向量机的训练和测试，但其分类率低于多项式核和RBF核。线性核、多项式核、RBF核的分类结果如表3所示。与RBF和线性核相比，多项式核的分类精度更高。使用k折交叉验证技术来避免过拟合，整个数据集的k=7。

表3.使用不同核的SVM分类。

结论

本文提出了一种使用基于小波的特征提取、基于PCA的特征选择和基于SVM/SOM的分类来研究大脑异常的原则方法。在公开可用的大脑图像数据集上进行的实验表明，所提出的原则方法的性能明显优于文献中报告的其他方法。自组织映射的分类精度达94%以上，支持向量机的分类精度达96%以上，这很好地证明了该方法的实用性。本研究只将这种方法应用于大脑内特定深度的轴向T2加权图像。同样的方法可以用于T1加权、质子密度和其他类型的MR图像。利用上述方法，可以开发用于检测脑部疾病(例如阿尔茨海默症、亨廷顿症、帕金森症等)的诊断系统软件。此外，所提出的方法通过在处理循环中结合特征选择算法来使用简化数据，但仍然提供了更好的识别和准确性。与文献报告的独立SVM(91.32%)和其他传统分类器相比，组合的SVM-QDA和SVM-PCA分类器获得了更好的结果(93.43%和96.24%)。未来的研究可以对不同类型的异常进行分类，并根据年龄、情绪状态及其反馈等各种参数从MRI大脑图像中提取新的特征。

原文：Understanding the Brain via fMRI Classification.

DOI：10.1007/978-3-642-30574-0_40