机器学习在预测脊髓型颈椎病中的应用:一项28名参与者的事后初步研究
Machine Learning for the Prediction of Cervical Spondylotic Myelopathy: A Post Hoc Pilot Study of 28 Participants
简单说:训练了两个模型:1)预测脊髓型颈椎病诊断(分类);2)预测CSM严重程度(输出是线性的)。
摘要
方法:共14例脊髓型颈椎病患者和14例对照组接受颈椎影像学检查。训练了两种不同的人工神经网络模型;1)预测脊髓型颈椎病诊断;2)预测CSM严重程度。模型1包括6个输入,包括3个常用的评估脊髓压缩的成像量表,以及3个客观的磁共振成像测量。模型1预测CSM诊断的结果是二元的。模型2由23个输入变量组成,这些输入变量来自压缩区域白质束的概率体积映射测量。模型2的结果是线性的,可以预测改良的日本骨科协会(mJOA)评分。
结果:采用模型1预测脊髓型颈椎病。训练模型的平均交叉验证准确率为86.50%(95%置信区间85.16为87.83%),中位数准确率为90.00%。每次重复计算曲线下面积(AUC)。每次重复的平均AUC为0.947,中位数AUC为1.0。平均敏感度为90.25%,特异度为85.05%,阳性预测值为81.58%,阴性预测值为91.94%。模型2用于mJOA建模。mJOA模型预测分数,平均误差和中值误差分别为0.29 mJOA点和0.08 mJOA点,每批平均误差为0.714 mJOA点。
方法
共有13名脊髓型颈椎病患者和15名对照组接受了颈椎影像学检查。所有入选的脊髓型颈椎病患者都是在一家大型学术机构由经委员会认证的执业神经外科医生根据临床和影像学检查结果诊断的(表1)。入选标准包括以下所有脊髓型颈椎病患者:典型脊髓型颈椎病症状,包括无力、反射亢进或协调性改变的检查结果;脊柱压迫的影像学征象;Nurick等级I-IV18;排除标准包括:年龄<21或>80,共病性神经疾病(如多发性硬化症),怀孕或哺乳期,活动性全身风湿性疾病,活动性周围或血管神经病变,以及迫切需要手术。这项研究是在大学机构审查委员会的批准下进行的。
图像采集与分析
所有成像数据均由配备64通道头/颈线圈的3.0特斯拉西门子Prisma磁共振扫描仪(Siemens, Erlangen, Germany)收集。受试者仰卧于扫描仪床上,通过定位器扫描确定颈椎椎间盘的位置(C2-3、C3-4、C4-5、C5-6、C6-7和C7-T1)。采用多回声梯度回声序列(重复时间¼300 ms,回声时间¼18 ms,反转角度¼30?180年,视野¼?180年,矩阵大小¼384 ?384,平面分辨率¼0.47?0.7 mm2,切片厚度¼4 mm,平均数量¼2)。
模型1:预测CSM诊断
以事后方式审查图像,并使用 3 个常见的文献量表(Kang、Nagata 和 Chang)以及 3 个 MRI 测量值(矢状管宽度、椎体高度与椎间盘高度比,以及C5 椎体矢状面宽度)全部位于 MRI 上最大压缩点。这 6 个特征用于使用 Keras 开源 Python 包(https://keras.io)训练深度神经网络分类模型(图 1)。该模型使用交叉验证进行训练和测试,其中数据被随机划分为训练(n=18)和测试(n=10)数据集。在训练中,18 张训练图像通过一系列 7 层进行馈送,每一层都有不同程度的前向和后向通信节点(神经元)。偶尔引入 Dropout 层,防止一定比例的神经元在训练期间的不同时间点向前或向后通信,以防止过度拟合并保持模型的可推广性。然后使用 4 次和 25 次迭代的批量大小在总共 200 个随机分区中训练和测试模型来训练模型。平均和中位数交叉验证的准确性、敏感性、特异性、阳性预测值和阴性预测值用于评估模型性能。
模型2:预测CSM严重程度
使用脊髓工具箱(3.0.7版本)、https://sourceforge.net/projects/spinalcordtoolbox/ 和前面描述的PAM50脊髓模板对每个横切切片的图像进行进一步分析。对脊髓区域进行分段,收集每个感兴趣区域的体积和横断面测量值。感兴趣的区域包括前/后径、脊髓偏心、腹侧皮质脊髓束、腹侧网状脊髓束、内侧网状脊髓束、外侧皮质脊髓束、侧网状脊髓束、腹侧网状脊髓束、和内侧纵束(每个用体素测量体积,用毫米测量)。以下的性别、年龄、身高、体重、水平和前面提到的参数被输入到我们的深度神经网络中,共包含23个输入变量,唯一的输出变量是mJOA评分(modified Japanese Orthopedic Association)。图2概述了模型2规范。模型的训练数据被划分为2个数据集:训练(n¼78)和测试(n¼26)。与前面描述的类似,78个训练数据点被输入到9层,每层都有不同程度的节点(神经元)。就像模型1中那样添加了零星的退出层,以防止过拟合。完成后,使用3次批量和1250次迭代对模型进行了进一步的培训和测试。类似地,这个过程总共重复了150次,以更好地描述人口数据。输出定义为mJOA分数的数值预测。基于均方误差评估模型性能,并计算后续预测中的平均误差。误差定义为预测mJOA尺度值与实际mJOA尺度值的总差值。
总结
机器学习为脊髓型颈椎病的预测和诊断提供了一种很有前景的方法。在这项初步研究中,在回顾了仅18张图像的特征后,我们的分类模型能够预测来自对照的CSM,中位精度为90%,并且仅使用图像特征预测mJOA得分在0.4分以内。尽管还只是初步研究,但目前的研究表明,使用机器学习来更好地改善脊髓型颈椎病以及其他颈椎疾病的诊断和预测方法是有希望和可行的。