关键词:深度学习、近视预测、早期干预、屈光数据
儿童近视已经成为一个全球性的重大健康议题。其发病率持续攀升,且有可能演变成严重且不可逆转的状况,这不仅对家庭幸福构成威胁,还带来巨大的经济负担。当前的研究着重指出,精确预测近视进程对于实施及时有效的干预至关重要,以防止儿童遭受严重的视力损伤。然而,这类预测主要基于主观的临床评估,这些评估本质上存在偏差且资源消耗大,从而限制了它们在广泛领域的应用。
本文介绍了一种新颖的、高精度的方法,使用眼底图像和基线屈光数据来定量预测儿童的近视发展轨迹和近视风险。这种方法通过在中国河南省对3,408名儿童进行的为期六年的纵向研究中得到了验证,研究使用了16,211张眼底图像和相应的屈光数据。此外,本文的方法旨在仅依赖眼底图像和屈光误差数据,无需元数据或医生的多次询问,从而大幅降低相关的医疗费用,并促进大规模筛查。
眼底图像预处理技术和深度学习网络模型构建、训练验证的代码:https://github.com/19376357/Myopia-prediction-model/tree/main。
1 方法
核心思想是通过分析眼底图像中与近视进展相关的特征,并结合屈光度数据,预测儿童未来近视的发展轨迹和风险。
a. 系统示意图:系统接收儿童的眼底图像序列,并能够筛选出具有未来近视高风险和快速近视发展的高风险儿童。系统还可以定量预测儿童未来几年的近视发展情况。
b. 数据分段示意图:将儿童连续六年的数据根据已知和预测的年份分类为15个类别,例如,使用2年的眼底序列预测接下来的4年近视发展,每个类别根据已知和预测的年份进一步分为支持数据和测试数据。
c. 儿童人群特征的实际检查:比较原本近视和原本非近视儿童的近视发展,并研究儿童近视发展的数据显示,儿童的近视在五年内发展得非常迅速。
d. 模型示意图:模型使用n年的眼底图像序列和球面等效屈光度(SE)序列进行特征提取和时间序列建模,以预测未来m年的近视情况,并用于创建模型的热图
1.1 数据集
对河南省安阳市 11 所小学的 3408 名一年级学生进行了为期六年的纵向研究,收集了 16,211 张眼底图像和相应的屈光度数据。
1.2 流程
1.2.1 数据预处理
为了提高模型的准确性和鲁棒性,研究人员开发了一套图像预处理和增强系统。该系统包括图像裁剪、缩放、缺陷检测和特征增强算法,用于突出眼底图像中的生理特征。
1.2.2 模型构建
研究人员设计了一个名为“多年度近视预测网络”(MMPN)的深度学习模型。该模型由编码器和解码器两部分组成。
- 编码器: 使用基于 ResNet34 架构的卷积神经网络 (CNN) 从单个眼底图像中提取特征。
- 解码器: 使用基于 LSTM 架构的循环神经网络 (RNN) 分析眼底图像序列中的时间动态信息,并结合屈光度数据,预测未来几年的屈光度发展和近视/高度近视风险。
1.2.3 模型训练和评估
使用 Python 1.12.0 和 A5000-24G 显卡对 MMPN 模型进行训练和评估。他们使用了准确率、特异性、灵敏度、ROC 曲线和 AUC 面积等指标来评估模型的预测性能。
1.3 模型优势
- 数据效率高: 仅需一次就诊的数据即可进行预测,节省时间和人力成本。
- 预测能力强: 能够对近视和高度近视进行短期和长期预测,并提供近视进展的定量轨迹。
- 预测准确率高: AUC 值分别为 0.944 和 0.995,平均预测误差为每年 0.311D。
- 可解释性强: 可以通过热力图分析模型关注的区域,发现与近视发展相关的潜在因素和新的生物标志物。
1.4 研究局限性
- 模型的泛化能力: 需要在不同人群中进行测试,以评估模型的泛化能力。
- 数据集的局限性: 高度近视样本数量较少,可能影响模型的灵敏度。
- 快速进展近视的预测: 对于快速进展近视的儿童,模型的预测误差可能较大。
2 实验
2.1 实验结论
- 预测准确率高:模型预测近视和高度近视风险的 AUC 值分别为 0.944 和 0.995,平均预测误差为每年 0.311D。
- 与传统的预测方法相比,该方法的准确率和 AUC 值更高。
- 预测能力强:该方法能够对近视和高度近视进行短期和长期预测,并提供近视进展的定量轨迹。即使只使用一年的数据,模型也能预测未来三年的近视风险,准确率仍然很高。
- 数据效率高:该方法只需一次就诊的数据即可进行预测,节省时间和人力成本。
- 可解释性强:热力图分析显示,模型关注的区域主要集中在视盘、黄斑区和视网膜上下方区域,这与高度近视的眼底病变区域一致。这表明模型能够识别与近视发展相关的潜在因素和新的生物标志物。
2.2 结论分析
- 近视风险预测:模型预测未来一年近视风险的准确率为 87.9%,AUC 值为 0.944。模型预测未来一年高度近视风险的准确率为 99.5%,AUC 值为 0.995。
- 这表明模型能够有效识别高风险儿童,并预测近视/高度近视的发生概率。
- 屈光度预测:模型预测未来一年等效球面屈光度的平均误差为 0.311D,R² 值为 0.843。这表明模型能够准确预测儿童未来几年的屈光度发展轨迹。
- 性别差异:模型在男性和女性儿童中的预测性能没有显著差异。这表明模型对性别没有偏见。
- 初始近视状态:模型对初始近视儿童未来近视进展的预测误差大于初始非近视儿童,这表明初始近视状态对预测结果有较大影响。然而,使用相对误差进行测量时,两组预测结果的差异可以缩小,因为初始近视儿童的屈光度本身更高。