导言
论文地址:https://arxiv.org/abs/2404.12605
数字生物标志物是一种新型医疗指标,其数据来源于可穿戴设备和智能手机等数字设备收集的数据。与从传统生物样本中提取的病理标志物不同,数字生物标志物能提供行为模式、生理节奏和环境因素的详细描述。
近年来,数字生物标志物在慢性病管理和心理健康监测等多个领域备受关注。特别是在糖尿病领域,数字生物标志物已被研究用于辅助个性化血糖水平管理,使用的数据来自连续血糖监测(CGM)设备和胰岛素泵。
然而,以往的研究大多侧重于胰岛素用量和个体血糖水平,尚未对全面的血糖控制进行评估。因此,本研究提出了一种数字生物标志物建模方法,该方法考虑了饮食摄入等生活方式因素,可预测第二天的总体血糖状态。
相关研究
传统研究采用以下方法利用数字生物标志物进行糖尿病管理
Bartolome 等人[6] 提出了一个计算框架,用于从 CGM 和胰岛素泵数据中识别数字生物标记物,以管理糖尿病患者的血糖控制。
Bent 等人[16]开发了一种方法,可通过智能手表传感器数据和饮食记录对个性化血糖水平(血糖间期)进行无创监测和预测。该方法的一个重要贡献是根据个人血糖波动对高血糖(PersHigh)、低血糖(PersLow)和正常(PersNorm)进行了个性化定义。
然而,以往的这些研究往往局限于胰岛素给药和血糖数据,尚未对全面的血糖控制进行评估。有些研究仅限于预测短期血糖波动。
因此,传统研究面临着无法捕捉血糖控制所涉及的各种因素的挑战,人们呼吁将数字生物标志物应用于糖尿病综合管理。
拟议方法(GluMarker)
本文提出了一个名为 "GluMarker "的框架,该框架考虑了包括饮食摄入量在内的多种因素,以预测第二天的总体血糖控制状况。
首先,作为预处理步骤,根据输入数据的分布情况将数据分为若干区间(图 2)。例如,膳食摄入量分为 0-120 个单位、120-200 个单位等。每个区间表示为一个数字生物标记,将连续值数据离散化。
接下来将介绍 GluMarker 的模型结构(图 1)。我们有两个并行输入连续值数据和离散数字生物标记数据的分支。连续分支通过 CNN 进行训练,离散分支通过紧密耦合层中的特征表征进行训练。然后将注意力机制(交叉注意力)应用于这两种特征表征,以有效整合它们。最后,利用整合后的特征预测血糖控制状况(良好/中等/较差)。
并行分支和注意力机制的引入,使得 GluMarker 能够有效地融合不同性质的输入数据(连续值和离散值),从而独树一帜。与传统方法相比,GluMarker 可以实现更高的预测性能。此外,通过从模型中提取重要特征,还能识别影响次日血糖控制的日常生活习惯因素。
试验
图 4 显示了四种模型(建议的 GluMarker 方法、线性 SVC、Naive Bayes 和 MLP)对血糖控制状态预测性能的 ROC 曲线。
在良好、中等和较差三个类别中,GluMarker 的 AUC 值(曲线下面积)都是最高的。它在预测血糖控制状况不佳方面表现尤为突出,AUC = 0.85。鉴于糖尿病患者难以适当控制血糖的现实情况,这是一个非常重要的结果。
图 5 显示了每个特征对三个血糖控制类别的影响程度。例如,图中显示,前一天的校正胰岛素剂量对良好控制的影响最大,而前一天的高血糖时间(TAR)则是导致不良控制的主要因素。
此外,图 6 显示了对预测血糖控制至关重要的十大数字生物标志物。对于良好的血糖控制来说,"前一天未使用修正胰岛素 "最为重要。另一方面,对于血糖控制不佳的患者,"前一天胰岛素吸收率=0%"和 "当天胰岛素吸收量为 10-20 单位 "则排在前两位。后者是一个与直觉相反的发现,但被认为是由于该数据集中有大量血糖控制不佳的患者。
这些结果表明,与传统方法相比,GluMarker 不仅具有更高的预测性能,还能从日常生活习惯中提取出影响血糖控制的重要因素。特别有趣的发现是,一些具有临床意义的指标非常重要,如是否使用了胰岛素、食物摄入量和前一天的血糖状况。这些数字生物标志物可作为医生对患者进行日常血糖管理的参考指标。此外,它们还有望通过提供个性化反馈,帮助患者改善自己的生活方式。
结论
在这项研究中,我们提出了一个 GluMarker 框架,以高精度预测第二天的总体血糖控制状况,并将饮食摄入量等多种因素考虑在内。在超越传统方法的同时,还发现了对临床有用的数字生物标志物,如校正胰岛素剂量和前一天的血糖状况。
未来,他们计划整合有关压力、运动和行为习惯的数据,以评估不同患者群体的表现。结合进一步的个性化血糖预测模型,这将带来更全面的个性化糖尿病管理。