AI在医学领域:GluFormer一种可泛化的连续血糖监测数据分析基础模型

news2024/11/13 11:08:19

      糖尿病是一种全球性的健康挑战,影响着各个年龄段和不同地理区域的人群。根据最新数据,全球糖尿病患者人数已超过5亿,且每年以惊人的速度增长,相关的医疗费用也居高不下。2型糖尿病(T2DM)作为最主要的糖尿病类型,其主要风险因素包括不良的饮食习惯和缺乏体育锻炼,这些因素都是可以通过生活方式干预来改变的。糖尿病不仅是许多慢性并发症的主要风险因素,如心血管疾病、肝病、呼吸系统疾病、癌症、慢性肾病和心理健康问题等,而且这些并发症往往也是导致患者死亡和残疾的主要原因。

     连续葡萄糖监测(CGM)作为一种新兴的血糖管理工具,在改善糖尿病患者血糖控制方面展现出了显著的优势。与传统的自我血糖监测(SMBG)相比,CGM能够更全面地反映患者的血糖波动情况,提供更准确的血糖数据,从而帮助医生制定更为精确的治疗方案。此外,CGM还有助于减少低血糖事件的发生,提高患者的生活质量。

      本文介绍的GluFormer是一个基于Transformer架构的生成式基础模型,使用来自HPP数据集的CGM数据进行自监督训练能够生成CGM信号,捕捉个体血糖动力学特征,并预测广泛的临床参数。

1 方法

1.1 数据集

  • HPP数据集:来自HPP的10,812名非糖尿病参与者的CGM数据,每个参与者监测两周,并进行饮食记录、运动记录、睡眠记录临床数据包括DXA、睡眠评估、肝脏和颈动脉超声、血液血清NMR代谢组学等
  • 外部数据集:来自15个外部数据集的CGM数据,4936名参与者包括不同地区、不同CGM设备和不同代谢疾病人群(例如:糖耐量正常、糖尿病前期、1型糖尿病、2型糖尿病、妊娠糖尿病和肥胖)。

1.2 数据预处理

  • CGM数据:将血糖测量值量化为460个离散区间,并将数据组织成长度为1200个测量值的序列(相当于12.5个连续的监测日)。
  • 膳食数据:将膳食记录与CGM数据进行时间对齐,并将饮食数据分解为其宏量营养素含量。
  • 时间信息:将日期和时间信息转换为学习到的嵌入,并将其添加到CGM和膳食数据中。

1.3 模型架构

  • Transformer架构:使用16个注意力头和16个Transformer层,输入序列长度为1200个标记。
  • 嵌入层:将每个标记嵌入到1024维空间。
  • 位置编码:使用正弦和余弦函数添加位置编码,以帮助模型理解序列中标记的顺序。
  • 因果掩码:使用因果掩码确保模型只能根据过去的信息预测未来的标记,从而实现自回归生成。

1.4 预训练

  • 下一标记预测:使用交叉熵损失函数,训练模型根据过去的信息预测下一个标记。
  • 优化器:使用AdamW优化器进行模型训练。
  • 学习率调度器:使用StepLR调度器调整学习率。
  • 模型选择:根据验证集的性能指标选择最佳模型。

1.5 评估方法

  • 生成CGM信号:将生成的CGM信号与真实CGM数据进行比较,评估模型生成真实CGM信号的能力。
  • 预测临床参数:使用岭回归模型,比较GluFormer嵌入和iglu指标在预测临床参数方面的性能。
  • 预测未来临床结果:使用GluFormer嵌入预测未来几年的临床结果。
  • 预测临床试验结果:使用GluFormer嵌入预测临床试验的基线和后续临床结果。
  • 预测葡萄糖反应:将膳食数据集成到模型中,并使用生成的CGM信号预测个体对特定食物的反应。

1.6 模型变种

  • 时间编码:将日期和时间信息添加到模型中,以提高生成CGM信号的性能。
  • 多模态GluFormer:将膳食数据与CGM数据进行整合,以提高预测葡萄糖反应的准确性。

2 结果

2.1 生成CGM信号

  • GluFormer能够生成与真实CGM数据高度相似的信号,并捕捉个体血糖动力学特征。
  • 生成的CGM信号与真实CGM信号在多个iglu指标(例如平均血糖、GMI、低于70 mg/dL的血糖)上具有显著相关性。

2.2 预测临床参数

GluFormer嵌入在预测临床参数方面优于传统iglu指标,包括:

  • 腹部脂肪组织
  • 肝脏衰减
  • 睡眠呼吸暂停低通气指数(AHI)
  • 收缩压
  • 血脂
  • 肝功能
  • 肾功能
  • 身体测量
  • 睡眠指标

GluFormer嵌入能够预测未来几年的临床结果,包括HbA1c、空腹血糖水平、腹部脂肪组织等。

2.3 预测未来临床结果

  • GluFormer嵌入能够预测未来几年的临床结果,包括HbA1c、空腹血糖水平、腹部脂肪组织等。
  • GluFormer嵌入在预测未来临床结果方面优于传统iglu指标。

2.4 预测临床试验结果

  • GluFormer嵌入能够预测临床试验的基线和后续临床结果,包括HbA1c、血脂、血糖、身体脂肪百分比、淋巴细胞计数等。
  • GluFormer嵌入在预测临床试验结果方面优于传统iglu指标。

2.5 预测葡萄糖反应

  • 将膳食数据集成到GluFormer模型中后,模型的预测准确性显著提高。
  • GluFormer嵌入能够预测个体对特定食物的葡萄糖反应。

2.6 模型优势与局限

2.6.1 模型优势

  • 强大的预测能力:GluFormer模型能够准确预测HbA1c、肝功能、血脂、睡眠指标等多种临床参数,并且预测能力优于传统的CGM指标。
  • 广泛的适用性:GluFormer模型能够在不同人群、不同CGM设备和不同代谢疾病中发挥作用,具有良好的泛化能力。
  • 潜在的健康信息:GluFormer模型的嵌入空间包含了丰富的生理信息,揭示了CGM数据中隐藏的健康指标,为全面的健康评估和监测提供了新的可能性。
  • 临床应用潜力:GluFormer模型可以用于预测临床试验结果,并可能有助于优化临床试验设计,加速药物开发和精准医疗的进程。

2.6.2 模型局限

  • 数据集限制:HPP数据集主要包含非糖尿病人群,模型的泛化能力可能受到限制。
  • 膳食数据准确性:膳食数据依赖于自我报告,可能存在不准确性和偏差。
  • 模型复杂性:Transformer模型的复杂性和可解释性较差,限制了其在临床实践中的应用。

因果关系:模型目前只能预测相关性,无法确定因果关系

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2073231.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

lit-llama代码笔记--LLaMA Model

代码来自:lit-llama modelscope模型下载 :llama-7b 下载后的模型需要转换为lit-llama使用的格式,详见 howto 文件夹下的 download_weights.md 文中代码为了方便说明,删减了一些内容,详细代码请查看源码。 generate …

u盘突然说要格式化才能访问?如何跳过格式化打开U盘

在日常使用U盘的过程中,有时我们会突然遇到U盘无法直接访问,系统提示需要格式化才能继续使用的情况。这往往让人措手不及,尤其是当U盘中存储着重要数据时。面对这样的困境,许多用户可能会感到焦虑和无助。然而,不必过于…

SQLserver中的触发器和存储过程

在 SQL Server 中,触发器是一种特殊的存储过程,它在指定的数据库表上发生特定的数据修改事件时自动执行。触发器可以用于执行各种任务,如数据验证、数据审计、自动更新相关表等。 触发器的类型 SQL Server 支持以下几种类型的触发器&#x…

如何构建基于Java SpringBoot的保险业务管理与数据分析系统

✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java实战 |…

UE管理内容 —— FBX导入选项参考

目录 Static Mesh Options Skeletal Mesh Options Transform Miscellaneous Material Options Fbx File Information 命名规范 StaticMesh SkeletalMesh AnimationSequence MorphTarget 导入器将自动检测要导入的文件类型,并相应地调整其接口&#xff1…

Java学习_21_多线程JUC

文章目录 前言多线程并发与并行多线程的实现方式Thread类Runnable接口Callable接口和Future接口 Thread类的相关方法线程对象线程优先级守护线程出让线程/礼让线程插入线程/插队线程 线程的相关问题生命周期安全问题Lock锁死锁等待唤醒机制(生产者和消费者&#xff…

微信服务号网页授权域名配置数不够方案验证

文章目录 问题说明方案验证涉及工具结论 问题说明 微信服务号网页授权域名只能配置两个,而又没法直接配置主域名的形式,目前只能选取其中的一个业务域名来进行统一跳转解决。 方案验证 服务号现有配置数量限制如下: 申请测试号验证&#…

数据仓库系列 5:什么是事实表和维度表,它们有什么作用?

目录 1. 引言:事实表与维度表的魔力2. 事实表:业务活动的数字足迹2.1 什么是事实表?2.2 事实表的特征2.3 事实表的类型2.4 事实表示例2.5 事实表的作用2.6 事实表的设计原则2.7 事实表的查询示例 3. 维度表:为数据赋予意义3.1 什么是维度表?…

Mysql语句性能优化

SQL查询过程 查询缓存: 执行查询语句的时候,会先查询缓存(MySQL 8.0 版本后移除,因为这个功能不太实用)。分析器: 没有命中缓存的话,SQL 语句就会经过分析器,分析器说白了就是要先看…

logistic方程求解和模拟

logistic规律可以用以下式子表示 N(t1)​k*N(t)*​(N-N(t)) 其中N(t)为t时刻种群的数量,N为环境最大容纳的的种群数 k的取值通常与N有关,大约在1/N和4/N之间 题目如下 假设一些参数后的代码如下 T100; T11:T; N11000; a13/N1; Q800; N2700; a2-0.2/…

洛谷 P10119 『STA - R4』踱步

题目来源于:洛谷 题目本质:动态规划及优化,单调队列 题目思路: 设 fi,k,op​ 表示对于前 i 个位置,强制在 i1 分钟初踱步,总共踱步 k 次,且第 i 分钟在屋内(op0)或屋外…

leetcode73. 矩阵置零,简单模拟

leetcode73. 矩阵置零 给定一个 m x n 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 示例 1: 输入:matrix [[1,1,1],[1,0,1],[1,1,1]] 输出:[[1,0,1],[0,0,0],[1,0,1]] 示…

Stable Diffusion之提示词指南(二)

在上一篇的文章中,我们讲解了Stable Diffusion提示词的基本用法,不了解的到可以去学习一下———Stable Diffusion之提示词指南(一)。这章我们再详细讲解一下其他高级用法和负提示词。 注意:部分语法只是适用于AUTOMATIC1111 Web UI(以下简称…

SpringBoot集成kafka-指定topic(主题)-partition(分区)-offset(偏移量)消费信息

SpringBoot集成kafka-指定topic-partition-offset消费信息 1、消费者2、生产者3、配置类4、配置文件5、实体类6、工具类7、测试类8、第一次测试(读取到19条信息)9、第二次测试(读取到3条信息) 1、消费者 指定消费者读取配置文件中…

[pytorch] --- pytorch环境配置

本教程环境搭建基于windows 1 安装miniconda 1.1 miniconda与anaconda的区别 包含的包: Anaconda: 是一个较大的发行版,预装了大量的科学计算和数据分析相关的 Python 包。Miniconda: 更轻量级,只包含 Conda、Python 和它们的依赖,以及少…

微信小程序获取用户openId并通过服务端向用户发送模板消息

1.引言 注意: 1.标题中的服务端是自己研发的服务端,不是腾讯公司的服务端。 2.小程序的模板消息分为一次性订阅消息与长期订阅,一次性订阅就是每次在给用户发送消息之前都需要获得用户的同意(即用户订阅)&#xff0…

数据结构(树、平衡树、红黑树)

目录 树 树的遍历方式 平衡二叉树 旋转机制 左旋 右旋 旋转实例 左左 左右 右右 右左 总结 红黑树 树 相关概念 节点的内部结构如下 二叉树与二叉搜索树的定义 树的遍历方式 前序遍历:当前节点,左子节点,右子结点 中序遍历&a…

React学习day01-React-开发环境配置、JSX基础-本质、JSX中js表达式的用法、JSX的条件渲染

1、React (1)概念:由Meta公司研发,是一个用于构建Web和原生交互页面的库 (2)优点: 1)相较于传统基于DOM开发的优势:组件化的开发方式、不错的性能 2)相较于…

软件设计原则之单一职责原则

目录 单一职责原则单一职责原则的主要特点应用范围Demo用户信息日志记录 单一职责原则 单一职责原则(Single Responsibility Principle,简称SRP)是面向对象设计中的一个重要原则,其核心思想是:一个类应该仅有一个引起…

ollma 本地部署大模型

因为我本地是 windows 的系统,所以这里直接写的是通过 docker 来实现本地大模型的部署。 windows 下 WSl 的安装这里就不做重复,详见 windows 部署 mindspore GPU 开发环境(WSL) 一、Docker 部署 ollma 1. 拉取镜像(…