慢病精准预测:大模型 + 多模态融合

news2025/1/26 5:04:09

慢病精准预测:大模型 + 多模态融合

    • 慢病预测算法拆解
        • 子解法1:多模态数据集成
        • 子解法2:实时数据处理与更新
        • 子解法3:采用大型语言多模态模型(LLMMs)进行深度学习分析
      • 慢病预测更多模态

 


论文:https://arxiv.org/pdf/2406.18087

演示:https://www.youtube.com/watch?v=oqmL9DEDFgA

传统的慢性病诊断涉及与医生面对面的咨询以识别疾病。然而,缺乏研究集中在使用临床笔记和血液测试值预测和开发应用系统。

我们收集了台湾医院数据库2017至2021年的五年电子健康记录(EHRs)作为人工智能数据库。

开发了一个基于大型语言多模态模型(LLMMs)的慢性病预测平台。

这个平台可以与前端网页和移动应用集成,还能连接到医院的后端数据库,提供实时的风险评估诊断。

我们使用多种模态数据,来处理常见的慢性疾病,如糖尿病、心脏病和高血压,进行多模态模型训练。

  • 临床笔记:这些文本数据包含医生的详细观察和患者的病历描述,能够提供患者的历史病情和症状信息。
  • 实验室测试结果:包括血液检测等生化指标,这些是量化数据,提供了关于患者当前健康状况的重要信息。
  • 历史电子健康记录(EHR):可能包括患者过去的医疗记录、药物使用记录、手术历史等,这些数据有助于模型理解患者的整体健康轨迹。

以及使用了大模型,如BERT 、BiomedBERT、Flan-T5-large-770M 和 GPT-2 作为文本特征提取器。

  • 在高血压的预测中,所有模型的表现都相对较低,其中BERT和BiomedBERT的精确度和F1分数均为0.35和0.32,而GPT-2的表现最差,精确度为0.29,F1分数为0.25。

  • 对于心脏病的预测,GPT-2表现最好,精确度为0.81,召回率为0.85,F1分数为0.83。BiomedBERT也表现良好,其精确度、召回率和F1分数分别为0.76、0.75和0.75。

  • 在糖尿病分类上,GPT-2与BiomedBERT表现较好,GPT-2的精确度为0.70,召回率为0.71,F1分数也为0.70;而BiomedBERT的召回率达到0.72,F1分数为0.67。

  • 结论是,在临床记录,文本特征提取器,每个大模型在不同慢病上,效果都不同。最好是专门子领域微调过的。

接下来,我们将单一模态的临床笔记作为输入到LLMMs中,提取文本特征嵌入,并使用注意力模块将它们融合,用于最终的预测任务。

  • 数据收集与预处理:从EHR和实验室测试数据开始,收集必要的信息。
  • AI训练数据库的建立:包括数据清洗和医疗团队的注解,以确保数据的质量和适用性。
  • 大型语言多模态模型(LLMMs):展示了如何使用LLMMs来从处理过的数据中提取特征,并用于预测如早期糖尿病和其他慢性疾病。

在这里插入图片描述
Web平台的四个主要界面:

  • (a) 疾病风险界面:展示患者的糖尿病、高血压和心脏病风险评估。
  • (b) 早期疾病预测界面:展示患者未来90、180、270和360天的糖尿病风险。
  • © SHAP值解释界面:使用SHAP值来标识临床笔记中的关键风险因素。
  • (d) 实验室数据提交界面:允许医生上传患者的血液测试数据。

慢病预测算法拆解

开发一个能够实时预测和警报慢性病风险的医疗诊断系统,以提高患者管理效率并支持临床决策。

解法涉及整合多模态数据以提高慢性病预测的准确性。

子解法1:多模态数据集成

特征:慢性病的预测需要综合多种数据源(如临床笔记、实验室测试结果)来增强预测模型的信息丰度。

  • 原因:之所以采用多模态数据集成,是因为慢性病的表现和影响因素多样,需要多维度的数据支持以提高预测的全面性和准确性。
  • 例子:通过结合EHR中的文本数据(如医生的临床笔记)和量化数据(如血液检测结果),LLMMs能够更全面地分析患者的健康状态,预测疾病发展。

对于血液测试数据,构建了一个深度神经网络(DNN)来获取血液表示。

为了更好地整合这两种模态,我们使用了多头注意力层来计算来自两个领域的嵌入的注意力得分和矩阵。

最后,采用全连接层来预测多种疾病。

子解法2:实时数据处理与更新

特征:慢性病管理需求对数据的时效性极高,需要系统能够实时处理和更新数据。

  • 原因:之所以需要实时数据处理与更新,是因为慢性病状的快速变化需要及时调整治疗方案,以防病情恶化。
  • 例子:系统通过实时同步最新的健康检查结果和临床记录到数据库,并即时进行数据分析,以便快速反馈给医生和患者潜在的健康风险。
子解法3:采用大型语言多模态模型(LLMMs)进行深度学习分析

特征:LLMMs能够处理和理解大规模和复杂的数据集,适用于提取临床文本和实验室数据中的关键特征。

  • 原因:之所以使用LLMMs,是因为它们在处理复杂和大量的医疗数据方面具有优越性,可以捕捉深层次的模式和关联,提供精确的病症风险预测。
  • 例子:LLMMs分析患者的历史数据和最新测试结果,使用深度学习技术识别出可能导致疾病恶化的关键指标,从而提前警告医生和患者采取预防措施。

在阅读和理解了文章内容之后,可以看到背后的模式是通过技术集成和数据智能处理来增强医疗预测系统的效能。

体现了医疗信息技术领域中对实时、精确医疗决策支持系统的需求增长。

例如,将实时数据处理与多模态数据分析相结合,可以实现更为动态和精准的疾病管理,这在处理慢性病如糖尿病或心血管疾病时尤为重要。

慢病预测更多模态

在慢性病预测中,考虑多模态数据是非常有益的,因为这可以显著增加预测的精确度和全面性。

以下是一些重要的数据模态,它们在慢性病预测中可以提供关键信息:

  1. 临床笔记和医疗记录:这些文本数据提供了患者的详细病史,包括症状描述、治疗反应、以及医生的观察和推论。

  2. 实验室测试结果:血液、尿液等生化检测结果提供了关于患者生理状况的具体量化数据,如血糖、胆固醇、肝功能指标等。

  3. 影像医学数据:包括X光、MRI、CT扫描等影像资料,这些图像数据能帮助评估器官的结构和功能状况,对于诊断如癌症、心脏病等疾病尤为重要。

  4. 生理监测数据:如心电图、血压监测、血糖监测等连续的生理参数监测,可以提供关于患者状况的实时数据。

  5. 可穿戴设备数据:随着技术的发展,越来越多的健康相关数据可以通过可穿戴设备收集,如活动量、心率、睡眠质量等,这些数据有助于理解患者的生活习惯和日常健康状况。

  6. 遗传信息:基因数据可以揭示个体对特定疾病的易感性,对于预测遗传性疾病或评估疾病风险具有重要价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1888712.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DC-DC 5V1A输出异步升压恒压芯片FP6291-5V/1A(5W)芯片,5V、9V、12V可调输出

FP6291LR-G1:DC-DC异步升压恒压5V/1A(5W)芯片,2.6-5.5V供电,内置MOS,最高输出5-12V/5-7W,输入限流可调 FP6291是一个电流模式升压DC-DC转换器。它的PWM电路内置0.2Ω功率MOSFET使该调节器高效。内部补偿网…

第4章 第一个程序

第4章 第一个程序 4.1 一个源程序从写出到执行的过程 第一步:编写汇编程序第二步:对源程序进行编译连接第三步:执行可执行文件中的程序 4.2.源程序 汇编语言中包含两种指令:汇编指令 和 伪指令 汇编指令:有对应机器…

挖逻辑漏洞不懂数据权限怎么赚大钱?

从开发的角度看权限漏洞的最后一篇了,也就是数据权限篇,虽然之前的都没什么人看,但想了想还是花时间写完了,也算有始有终吧。 0x00 相比于之前的未授权《一文理解权限类漏洞产生的原因之未授权篇》与功能权限《权限类漏洞解析—…

【实战场景】记一次UAT jvm故障排查经历

【实战场景】记一次UAT jvm故障排查经历 开篇词:干货篇:1.查看系统资源使用情况2.将十进制进程号转成十六进制3.使用jstack工具监视进程的垃圾回收情况4.输出指定线程的堆内存信息5.观察日志6.本地环境复现 总结篇:我是杰叔叔,一名…

20_系统测试与维护

目录 测试基础知识 测试原则 动态测试 静态测试 测试策略 测试阶段 测试用例设计 黑盒测试用例设计 白盒测试用例设计 McCabe度量法 鲁棒性测试 缺陷探测率(Defect Detection Percentage,DDP) 调试 系统维护基础 系统转换 系统维护指标 软件容错技术 嵌入式安…

Java语言开发的一套智慧产科系统源码:产科专科电子病历系统源码

Java语言开发的一套智慧产科系统源码:产科专科电子病历系统源码 系统概述 电子病历系统是以住院病人为中心,面向医生以及护士为主的,涉及临床治疗、护理等业务的临床信息系统,以电子信息技术为手段,实时采集病人在整个…

设计模式-结构型-08-组合模式

文章目录 1、学校院系展示需求2、组合模式基本介绍3、组合模式示例3.1、 解决学校院系展示(透明模式1)3.2、高考的科目(透明模式2)3.3、高考的科目(安全组合模式) 4、JDK 源码分析5、注意事项和细节 1、学校…

33.哀家要长脑子了!

憋说了,感觉好不容易长出来的脑子又缩回去了。。。 1.539. 最小时间差 - 力扣(LeetCode) 把所有时间排好序,然后计算两两之间的分钟差就好,但是要注意加上最后一个和第一个的判断,因为这个时间是按字典序来…

python-切片、集合

序列是指:内容连续、有序,可使用下标索引的一类数据容器 序列的常用操作 - 切片 切片的语法 序列的常用操作 - 切片 注意切片的范围是左闭右开 为什么使用集合 集合的常用操作 - 修改 集合的常用操作 - 集合长度 集合常用功能总结 集合的特点

为RK3568或RK3288开发板创建交叉编译环境{采用amd64的ubuntu系统配置交叉编译arm64开发环境}(保姆级包括安装QT)超详细记录版

为RK3568或RK3288开发板创建交叉编译环境{采用amd64的ubuntu系统配置交叉编译arm64开发环境}【保姆级包括安装QT】超详细记录版 Chapter1 为RK3568或RK3288开发板创建交叉编译环境{采用amd64的ubuntu系统配置交叉编译arm64开发环境}(保姆级包括安装QT)超详细记录版一. 安装QT程…

严防数据泄露:风险评估来预警,自查自纠防患未然!

近年来,随着数字化和网络化的快速发展,数据泄露事件呈现高发态势。网络攻击者利用复杂的攻击手段和技术,不断寻找和利用系统中的漏洞,以窃取或破坏数据,对企业声誉、客户信任以及经济利益造成巨大影响。 一、数据泄露的…

提升船舶轨迹查询效率

文章目录 引言I 优化思路1.1 表结构设计1.2 解析请求参数,定位到对应的表格进行查询1.3 mybatis查询1.4 效果II 工具方法2.1 日期处理2.2 spring开启debug日志引言 需求: 查询船舶轨迹 I 优化思路 1.1 表结构设计 按天存储轨迹数据,本文是一个月存储在6在表中,即:01,06…

Windows Hello | 看起来您已经在另一个帐户上设置了 Windows Hello。

问题: 换了新电脑之后一直设置不了Window Hello,报错是 "it looks like youve already setup Windows Hello on another account."。 >>重复set up不行。 >>从旧电脑移除了Windows Hello设置也不行。 >>确认过我的Local…

自闭症学生的刻板行为表现与教育干预策略

在自闭症学校的日常教学中,我深刻体会到刻板行为是许多学生常见且显著的特征之一。这些行为不仅影响学生的学习效果,也是他们与外界沟通互动的一大障碍。 刻板行为首先体现在动作上,学生们可能会反复进行某些无意义的动作,如摇晃身…

如何实现在短信链接中直接打开微信小程序

你是否有过这样的体验,收到一条短信,里面有一个链接,点击后就直接打开了微信,并且进入了一个小程序。这种神奇的功能是如何实现的呢?本文将为你揭晓答案。 利用微信URL Link 接口生成链接 要实现短信中的链接直接打开…

分位数回归模型及 Stata 具体操作步骤

目录 一、引言 二、理论原理 三、数据 四、Stata 程序代码及解释 五、代码运行结果及分析 一、引言 分位数回归作为一种强大的统计分析方法,能够更全面地揭示自变量与因变量在不同分位数水平上的关系。与传统回归仅关注均值不同,分位数回归有助于我们…

function-calling初体验

课程地址:https://learn.deeplearning.ai/courses/function-calling-and-data-extraction-with-llms/lesson/1/introduction github notebook地址:https://github.com/kingglory/LLMs-function-calling/tree/main Function-Calling 介绍 函数调用(Funct…

GAMES104:04游戏引擎中的渲染系统1:游戏渲染基础-学习笔记

文章目录 概览:游戏引擎中的渲染系统四个课时概览 一,渲染管线流程二,了解GPUSIMD 和 SIMTGPU 架构CPU到GPU的数据传输GPU性能限制 三,可见性Renderable可渲染对象提高渲染效率Visibility Culling 可见性裁剪 四,纹理压…

格式化选NTFS还是exFAT 格式化NTFS后Mac不能用怎么办 移动硬盘格式化ntfs和exfat的区别

面对硬盘、U盘或移动硬盘的格式化决策,NTFS与exFAT作为主流的文件系统,用户在选择时可以根据它们的不同特点来选择适用场景。下面我们来看看格式化选NTFS还是exFAT,格式化NTFS后Mac不能用怎么办的相关内容。 一、格式化选NTFS还是exFAT 在数…

网络基础:EIGRP

EIGRP(Enhanced Interior Gateway Routing Protocol)是由思科开发的一种高级距离矢量路由协议,结合了距离矢量和链路状态路由协议的优点;EIGRP具有快速收敛、高效带宽利用、负载均衡等特点,适用于各种规模的网络。EIGR…