图增强LLM + 个性化健康

news2025/2/23 17:41:31

图增强LLM + 个性化健康

    • 提出背景
    • 图增强LLM = 子解法1(使用层次图模型) + 子解法2(动态数据整合) + 子解法3(LLM引导评估)

 


提出背景

论文:https://arxiv.org/pdf/2406.16252

健康监测系统通过持续捕捉生理和行为数据,为预防措施和早期健康干预提供了支持,从而彻底改变了现代医疗保健。

虽然将这些数据与大型语言模型(LLM)结合使用在提供互动健康建议方面显示出潜力,但传统方法如检索增强生成(RAG)和微调常常未能充分利用可穿戴设备中复杂、多维度且与时间相关的数据。

这些常规方法通常因为缺乏动态整合和解读多样健康数据流的能力,而提供有限的可操作和个性化健康见解。

作为回应,本文引入了一个图增强的LLM框架,旨在显著增强健康见解的个性化和清晰度。

通过使用层次性图结构,该框架捕捉患者间和患者内关系,利用来自随机森林模型的动态特征重要性评分来丰富LLM提示。

我们通过COVID-19封锁期间涉及20名大学生的睡眠分析案例研究来展示这种方法的有效性,突出了我们模型生成可操作和个性化健康见解的潜力。

我们利用另一个LLM来评估这些见解的相关性、全面性、可操作性和个性化,以解决模型有效处理和解释复杂健康数据的关键需求。

我们的发现表明,通过我们的框架增强提示可以在所有四个标准上获得显著改进。通过我们的框架,我们可以引出针对特定患者定制的、更周到的响应。

 
一般来说,这些方法可以分为两大类。

第一类直接将可穿戴设备的原始信号值提示给LLM以执行任务。

例如,Health-LLM将可穿戴设备的时间序列信号转录并输入到LLM中以增强预测能力。

第二类涉及一个中间步骤来处理数据并将其转换为自然语言文本。

这一步骤可能使用统计模型、机器学习模型或其他旨在比LLM更有效处理数据的技术。

然后将处理后的输出转录为文本,并使用RAG或基于代理的方法输入到LLM中。

例如,Chatdiet演示了LLM与因果推断在可穿戴数据上的增强,以提供个性化的饮食建议。

类似地,采用一个代理框架,OpenCHA,它集成了由协调者组织的外部增强,以改善糖尿病管理。

这些进展表明将可穿戴技术与语言模型合并,以开发尖端的健康监测解决方案的潜力。

然而,现有方法在从可穿戴和移动设备收集的数据中提取复杂见解方面仍然存在不足。

这些方法由于无法充分利用多维度和与时间相关的数据,难以提供高质量的个性化响应。

直接输入可穿戴传感器的原始信号值会妨碍LLM理解这些信号,因为LLM并未设计或训练以有效处理数字数据。

第二类方法严重依赖中间数据处理模型,但这些模型并未针对与LLM的有效整合进行优化。

因此,它们在捕获来自可穿戴设备的全面健康见解方面遇到困难,特别是时间模式和患者间相似性。

迫切需要改进的模型,能够有效处理和解释复杂的个人健康数据,以提供清晰、可解释和可操作的见解。

在本文中,我们介绍了一个图增强的LLM框架,用于生成个性化健康见解。

该框架利用一个层次图结构,每个患者是一个节点,每天的数据是子节点,通过余弦相似性连接,以反映日常和整体模式的相似性。

这种设置使得图能够通过一个训练有素的随机森林模型在历史和类似患者数据上增强LLM提示的特征重要性评分。

我们在一项聚焦睡眠分析的案例研究中评估了框架的有效性,使用的数据来自2020年3月COVID-19封锁期间南加州的20名大学生。

我们通过使用另一个LLM评估这些响应在四个主要标准——相关性、全面性、可操作性和个性化——上的质量。

在这里插入图片描述
这张图展示了一个基于图的个性化提示框架,用于睡眠分析的案例研究。整个框架分为四个主要部分:

  1. 初始提示(Initial Prompt)

    • 这是对框架的输入查询,例如:“Can you generate sleep-related insights for Patient 1 on 2020-11-23?”(你能为2020年11月23日的第一病人生成与睡眠相关的见解吗?)。
  2. 个性化提示框架(Personalized Prompt Framework)

    • 这一部分涉及数据集的整合,包括患者的人口统计信息、生理数据(如睡眠、心率变异性(HRV)、活动量)以及文本数据(如日常日记条目)。
    • 框架使用图形结构来表示患者数据,其中每个节点代表一个患者,子节点代表每天的数据。这些节点通过特征重要性得分(由机器学习模型训练得出)来连接,反映了时间内和患者间的相似性。
  3. 增强提示(Augmented Prompt)

    • 在这一阶段,框架根据收集到的信息生成一个增强的查询提示,包括患者的人口统计信息、当前日数据、以及特征重要性概要。这个增强的提示被用来向LLM(大型语言模型)提问,例如:“Can you generate sleep-related insights?”(你能生成与睡眠相关的见解吗?)。
  4. 见解生成(Insight Generation)

    • LLM使用上述增强的提示来生成与患者具体情况相关的睡眠见解。这些见解是基于患者的具体数据和通过框架分析的模式生成的。

这个框架通过结合患者的详细数据和先进的语言模型处理,提高了健康见解的个性化和相关性。

我们提出了一个图增强的大型语言模型(LLM)框架,通过加强用户提示与患者数据的整合,以提供个性化的健康见解。

它允许用户查询特定日期的患者可穿戴数据,如睡眠模式、活动水平和心率。

该过程从一个自然语言处理(NLP)引擎开始,该引擎提取提示中的关键细节,如患者ID、感兴趣的指标和日期。引擎检索来自数据集的相关人口统计和特定日期的数据。为了个性化,我们开发了一个内部和患者间相似性图,以描述层次数据关系。

NLP引擎与图形交互,以识别与查询最相关的日期,并支持一个特征重要性模型,该模型根据类似患者的数据确定影响健康指标的关键因素。

得到的增强提示,富含这些见解,被输入到LLM中以生成个性化的健康见解。

该框架架构的概述如图1所示。接下来,我们将概述所提框架的每个组成部分。

A. NLP引擎

NLP引擎协调用户查询,从提示中提取关键标识符,如患者ID和日期。

它访问数据集以检索相关的人口统计和特定日期的数据,使增强提示与用户的查询对齐。

利用预先建立的内部和患者间相似性图,引擎识别相关的时间和患者比较模式。

它还整合了从类似患者的数据中训练出的特征重要性分数。

这种整合使用户的初始提示富含全面的上下文细节,为LLM的最佳理解格式化。

B. 数据集

数据集包含去标识的患者记录,包括按患者ID和日期索引的人口统计、可穿戴和文本数据。

NLP引擎访问这个数据集,使用检索增强生成(RAG)方法[7]检索相关的患者特定信息。

C. 内部和患者间相似性图

该图整合了多样的生理、行为和文本数据,利用NLP技术如情感分析提取与期望健康结果相关的情感和主题。

经过仔细选择和标准化,这些多模态数据点形成一个全面的多维患者档案。

我们使用这些档案构建一个内部和患者间相似性图,使用余弦相似性来量化和连接基于天数和患者间的相似性和差异性的关系。

这种结构对于动态细化LLM输入至关重要,从而通过识别患者数据中的模式,增强其生成精确健康见解的能力。

D. 特征重要性

我们开发了一个机器学习模型(即随机森林),以识别影响感兴趣健康指标的最有影响力的因素,使用历史数据和从图中得出的最相似患者的信息。

这个模型对于确定关键变量至关重要,它使用从每个用户提示中提取的图形数据进行训练。

提示中的细节,如患者的ID和指定日期,指导NLP引擎从图中提取相关信息。

然后使用得到的特征重要性分数动态增强提示模板,提高生成见解的准确性和相关性。

E. 见解生成

在我们流程的最后阶段,我们使用LLM生成个性化健康见解。

提示富含来自患者档案及其相似患者网络的相关上下文信息。

LLM利用其先进的自然语言能力和广泛的预训练知识,提供对个体健康模式和福祉的细致见解。

这种方法结合了传统机器学习生成的见解与先进NLP的推理能力和广泛的预训练知识,以产生全面的、个性化的健康建议,专为每个患者量身定制。

图增强LLM = 子解法1(使用层次图模型) + 子解法2(动态数据整合) + 子解法3(LLM引导评估)

  1. 子解法1:使用层次图模型

    • 特征: 提高数据关联性识别的精确性
    • 原因: 层次图能够有效捕捉患者间和患者内的复杂关系,这对于健康数据尤其重要,因为患者的健康状况可能受多种因素的共同影响。例如,通过比较不同患者的睡眠模式和生活习惯,可以发现潜在的健康风险因素。
  2. 子解法2:动态数据整合

    • 特征: 提升个性化健康见解的相关性和准确性
    • 原因: 动态数据整合允许系统实时更新和引入最新的健康数据,例如日常活动水平或最近的心率变化,使得生成的健康见解不仅基于历史数据,而且反映当前的健康状况。比如,如果一个患者最近开始执行新的锻炼计划,系统可以快速调整健康建议以适应这种变化。
  3. 子解法3:LLM引导评估

    • 特征: 保证健康见解的质量和实用性
    • 原因: LLM引导评估利用先进的自然语言处理技术,对生成的健康见解进行质量控制,确保其在相关性、全面性、可操作性和个性化方面符合高标准。例如,通过LLM模型评估一个关于心脏健康的建议,可以确保该建议不仅科学准确,而且能被患者轻松理解并实际应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1889913.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ui.perfetto.dev sql 查询某个事件范围内,某个事件的耗时并降序排列

ui.perfetto.dev sql 查询某个事件范围内,某个事件的耗时并降序排列 1.打开https://ui.perfetto.dev 导入Chrome Trace Json文件2.ParallelMLP.forward下的RowParallelLinear.forward3.点击Query(SQL),在输入框中输入以下内容,按CtrlEnter,显示查询结果4.点击Show timeline,点击…

Python特征工程 — 1.4 特征归一化方法详解

目录 1 Min-Max归一化 方法1:自定义的Min-Max归一化封装函数 方法2: scikit-learn库中的MinMaxScaler 2 Z-score归一化 方法1:自定义的Z-score归一化封装函数 方法2: scikit-learn库中的StandardScaler 3 最大值归一化 4 L…

不是大厂云用不起,而是五洛云更有性价比

明月代维的一个客户的大厂云境外云服务器再有几天就到期了,续费提醒那是提前一周准时到来,但是看到客户发来的续费价格截图,我是真的没忍住。这不就是在杀熟吗?就这配置续费竟然如此昂贵?说实话这个客户的服务器代维是…

20240703在飞凌OK3588-C开发板上刷Rockchip原厂的Buildroot20220811

20240703在飞凌OK3588-C开发板上刷Rockchip原厂的Buildroot20220811 2024/7/3 18:25 详细的刷机LOG: [BEGIN] 2024/7/3 18:18:49 rootRK3588:/# DDR Version V1.07 20220412 LPDDR4X, 2112MHz channel[0] BW16 Col10 Bk8 CS0 Row16 CS1 Row16 CS2 Die BW16 Size204…

创建线程的五种方式

一.继承Thread ,重写run class MyThread extends Thread{Overridepublic void run() {//这里的内容就是该线程要完成的工作while(true) {System.out.println("hello thread");try {Thread.sleep(1000);} catch (InterruptedException e) {throw new RuntimeExceptio…

类和对象(提高)

类和对象(提高) 1、定义一个类 关键字class 6 class Data1 7 { 8 //类中 默认为私有 9 private: 10 int a;//不要给类中成员 初始化 11 protected://保护 12 int b; 13 public://公共 14 int c; 15 //在类的内部 不存在权限之分 16 void showData(void)…

远程登录WINDOWS10,提示你的凭据不工作

1:想通过远程桌面登录WINDOWS10输入用户名和密码后,出现下面的提示。 2:登录WINDOWS10,在运行中输入gpedit.msc 3:本地组策略编辑器窗口中,依次展开,计算机配置 ---> 管理模版---> 系统--…

海外注册 | 欧盟医疗器械法规下免除临床试验的条件与要求

在欧盟医疗器械法规(MDR)的严格监管下,植入性医疗器械和III类医疗器械通常需要进行临床试验来证明其安全性和性能。 然而,MDR也规定了一些特定情况下免除临床试验的可能性。以下是免除临床试验的条件和要求的详细说明&#xff1a…

“穿越时空的机械奇观:记里鼓车的历史与科技探秘“

在人类文明的发展历程中,科技的创新与进步不仅仅推动了社会的进步,也为我们留下了丰富的文化遗产。记里鼓车,作为一种古老的里程计量工具,其历史地位和技术成就在科技史上具有重要的意义。本文将详细介绍记里鼓车的起源、结构原理…

视频分析、目标检测的过去和未来:目标检测从入门到精通 ------ YOLOv8 到 多模态大模型处理视觉基础任务

文章大纲 计算机视觉项目的关键步骤目标检测入门视频分析项目最佳实践数据集构建数据准备:数据集标注规范与数据规模参考标注工具标注工具:目标检测yolo 极简标注工具综合标注工具:label-studio半自动标注工具:X-AnyLabeling目标检测与多模态哪些多模态模型可以做目标检测?…

顺序表--续(C语言详细版)

2.9 在指定位置之前插入数据 // 在指定位置之前插入数据 void SLInsert(SL* ps, int pos, SLDataType x); 步骤: ① 程序开始前,我们要断言一下,确保指针是有效的,不是NULL; ② 我们还要断言一下,指定的…

【大模型LLM面试合集】大语言模型基础_llm概念

1.llm概念 1.目前 主流的开源模型体系 有哪些? 目前主流的开源LLM(语言模型)模型体系包括以下几个: GPT(Generative Pre-trained Transformer)系列:由OpenAI发布的一系列基于Transformer架构…

64位Office API声明语句第120讲

跟我学VBA,我这里专注VBA, 授人以渔。我98年开始,从源码接触VBA已经20余年了,随着年龄的增长,越来越觉得有必要把这项技能传递给需要这项技术的职场人员。希望职场和数据打交道的朋友,都来学习VBA,利用VBA,起码可以提高…

JVM原理(十二):JVM虚拟机类加载过程

一个类型从被加载到虚拟机内存中开始,到卸载为止,它的整个生命周期将会经过 加载、验证、准备、解析、初始化、使用、卸载七个阶段。其中 验证、准备、解析三个部分统称为 连接 1. 加载 加载是整个类加载的一个过程。在加载阶段,Java虚拟机…

第25篇 滑动开关控制LED<三>

Q:如何创建流水灯汇编语言程序工程并运行呢? A:基本原理:与用单个SW控制单个对应LED点亮与熄灭一样,我们创建用SW控制流水灯状态。默认初始状态为4个连续的红色LED为一组(每组之间隔4个熄灭的LED&#xff…

如何在网络抓取过程中绕过 CAPTCHA 和 reCAPTCHA?

什么是 CAPTCHA? CAPTCHA,全称为 “Completely Automated Public Turing test to tell Computers and Humans Apart”(完全自动化的公共图灵测试以区分计算机和人类),是一种用于识别网站访问者是否为真实人的测试。 这…

绝区零国际服怎么下载 绝区零国际服下载教程

绝区零即将上线,每位玩家都能在这里开启全新的时空冒险之旅,主要玩法分为以剧情和副本为主的核心玩法、以刷材料为主的养成副本,以及日常任务为主,在以往的手游中,玩家进入某项玩法只需要从游戏界面调取菜单即可&#…

Django 一对一关系

作用: 两个数据库表建立外键关系当外键表的数据被删除时,主表的数据也会一并删除。 1,添加表模型 Test/app8/views.pyfrom django.db import modelsclass User(models.Model):username models.CharField(max_length50, uniqueTrue)email …

程序员AI提效案例:统计B站课程耗时情况

文章目录 一,时长统计需求二,一波三折三,终极方案 AIJava总结 今天为了写一篇博客,这篇博客介绍了B站的一个Java项目,这个项目分为三个阶段: 初级篇高级篇运维篇 一,时长统计需求 我想根据每个…