PhysioLLM 个性化健康洞察:手表可穿戴设备实时数据 + 大模型

news2025/1/17 9:02:53

个性化健康洞察:可穿戴设备实时数据 + 大模型

    • 提出背景
    • PhysioLLM 图
      • PhysioLLM 实现
        • 数据准备
        • 用户模型和洞察生成
        • 个性化数据总结和洞察是如何生成的?
      • 解析分析

 


提出背景

论文:https://arxiv.org/pdf/2406.19283

虽然当前的可穿戴设备伴随应用,允许用户通过图形表示探索收集的数据,但发现可行的见解仍然是一个挑战。

仅靠数据可视化可能导致在解释数据时产生偏见。

此外,虽然用户可以搜索特定问题的解决方案,但这些查询通常没有在其数据的背景下进行语境化。

个性化和富有洞察力的响应成为我们的主要研究。

PhysioLLM,这是一个交互式系统,通过整合来自可穿戴设备的生理数据与上下文信息,利用 LLMs 提供个性化的健康理解与探索。

与市面上的商业健康应用不同,我们的系统提供了一个全面的统计分析组件,该组件可以发现用户数据中的相关性和趋势,允许用户用自然语言提问并接收生成的个性化见解,并引导他们制定可行的目标。

作为案例研究,我们关注于改善睡眠质量,鉴于其通过生理数据的可测量性以及对总体福祉的重要性。

通过对24名Fitbit手表用户的用户研究,展示了PhysioLLM在促进深入的个性化健康数据理解和支持朝个人健康目标迈进的行动步骤方面,均优于单独使用Fitbit应用程序 和 一般的LLM聊天机器人。

 

可穿戴健康监测设备的出现,如Fitbit、苹果手表和三星Gear,使得连续收集详细的生理数据成为可能,例如心率、活动数据和睡眠阶段。

这些设备为我们的个人健康带来便利和意识,并提供了对个人习惯及其对生理状态影响的详细了解。

这些数据和趋势可以帮助促进更健康的行为,甚至可能帮助检测健康问题。

虽然制作可访问和准确的健康监测系统很重要,但希望改变习惯的个人目前需要首先深入了解他们的生理数据及其与日常生活的关联,最后思考实现积极变化的方法。

然而,用户常常难以理解这些数据并将其转化为有意义的行动。

与数据的交互通常是由手机和可穿戴设备提供的图形用户界面预定义的,这些界面提供的交互有限,建议也通常是泛泛而谈,缺乏个性化见解。

LLMs可能是应对这些挑战的有希望的解决方案。

首先,它们使个人能够进行无限制的提问,通过与界面交互前后的评估,了解他们对自己的睡眠数据的理解、交互后的动机感以及基于交互的目标的可操作性。

结果显示,与基于LLM的系统聊天,利用我们的LLM架构提供有效的个性化见解,可以改善个人对自身健康的理解。

与通用的LLM-based聊天机器人相比,界面被感知为更加个性化。

事实上,后者导致用户改变的动机减少,其目标的可操作性也被发现较低。

我们还采访了两位睡眠专家,审查系统生成的个人见解及其对用户的回应和建议。

总的来说,专家们认为见解合理,但指出系统倾向于过分强调相关性值。

他们建议通过向LLM提供更多关于数据生成过程的背景信息,并调整回应使其在基于稀疏数据和可能的伪相关时更为谨慎,来改进系统。

总结本研究的贡献如下:

  • 一种新颖的LLMs编排方式,整合生理和上下文数据,支持关于个性化健康见解的对话。
  • 一项与系统互动的24名用户进行的实地研究,及从定量和定性结果中得出的研究见解。
  • 证据显示界面被感知为个性化,并通过个性化见解有效改善用户对其健康的理解。
  • 两位睡眠专家对生成的个人见解和建议的准确性和质量的初步评估。

PhysioLLM 图

在这里插入图片描述

这幅图是一个关于PhysioLLM系统的概览图,展示了一个与睡眠健康相关的示例对话。

图中的流程分为几个部分:

  1. 生物数据和Fitbit数据:系统收集并整理用户的生物信息和Fitbit设备记录的数据。

  2. 数据准备:数据被分析,包括汇总、趋势和相关性分析。

  3. 洞察生成:使用GPT模型基于数据生成洞察,提供数据来源、洞察、解释和可能性。

  4. 对话

    • 初步对话:系统向用户介绍他们的睡眠健康状况,基于Fitbit数据提供概览,包括平均步数、活动水平、平均睡觉和起床时间,以及睡眠效率。
    • 洞察:系统分析日间活动与睡眠数据的相关性,揭示如活动与睡眠效率、久坐行为与睡眠时长、活跃峰值与心率峰值之间的关系。
    • 后续提问建议:系统建议用户可以进一步探询的问题,如身体疲劳如何影响睡眠周期,或久坐行为如何影响睡眠结构。
    • 用户响应:对于如何每日步数影响深度睡眠百分比的问题,系统提供了一个基于数据的正面关联解释,并提出增加日常活动可能改善深度睡眠质量。

这个系统通过自然语言处理技术来帮助用户理解并优化他们的健康习惯。

PhysioLLM 实现

该系统由三个主要组成部分构成:数据准备、洞察生成和对话界面。

数据准备

响应的质量取决于输入数据的质量和可解释性,这需要一个将数据准备成LLM所期望的格式并指导LLM如何解释数据的过程。

最初,我们考虑利用LLM的代码生成能力来进行数据的实时分析。

早期实验表明,这种方法无法始终保持准确和快速,这是两个重要的设计原则。

此外,生成定制函数的需求很少;有意义的分析通常属于基本的统计分析类别,如平均值、方差、时间趋势和数据类型间的相关性。

因此,系统包括一个“离线”(与实时相对)准备阶段,对用户的数据进行统计分析并进行总结。

具体过程如下:

  1. 数据过滤和对齐:将Fitbit数据导出并筛选感兴趣的日期。不同传感器的原始数据采样率不同。
  • 例如,步数每分钟采样一次,心率每5分钟采样一次,久坐分钟每天采样一次。
  • 因此,我们整合了每种数据类型的每日值和步数及心率的每小时值。
  • 准确表示时间信息至关重要,因为随后推导相关性和潜在因果关系的步骤依赖于时间维度。
  • 因此,我们根据设备的时区将不同的传感器数据按日期和时间对齐。
  • 由于我们关注日常活动对睡眠质量的影响,我们将“睡眠日期”调整为记录日间活动的次日。
  • 为简单起见,我们排除了小睡(即非主要睡眠事件)。如数据缺失,则使用周平均值。最终的数据列表见图2。
  1. 生成概要、趋势和相关性:数据经过过滤和对齐后,我们总结数据以提取周平均值、最小值和最大值日期及趋势。
  • 对于趋势,我们使用了±0.15的宽容阈值,因为目标不是进行统计假设检验,而是向LLM提供可能趋势的叙述描述。
  • 我们绘制了每小时步数和心率,以显示一周内每天活动和心率的视觉模式。
  • 然后,我们计算了成对相关值。
用户模型和洞察生成

数据如何相互关联及其含义对用户而言并不明显。

因此,仅将用户的数据整合到LLM中是不够的,因为类似的概要可以从智能手表的配套应用中获得。

此外,从网络搜索获得的建议往往是通用的。

虽然通用建议可能适用且有帮助,但捕捉异常和边缘案例无疑很重要但使用传统机器学习方法却很有挑战性。

LLM的优势在于:

  • (1)它们具有丰富的统计知识、健康见解和常识
  • (2)它们可以考虑用户的个人资料和其他上下文信息,如性别、年龄和习惯。

为了生成元级洞察,我们使用了OpenAI的GPT-4-turbo模型(温度=0,最大令牌=4096),这是一个能够接收多模态输入的LLM模型。

我们输入了用户的传记(由用户的人口调查提供)、数据的概要和相关矩阵以及心率和步数的每小时趋势图。

我们尝试输入相关矩阵作为图表,但这导致了持续的事实错误,因此改用数值表示的矩阵。

系统元提示指示LLM生成至少10个洞察。

每个洞察都需要提供理由、假设和解释,这些都要利用数据。

数据来源需要具体包含数值,并且必须使用不同的数据来源组合。

每个洞察后,需要给出一个0-10之间的分数,评估该洞察是影响睡眠质量的最重要因素的可能性。

个性化数据总结和洞察是如何生成的?

在这里插入图片描述

  • 数据准备:包括用户的基本信息如年龄、性别、职业、咖啡因摄入、饮食习惯及月经周期。

    利用Fitbit数据,涵盖了久坐、轻度活动、中度活动、高强度活动时间,以及每小时的休息心率、步数、呼吸率、心率变异性、睡眠效率、睡眠阶段、持续时间、醒来时间和就寝时间。

  • 数据分析:数据被整理成每周开始日期、平均值、趋势、最小值和最大值日期等。

    此外,还绘制了心率和步数的每小时趋势图,并创建了相关矩阵图,这有助于可视化数据间的相互关系。

  • 洞察生成:通过GPT模型生成的洞察,例如分析平均每日步数和平均睡眠效率之间的相关性。

    例如,发现较高的日常步数与较低的睡眠效率之间存在负相关,这可能表明在身体较为疲劳的日子里,睡眠质量会受到影响。

解析分析

解法:PhysioLLM通过集成大型语言模型(LLM)和可穿戴设备数据来生成个性化健康见解,并通过交互式对话提高用户对其健康数据的理解并帮助制定行动计划。

子解法1:集成Fitbit等可穿戴设备数据

  • 特征:可穿戴设备提供实时、连续的生理和活动数据,是生成健康见解的基础。
  • 之所以使用此子解法,是因为可穿戴设备数据能够提供关于用户日常生活和健康习惯的详尽信息,这些信息对于理解健康状况至关重要。
  • 例子:如果用户的步数明显减少,系统可能会提醒用户活动量下降可能影响健康。

子解法2:利用LLM生成个性化健康见解

  • 特征:LLM能够处理大量数据并生成复杂的语言输出,适合解释数据和提供基于数据的建议。
  • 之所以使用此子解法,是因为LLM可以从大量的生理数据中提取有意义的模式和趋势,将这些复杂的数据转化为用户可以理解的语言。
  • 例子:LLM分析用户的睡眠质量与日间活动量的数据,指出增加日间活动可能帮助改善夜间的睡眠质量。

子解法3:通过交互式对话界面与用户进行沟通

  • 特征:交互式对话使用户可以直接询问关于他们健康数据的问题,并得到即时的、个性化的回答。
  • 之所以使用此子解法,是因为直接的问答使用户能更深入地探索个人健康问题,并根据LLM提供的见解进行实时的讨论。
  • 例子:用户通过对话界面询问为什么晚上睡不好,LLM分析后可能建议减少咖啡因摄入和调整睡前习惯。

子解法4:使用后续问题引导用户深入探索

  • 特征:后续问题可以引导用户思考特定的健康行为或更改,这些都是基于数据生成的见解。
  • 之所以使用此子解法,是因为它帮助用户不仅停留在数据理解层面,更进一步地考虑如何应用这些见解来实现具体的健康改进。
  • 例子:系统可能会问用户是否愿意尝试在晚餐后散步以改善睡眠,这是根据用户的活动数据和睡眠质量数据的相关分析得出的建议。

逻辑链:这些子解法构成一个逻辑链条,每一步都为下一步提供必要的信息和基础,从数据集成到个性化见解的生成,再到交互式沟通,最后通过引导性问题促使用户行动,整个过程形成了一个从数据到行动的闭环。

优化点:

  • 原始解法:使用标准LLM直接生成健康见解。
  • 替换解法:采用Moe架构,多专家架构 + 使用特定于健康领域调优的LLM生成更精准的健康见解。
  • 分析:特定于领域的LLM在理解复杂健康数据方面表现更好,能提供更深入的见解,用户满意度和行动转化率更高。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1895044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue目录说明

vue目录说明 主要目录说明 .vscode - - -vscode工具的配置文件夹 node_modules - - - vue项目的运行依赖文件夹 public - - -资源文件夹(浏览器图标) src- - -源码文件夹 .gitignore - - -git忽略文件 index.html - - -入口html文件 package.json - - -…

SQL执行慢排查以及优化思路

数据库服务器的优化步骤 当我们遇到数据库调优问题的时候,该如何思考呢?我把思考的流程整理成了下面这张图。 整个流程划分成了观察(Show status)和行动(Action)两个部分。字母 S 的部分代表观察&#xf…

项目管理实用表格与应用【项目文件资料分享】

项目管理基础知识 项目管理可分为五大过程组(启动、规划、执行、监控、收尾)十大知识领域,其中包含49个子过程 项目十大知识领域分为:项目整合管理、项目范围管理、项目进度管理、项目成本管理、项目质量管理、项目资源管理、项目…

使用 iconfont.ttf文件保存多个图标文件,并且像文字一样使用代码绘制出来

先看演示效果 这里的多个图标其实是存储在 iconfont.ttf文件中 这个文件里面的图标对应的编码 显示代码 void CMFCApplication3Dlg::OnBnClickedOk() {// 加载字体文件CString fontPath = _T("C:\\Users\\35497\\Desktop\\test\\MFCApplication3\\font\\iconfont.ttf&qu…

searchForm自适应布局 + 按钮插槽

收起 展开 代码: useResizeObserverHooks.js import { useEffect, useLayoutEffect } from "react";export const useResizeObserver (containerDom, domClass, callback) > {useLayoutEffect(() > {let resizeObserver null;let dom null;if …

8人团队历时半年打造开源版GPT-4o,零延迟演示引爆全网!人人可免费使用!

目录 01 Moshi 02 背后技术揭秘 GPT-4o可能要等到今年秋季才会公开。 然而,由法国8人团队开发的原生多模态Moshi,已经达到了接近GPT-4o的水平,现场演示几乎没有延迟,吸引了大量AI专家的关注。 令人惊讶的是,开源版的…

代码随想录算法训练营第69天:图论7[1]

代码随想录算法训练营第69天:图论7 109. 冗余连接II 卡码网题目链接(ACM模式)(opens new window) 题目描述 有向树指满足以下条件的有向图。该树只有一个根节点,所有其他节点都是该根节点的后继。该树除了根节点之外的每一个节…

AI大模型:解锁未来职业竞争力的金钥匙

AI元年:大模型的革新力量 随着ChatGPT的震撼登场,2023年被标记为AI元年,大模型以其前所未有的影响力,重塑我们的日常生活和工作方式。从日常的问答对话到复杂的编程辅助,乃至创意图像生成,AI大模型展现出超…

怎么还有人分不清路由器、交换机、光猫、WiFi……你真的都了解吗?

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部 下午好,我的网工朋友。 讲某个具体技术,说不定你头头是道,但关于路由器、交换机、光猫、WiFi的知识细节&…

AI PC(智能电脑)技术分析

一文看懂AI PC(智能电脑) 2024年,英特尔、英伟达等芯片巨头革新CPU技术,融入AI算力,为传统PC带来质的飞跃,引领智能计算新时代。 2024年,因此被叫作人工智能电脑(AI PC)…

我尝试了新的 OpenAI 连接器,真太棒了!

我们上个月发布的新连接器将 Open AI 集成简化为仅需几步操作。我实现了聊天完成 API(有和没有上下文),并想编写一个关于其工作原理的快速教程。 先决条件 与往常一样,在进入主要构建之前我们需要做一些准备工作。你会需要&…

FFT 简单基础(matlab

使用 fs 进行采样,进行 N点FFT 选择显示0~N/21点的幅值 横坐标对应频率计算公式: fs * n / N 举个梨子: 频率2kHz采样1s,得到2000个点的序列y(n) 对序列y(n)做4096点的FFT 幅值响应对应的横坐标频率…

隐私信息管理体系认证:守护个人信息,筑牢隐私防线

在数字化浪潮汹涌的当下,个人信息安全问题愈发凸显其重要性。随着互联网技术的飞速发展,我们的隐私信息如同裸露在阳光下的沙滩,稍有不慎就可能被不法分子窃取或滥用。因此,构建一个完善的隐私信息管理体系,成为了保障…

实现第一个神经网络

PyTorch 包含创建和实现神经网络的特殊功能。在本节实验中,将创建一个简单的神经网络,其中一个隐藏层开发一个输出单元。 通过以下步骤使用 PyTorch 实现第一个神经网络。 第1步 首先,需要使用以下命令导入 PyTorch 库。 In [1]: import…

免费通配符/泛域名SSL证书快速申请攻略

在互联网时代,网站安全的重要性日益凸显,而SSL证书作为保障网站安全的关键工具,其重要性不言而喻。对于拥有多个子域名的网站来说,通配符/泛域名SSL证书更是必不可少的安全保障。下面将介绍如何申请免费的通配符/泛域名SSL证书。 …

EXTI寄存器,AFIO的简洁,EXTI配置的流程

一,AFIO简介 AFIO是Alternate Function Input/Output 的缩写,表示复用功能IO,主要用于实现IO端口的复用功能以及外部中断的控制 STM32外设有很多I/O以及内置外设(如12C,ADC,ISP,USART等)。为节省引出管脚的…

案例分享:数据集市搭建方案中集成SQLFlow数据血缘分析工具

本文中描述的数据集市搭建方案是一家跨国公司在AWS平台上的具体实践案例。我公司参与其中的数据血缘部分的建设,SQLFlow数据血缘分析工具在该方案中帮助用户实现了数据血缘分析。 用户使用Redshift 数据库仓库进行数据集市开发。从各种数据源提取数据,并…

【电路笔记】-B类放大器

B类放大器 文章目录 B类放大器1、概述2、B类放大器介绍3、推挽式配置4、限制交叉失真5、B类放大器效率6、总结1、概述 我们在之前的文章中已经知道,A 类放大器的特点是导通角为 360,理论最大效率为 50%。 在本文中,我们将详细介绍另一类放大器,称为B类放大器,它是为解决A…

CAN总线Bus-off机制介绍及恢复策略说明

CAN总线Bus-off机制介绍及恢复策略说明 Bus-off产生机制 CAN通信Bus-off即总线关闭态,一个CAN节点有三种状态,主动错误状态、被动错误状态以及总线关闭态。如下图可知进入Bus-off的原因是因为发送错误大于255,在此状态节点不能收发报文。 以上三种错误状态标识发生故障的严…