Nature Medicine | 常规机器学习构建蛋白质组衰老时钟!对于数学基础不好的同学,好好思考一下这种研究模式如何借鉴?

news2024/12/22 19:43:29

今天给各位老铁们分享一篇于2024年08月08号发表在 Nature Medicine [58.7] 的文章:"Proteomic aging clock predicts mortality and risk of common age-related diseases in diverse populations",蛋白质组衰老时钟可预测不同人群的死亡率和常见与年龄相关的疾病的风险。

图片

DOI:10.1038/s41591-024-03164-7

摘要

背景循环血浆蛋白在人体健康中起着关键作用,并有可能用于测量生物年龄,从而预测与年龄相关的疾病、多发病和死亡的风险。

方法与结果:在这项研究中,作者使用 UK Biobank 中包含 2,897 种血浆蛋白的蛋白质组数据,通过 LightGBM 等机器学习模型开发了一个蛋白质年龄预测模型(领域术语: 蛋白质年龄时钟,age clock),并探讨了其在不同人群中预测重大疾病发病率和死亡率的作用。研究人员识别出了 204 种能够准确预测实际年龄的蛋白质,并发现蛋白质组老化评分与 18 种主要慢性疾病的发生(包括心脏病、肝病、肾病、肺病、糖尿病、神经退行性疾病和癌症)、多发病以及全因死亡风险相关。此外,蛋白质组老化还与生物、体力和认知功能的年龄相关指标相关,包括端粒长度、虚弱指数和反应时间。功能分析显示,对蛋白质组年龄时钟贡献最大的蛋白质涉及多种生物功能,包括细胞外基质相互作用、免疫反应和炎症、激素调节和生殖、神经元结构和功能以及发育和分化。在验证集: 中国(n=3,977)和芬兰(n=1,990)生物银行数据库中,蛋白质组年龄时钟的年龄预测准确度与其在英国生物银行中的表现相似。

结论:本研究结果表明,蛋白质组老化涉及多个功能类别的蛋白质,并且可以用于预测跨地理和遗传多样化人群的年龄相关功能状态、多发病和死亡风险。

所用数据

  • UKB(UK Biobank):来自45,441名随机选取的参与者(54%为女性,年龄范围39-71岁)的血浆蛋白质表达数据。这些数据用于开发蛋白质年龄钟模型。研究期间(11-16年的随访中),有4,828名(10.6%)参与者死亡。

  • CKB(China Kadoorie Biobank):在冠心病(IHD)病例队列研究中,使用了3,977名参与者(54%为女性,年龄范围30-78岁)的蛋白质表达数据。在11-14年的随访中,有1,426名(36%)参与者死亡。

  • FinnGen:从1,990名芬兰参与者(52%为女性,年龄范围19-78岁)中收集的蛋白质表达数据,这些参与者大多是健康人群。在研究期间,只有1%(n=22)的参与者在随访中死亡。

| 研究内容

1. 本研究的设计和主要分析方法

图片

▲ 图1:研究设计和分析方法概览。

  • a. 将UKB参与者按 70:30 的比例划分为训练集和测试集。在训练集中,使用LightGBM 模型通过 2,897 种血浆蛋白和五折交叉验证来预测实际年龄。使用 Boruta 特征选择算法筛选出 204 种与预测年龄相关的蛋白质,并使用这204种蛋白质重新训练了一个优化后的 LightGBM 模型,并在UKB测试集中进行评估。

  • b. 使用 CKB 和 FinnGen 的独立数据对蛋白质组年龄时钟模型进行进一步验证。

  • c. 使用全体UKB样本的五折交叉验证和 LightGBM 计算蛋白质预测年龄(ProtAge),并计算 ProtAge 与实际年龄的差值 ProtAgeGap。使用线性和逻辑回归测试 ProtAgeGap 与生物衰老标志物、虚弱程度以及生理和认知状态的关联。此外,使用 Cox 比例风险模型测试 ProtAgeGap 与死亡率、14种常见疾病和12种癌症的关联。由于 CKB 样本较小且 FinnGen 中缺乏疾病病例,大部分关联分析仅在 UKB 中进行。需要注意,计算模型预测年龄与实际年龄的差值 AgeGap 是大部分年龄预测模型的常见套路操作至于为什么要这么计算?以及后续为什么要分析这个差值与其它临床性状的关联,甚至将其作为一个评价指标?小编给出一些解释模型的预测是准确的(已被证明有效果),那么对于一个 AgeGap 比较大的样本(假设实际年龄 18,蛋白质模型预测年龄为 120),其虽然年龄小,但是具有老化的蛋白质组特征(简单理解就是,这个人的蛋白质特征与老头一样,即使实际年龄很小,但是看蛋白质指标的话,都要"入土"了 

2. 蛋白质组老化时钟在不同队列中的表现

图片

▲ 图2:蛋白质组老化时钟在不同队列中的表现。可以看到模型的拟合表现很不错,ProtAgeGap 得分在不同组别中并没有很大的异质性。

  • a. UKB、CKB 和 FinnGen 人群中年龄的密度图。

  • b. UKB、CKB 和 FinnGen 人群中死亡的密度图。

  • c. UKB 样本中所有疾病类型的流行和发病病例数。

  • d-f. UKB、CKB 和 FinnGen 三个测试队列中蛋白质组老化模型的表现。

  • g. ProtAgeGap 在不同队列中的分布。

  • h. ProtAgeGap 在不同人种的分布。

  • i. ProtAgeGap 在不同区域的分布。

3. 蛋白质组学衰老模型能够预测虚弱和衰老相关表型

图片

▲ 图3ProtAgeGap 与年龄相关的生物指标、身体机能的关联。

4. 蛋白质组学衰老是常见疾病的有力预测指标

图片

▲ 图4ProtAgeGap 将 UKB 和 CKB 中个体分为不同年龄特异性死亡率和疾病风险轨迹。

  • a-b. UKB 和 CKB 中按 ProtAgeGap 的上、中、下十分位 计算的疾病和死亡率累积发生图。每个小图显示每种疾病的发病例数,不同颜色的线段表示的仅是 ProtAgeGap 上、中、下十分位内的病例数而非完整数据集的病例数。UKB随访11-16年,CKB随访11-14年,按招募年龄(如a图中65岁年龄段显示的是招募时65岁年龄段人群在11-16年随访期间的累积发病率)。所有图中根据 Kaplan-Meier 生存函数显示给定时间点的事件累积密度,95%置信区间用浅色阴影表示。CKB 中仅显示在 ProtAgeGap 三个十分位内病例数皆超过 10 例的疾病。

图片

▲ 图5ProtAgeGap 与死亡率和常见疾病关联的效应值在调整协变量后基本保持不变。

还真没有什么复杂模型

如何借鉴一下这种研究思路

建模计算某种 Gap

使用 Gap 作为新的评价指标

当然,如果 Gap 有意义那就更好了

就分享到这了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2044839.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习-卷积神经网络(CNN)

机器学习-卷积神经网络(CNN) 1. 卷积神经网络的基本概念1.1 卷积层(Convolutional Layer)1.1.1 卷积操作1.1.2 特征图(Feature Map) 1.2 激活函数(Activation Function)1.2.1 ReLU&a…

JavaEE从入门到起飞(八) ~ Git

git 概括 Git是一个分布式版本控制工具,主要用于管理开发过程中的源代码文件(Java类、xml文件、html页面等)。 学了git能干什么? 代码回溯 查看历史提交记录并恢复到之前的某个状态。这在发现错误或需要查看特定版本时非常有用。和CtrlZ的区别在于g…

【图机器学习系列】(一)图机器学习简介

微信公众号:leetcode_algos_life,代码随想随记 小红书:412408155 CSDN:https://blog.csdn.net/woai8339?typeblog ,代码随想随记 GitHub: https://github.com/riverind 抖音【暂未开始,计划开始】&#xf…

Qt找不到QSound头文件,头文件QSoundEffect

目录 Qt找不到QSound头文件 CMake qmke 可能版本不同更新&#xff0c; 找不到QSound头文件 Qt找不到QSound头文件 #include <QSound> CMake 可以看一下这篇来自网上的文章 CMake中添加Qt模块的合理方法 - wjbooks - 博客园 (cnblogs.com) qmke 打开.pro文件&am…

Flowise在ubuntu22.04上的安装

之前我写过一篇FastGPT的文章&#xff0c;这里我再介绍另外一个开源的低代码工具&#xff0c;他提供开发人员可定制的LLM编排流程和AI代理。开发 LLM 应用程序通常涉及无数次迭代。Flowise的低代码和拖放式 UI 方法支持快速迭代&#xff0c;帮助您更快地从测试到生产。 推荐它的…

鸿蒙(API 12 Beta3版)【AVSession Kit简介】 音视频播控服务

AVSession Kit&#xff08;Audio & Video Session Kit&#xff0c;音视频播控服务&#xff09;是系统提供的音视频管控服务&#xff0c;用于统一管理系统中所有音视频行为&#xff0c;帮助开发者快速构建音视频统一展示和控制能力。 能力范围 提供音视频统一管控能力&…

Windows Server 域控制服务器安装及相关使用

目录 1.将客户机加入域 2.安装域控制器 3.新建域用户 4.设置用户登录时间&#xff0c;账户过期时间 5.软件分发 ​编辑 6.换壁纸 7.OU与GPO的概念 域为集中控制&#xff0c;拿下域控是拿下目标的关键 以Windows Server 2022为例 1.将客户机加入域 前提&#xff1a;客…

通过调整JVM的默认内存配置来解决内存溢出(‌OutOfMemoryError)‌或栈溢出(‌StackOverflowError)‌等错误

文章目录 引言I 调整JVM的默认堆内存配置java命令启动jar包Tomcat服务器部署java应用引言 问题: org.springframework.web.util.estedServletException: Handlerdispatch failed: nested exception isjava.lang.0utOfMemoryError: Java heap space原因分析: 查询查询平台所…

python 之可视化数据(地形图练习)

一、按要求构建疫情情况数据的地形图 二、代码展示 from pyecharts.charts import Map from pyecharts.options import VisualMapOptsmap Map() data [("北京市" , 994),("上海市" , 199),("湖南省" , 299),("台湾省" , 12),(&qu…

[游戏开发] LuaTable转string存读二进制文件

UE5和Unity通用此方案&#xff0c;只不过读写文件的接口略有不同&#xff0c;lua代码的处理是相同的。 下面两个方法是 LuaTable和字符串互相转换的代码 function XUtils.luaTableToString(tab, sp)sp sp or ""local s ""for k,v in pairs(tab) doif t…

高斯泼溅综合指南

高斯泼溅&#xff08;Gaussian Splatting&#xff09;是一种表示 3D 场景和渲染新视图的方法&#xff0c;在“实时辐射场渲染的 3D 高斯泼溅” 中引入。它可以被认为是 NeRF 类模型的替代品&#xff0c;就像当年的 NeRF 一样&#xff0c;高斯泼溅引发了大量新的研究工作&#x…

Android Kotlin - 通过 URL Scheme 打开应用

在 Android 应用中&#xff0c;可以通过自定义 URL Scheme 或 Deep Links 打开应用。这允许你定义一个自定义的 URL 格式&#xff0c;使得当用户点击包含这个 URL 的链接时&#xff0c;系统可以识别并打开你的 APP。以下是详细的实现步骤和一些注意事项。 1. 配置 AndroidMani…

RISC-V特权架构 - 时钟中断处理

RISC-V特权架构 - 时钟中断处理 1 MTI中断处理1.1 触发中断1.2 查询mie.MTIE与mip.MTIE1.3 若运行在M模式下1.4 若运行在S模式下1.5 若运行在U模式下 2 STI中断处理2.1 触发中断2.2 查询mie.STIE与mip.STIE2.3 若运行在M模式下2.4 若运行在S模式下2.5 若运行在U模式下 3 知识总…

Transformer架构的演进之路探究

1 引言 在2017年的开创性论文《Attention is All You Need&#xff08;注意力就是你所需要的一切&#xff09;》中&#xff0c;Vaswani等人提出了Transformer架构&#xff0c;这不仅在语音识别领域引起了一场革命&#xff0c;也对其他多个领域产生了深远的影响。本文将探讨Tra…

【早鸟优惠券】PostgreSQL 16 专栏优惠券

PostgreSQL 从入门到熟悉&#xff0c;本专栏只能做到从入门到熟悉。本专栏以 Markdown 格式书写&#xff0c;格式精美。有需要的朋友可以看下&#xff0c;使用的版本是 16。本专栏大约 20 万字左右&#xff0c;目前已完成了 18 万多字了。还有两篇&#xff08;事务、性能调优&a…

搭建内网开发环境(一)|基于docker快速部署开发环境

引言 最近因需要搭建一套简易版的纯内网的开发环境&#xff0c;服务器采用 centos8.0&#xff0c;容器化技术采用 docker 使用 docker-compose 进行容器编排。 该系列教程分为两大类&#xff1a; 软件安装和使用&#xff0c;这类是开发环境常用的软件部署和使用&#xff0c;涉…

Vue框架学习笔记-8

Vue中的跨域问题 在Vue项目中遇到跨域问题&#xff0c;通常是因为前端&#xff08;Vue&#xff09;和后端&#xff08;如Node.js, Django, Spring Boot等&#xff09;部署在不同的域名或端口上&#xff0c;浏览器出于安全考虑&#xff0c;会阻止跨域请求。解决Vue中的跨域问题…

获取专项练习

文章目录 1.sun-club-practice-api1.vo构建1.SpecialPracticeVO.java2.SpecialPracticeCategoryVO.java3.SpecialPracticeLabelVO.java 2.SubjectInfoTypeEnum.java 2.sun-club-practice-server1.PracticeSetController.java2.service1.PracticeSetService.java2.PracticeSetSe…

基于SpringBoot的秒杀系统设计与实现

TOC springboot193基于SpringBoot的秒杀系统设计与实现 第1章 绪论 1.1 研究背景 互联网时代不仅仅是通过各种各样的电脑进行网络连接的时代&#xff0c;也包含了移动终端连接互联网进行复杂处理的一些事情。传统的互联网时代一般泛指就是PC端&#xff0c;也就是电脑互联网…

开放式耳机怎么样好用吗?六个专业好招教你选!

传统入耳式耳机容易滑落&#xff0c;而且戴久了耳朵疼&#xff0c;近段时间&#xff0c;耳机圈开始流行开放式耳机。开放式耳机的出现就避免了这个问题的出现&#xff0c;本文就为大家推荐几款使用感较好的开放式耳机&#xff0c;一起来看看吧~现在开放式耳机太多了&#xff0c…