收集 301 医院 451 名老年冠心病患者数据,湖北麻城人民医院推出机器学习模型,准确预测患者一年内死亡率

news2025/1/6 20:11:17

内容一览:据国际糖尿病联盟 (IDF) 统计,2021 年中国糖尿病患者数量占全球
26%。而糖尿病患者血糖长期失控,有极高风险引起冠心病等并发症。近期,湖北省麻城市人民医院研究人员分析比较了多种模型,并用其中表现最优的机器学习模型,预测了中国老年冠心病合并糖尿病或糖耐量受损患者一年内死亡率为
26.83%。

关键词:冠心病 生存预后 梯度提升机

本文由 HyperAI 超神经首发于微信公众平台~

据 2017 年糖尿病患病调查,我国老年人糖尿病患者高达 7813 万人。结合多项大型人群研究发现,糖代谢异常与心血管病存在高度「共病」关系,即糖尿病患者往往会伴有冠心病等并发症,而后者已然成为糖尿病患者死亡的一大主因——约有 75% 的糖尿病患者死于冠心病。然而,目前关于冠心病合并糖尿病或糖耐量受损患者生存危险因素的相关研究寥寥可数

|备注:糖耐量受损 (IGT) 是一种由正常血糖向糖尿病过渡的异常糖代谢状态,属于糖尿病前期,可能进一步发展为糖尿病 (diabetes mellitus, DM)。

为了突破这一现状,中国湖北省麻城市人民医院的研究人员,开创性地对比了逻辑回归模型 (LR) 和 3 种机器学习模型,成功预测出中国老年冠心病合并糖尿病或糖耐量受损患者一年内死亡率,帮助医学界及时识别有短期死亡风险的患者,从而及早预警和治疗。

目前该研究已发布在《Cardiovascular Diabetology》期刊上,标题为「Machine learning-based models to predict one-year mortality among Chinese older patients with coronary artery disease combined with impaired glucose tolerance or diabetes mellitus」

在这里插入图片描述

图 1:该研究成果已发表在《Cardiovascular Diabetology》

论文地址:
https://cardiab.biomedcentral.com/articles/10.1186/s12933-023-01854-z

实验过程

数据集:收集 301 医院 451 名老年冠心病患者数据

本研究分析了 2007 年 10 月至 2011 年 7 月期间,中国人民解放军总医院老年心脏病科收治的 974 名老年冠心病患者。其中,研究人员按照两个条件进一步筛选,分别为:

  1. 年龄超过 60 岁;
  2. 患有糖耐量受损 (IGT) 或糖尿病 (DM)。

最终生成的数据集中包含 451 名患者,并按 7 : 3 的比例随机分为训练集 (n = 308) 及测试集 (n = 143)。训练集用于训练和优化逻辑回归模型和 3 种机器学习模型,测试集则用于测试模型预测性能。数据集筛选流程如下:

在这里插入图片描述

图 2:概述入选患者和研究设计流程图

模型开发:选定 4 大模型进行横向对比

本项研究中,研究人员开发了逻辑回归模型和 3 种机器学习模型,分别为梯度提升机模型 (GBM)、随机森林模型 (RF) 和决策树模型 (DT) 来建立预测模型,并根据布里尔分数 (Brier Score)、 AUC (Area Under the Curve)、校准曲线 (calibration curve) 和决策曲线 (decision curve) 几个指标,来评估预测效果。

Brier Score:衡量算法预测出的概率和真实结果的差异的一种方式。其取值范围为 0 到 1,分数越高则预测结果越差,校准程度越低。
在这里插入图片描述

图 3: 布里尔分数计算公式

AUC:指曲线下面积。在统计学和机器学习中,AUC 常用于评估二分类模型的性能。其取值范围在 0 到 1,数值越接近 1,则表示模型性能越好;数值越接近 0.5,则表示模型预测能力较弱。

对3个机器学习模型进行特征筛选及参数调优

同时,研究人员对开发的机器学习模型进行了特征筛选和参数调优。首先,他们采用 LASSO (least absolute shrinkage and selection operator) 算法结合 10 倍交叉验证筛选出与一年死亡率显著相关的 7 个特征,作为模型输入,这 7 个特征分别为血红蛋白、HDL- C、白蛋白、血肌酐、NT-proBNP、CHF 和他汀类药物。然后,他们通过随机超参数搜索,使用 5 倍交叉验证和自举法 (bootstrap) 来寻找最佳参数组合,获取最佳曲线下面积 (AUC)。

在这里插入图片描述

图 4:超参数调优过程

A:所有变量的最小绝对收缩与选择算子 (LASSO) 系数曲线
B:最佳参数组合
C:临床特征之间的相关系数

由图 4,所有相关系数均低于 0.80,表明不存在严重的共线性。用上述 7 个临床特征训练逻辑回归模型和 3 个机器学习预测模型。经过模型训练和优化,每个模型的最优超参数如下表所示:
在这里插入图片描述

表 1:各模型的最优超参数

实验结果

从各个模型的整体性能来看

  • 逻辑回归模型 (LR) 的 Brier 分数为 0.116
  • 梯度提升机模型 (GBM) 的 Brier 分数为 0.114
  • 决策树模型 (DT) 的 Brier 分数为 0.143
  • 随机森林模型 (RF) 的 Brier 分数为 0.126

下图为各个模型的分析结果

在这里插入图片描述

图 5: 各模型的 AUC、校准曲线、决策曲线、SHAP 值

D:各个模型整体性能
E:各个模型校准曲线
F:各个模型决策曲线
G:SHAP 值热力图
H:基于 SHAP 的特征重要性分析

根据图 5,可得出以下结论:

1. LR、 GBM、 DT 和 RF 模型的 AUC 分别为 0.827、0.836、0.760 和 0.829。
2. 校准曲线表明,所有模型都具有良好的校准效果。其中,GBM 模型效果最佳。
3. 决策曲线分析表明,GBM 模型和 LR 模型均有良好的临床实用性。
4. 基于 GBM 模型,研究人员进一步分析了整个人群中显著临床特征的重要性。通过分析个体 SHAP 值和平均 SHAP 值均发现与一年死亡率相关的前 3 个特征分别是 NT-proBNP、白蛋白和他汀类药物。

| SHAPE: Shaley Additive exPlanation, 特征贡献度。研究人员通过分析 SHAP 值,可以获得对于预测结果的解释,了解各个特征如何影响模型的预测,进而更好地理解和解释模型的行为。

综上,研究人员提出,过往研究中的模型虽然预测性能很高,但由于变量太多,不太适合在临床上应用。而本研究中,研究人员成功使用 7 个特征开发出预测一年死亡率的模型,结果显示,GBM 模型 AUC 高达 0.836,Brier 分数为 0.116,预测性能整体最佳

值得注意的是,为了进一步方便临床应用,研究人员还设计了一个在线应用程序,只需要医生填写患者参数,就能预测一年内的死亡概率,这样一来,医生可以通过对高风险患者及早采取有利措施,提高患者生存概率。

AI 医疗领域前景光明,但不应盲目乐观

随着 AI 语音交互、计算机视觉和认知计算、深度学习等技术的逐渐成熟,AI 医疗领域的应用场景日益丰富,涉及医学影像、虚拟助手、药物研发、健康管理、病历/文献分析以及疾病预测管理等多个方向

据中国信通院《2020 人工智能医疗产业发展蓝皮书》,国内 AI 医疗领域虽然起步较晚,但市场需求旺盛,未来发展前景广阔。其中,值得关注的有,截至 2019 年末,全国 65 岁及以上老年人口占比已达 12.6%,意味着中国已正式步入老龄化社会。由此,慢性病发病率也在逐年增加。

在此背景下,以本研究为代表的疾病预测相关成果应运而生,能够有效帮助医生及病人更好地进行健康管理。然而,另一方面,也需看到就市场整体情况来看,AI 相关技术在医院仍未得到规模化应用,医院的付费意愿并不强烈,而这与用户的使用与付费习惯、医保政策等配套基础设施以及临床应用场景的高复杂度等原因有重要联系。所以,对于 AI 医疗领域来说,也仍然还有很长的路要走。

参考链接:
[1] https://doi.org/10.5334/gh.934
[2] https://doi.org/10.1111/1753-0407.13175
[3] https://doi.org/10.1007/s001250051352
[4] https://doi.org/10.1186/1475-2840-5-15
[5]https://rs.yiigle.com/CN112148202107/1328929.htm
[6]http://www.caict.ac.cn/kxyj/qwfb/ztbg/202009/P020200910495521359097.pdf

本文由 HyperAI 超神经首发于微信公众平台~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/835623.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Scratch 之 两点之间距离的测算

1.前言 在Scratch中,对于坐标系上的两点,我们可以确定通过x坐标或y坐标之差确定两点横坐标或是纵坐标上的距离,那么如何知道两点之间的直线距离呢? 2.勾股定理 对于一个直角三角形,两条直角边的平方和等于斜边的平方&a…

电动自行车上架eBay的UL2849、16CFR1512测试标准

在奥运经济的带动下,今年以来运动自行车消费有较大幅度增长,其中高端消费者对进口自行车需求扩张,上半年竞赛型自行车进口量同比增长49.5%。另外,电助力自行车在国际市场也倍受追捧,国际自行车贸易总额的60%来自中国&a…

记一次ubuntu16误删libc.so.6操作的恢复过程

背景 操作系统:ubuntu16 glibc版本:2.23 修改原因: 经过一系列报错和手工构建之后,vulkansdk成功安装(起码运行./vulkansdu成功),在进行./vulkaninfo进行验证时,报错&#xff1a…

SpringCloud-Hystrix服务熔断与降级工作原理源码 | 京东物流技术团队

先附上Hystrix源码图 在微服务架构中,根据业务来拆分成一个个的服务,服务与服务之间可以相互调用(RPC),在Spring Cloud可以用RestTemplateRibbon和Feign来调用。为了保证其高可用,单个服务通常会集群部署。…

odoo16 上传/下载 文件接口的实现

突然有个需求说需要编写一个上传pdf 接口 首先需要准备如下 xx.xx模型 module 部分 如下: attachment_count fields.Integer(compute_compute_attachment_count, string附件数量, requiredTrue)def _compute_attachment_count(self):# 附件数量计算attachment_dat…

虹科干货 | DevOps 团队为什么独独青睐 Redis Enterprise ?

虹科干货 | DevOps 团队为什么独独青睐 Redis Enterprise ? 快速部署是保障成功的 DevOps 的关键要素。虹科Redis Enterprise 提供了一种快速的数据库。 DevOps 团队面临的挑战 提高应用程序处理速度,赢得商业竞争 许多企业中,DevOps 团队&…

工厂模式:简化对象的创建过程

工厂模式:简化对象的创建过程 介绍 在软件开发中,对象的创建是一个常见的操作。通常情况下,我们可以直接使用 new 关键字来创建对象,但是在某些情况下,对象的创建过程可能会比较复杂,涉及到多个步骤或者依…

为生成式AI提速,亚马逊云科技Amazon EC2 P5满足GPU需求

生成式AI(Generative AI)已经成为全球范围内的一个重要趋势,得到越来越多企业和研究机构的关注和应用。纽约时间7月26日,亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian在亚马逊云科技举办的纽约峰会上更…

React Native获取手机屏幕宽高(Dimensions)

import { Dimensions } from react-nativeconsole.log(Dimensions, Dimensions.get(window)) 参考链接: https://www.reactnative.cn/docs/next/dimensions#%E6%96%B9%E6%B3%95 https://chat.xutongbao.top/

程序员自由创业周记#5:加一上线

程序员自由创业周记#5:加一上线 这是一位程序员进行独立开发创业的记录,将分享创业过程中的所思所想以及收支明细。 充实 如果说程序员独立创业的成功率只有5%,那如果家里有一位3岁多还没上幼儿园的小朋友要照顾,成功的概率至少还…

通俗易懂web3.0

目录 前言一、WEB1.0二、WEB2.0三、WEB3.0区别最后 前言 大家好,我是清风。互联网连接了人与人,在过去的30年中,互联网技术不断进化、演化,向纵深发展,政治、经济、社交、生活、工作已经几乎离不开互联网。我们经历了…

软件测试面试【富途面经分享】

目录 一面面经(1h) 二面面经 一面面经(1h) 一、对白盒黑盒灰盒测试的理解 答: 1、黑盒测试就当整个程序是个黑盒子,我们看不到它里面做了什么事情,只能通过输入输出看是否能得到我们所需的来…

使用HTTP隧道时如何应对目标网站的反爬虫监测?

在进行网络抓取时,我们常常会遇到目标网站对反爬虫的监测和封禁。为了规避这些风险,使用代理IP成为一种常见的方法。然而,如何应对目标网站的反爬虫监测,既能保证数据的稳定性,又能确保抓取过程的安全性呢?…

亚马逊关键词的作用有哪些?

亚马逊关键词在平台上扮演着重要的作用,涵盖了消费者、卖家和整个平台的多个方面: 1、消费者的作用: 帮助消费者快速找到所需商品:通过输入关键词,消费者可以迅速找到感兴趣的商品,节省时间和精力。 支持…

【Linux】运行程序前加上strace,可以追踪到函数库调用过程

rootubuntu:/home/peng/test# gcc 123.c -o run rootubuntu:/home/peng/test# strace ./run 如执行结果可知: 我们的程序虽然只有一个printf函数,但是在执行过程中,我们前后调用了execve、access、open、fstat、mmap、brk、write等系统调用。…

01_二值图、灰度图、彩色图

01_二值图、灰度图、彩色图 1. 二值图2. 灰度图3. 彩色图 1. 二值图 二值图像(黑白图像):每个像素点只有两种可能,0和1,0代表黑色,1代表白色。数据类型通常为1个二进制位。 得出来的图像 2. 灰度图 单…

ad+硬件每日学习十个知识点(22)23.8.2(LDO datasheet手册解读)

文章目录 1.LDO的概述、features2.LDO的绝对参数(功率升温和结温)3.LDO的引脚功能4.LDO的电气特性5.LDO的典型电路(电容不能真用1uF,虽然按比例取输出值,但是R2的取值要考虑释放电流)6.LDO的开关速度和线性…

PaperEdge 文档图像矫正

效果 地址: https://github.com/cvlab-stonybrook/PaperEdge

leaflet-uniapp 缩放地图的同时 显示当前缩放层级

记录实现过程: 需求为移动端用户在使用地图时,缩放地图的同时,可以获知地图此时缩放的级别。 效果图如下:此时缩放地图级别为13 map.on() 有对应的诸多行为 查看官网即可,这里根据需要为--zoomstart zoom zoomend 代…

Vector - CAPL - 诊断模块函数(连接管理)

CanTpCreateConnection - 创建TP连接 功能:使用给定的地址模式(add人Mode)创建新连接,可用于诊断数据的收发。 说明:无法更改已有连接的寻址模式;如果确实有需要,可以关闭当前连接后再创建一个…