学习干货IF=93.6!开发临床预测模型:分步指南

news2025/1/12 6:53:41

预测患者未来结果对临床实践至关重要,有助于医生做出明智决策。尽管每年发布大量预测模型,但许多研究存在方法学局限,如样本量不足和模型验证不充分,这削弱了模型的实际应用价值。因此,必须深入探讨并改进这些局限性,以提升模型的实用性和可靠性。

没有病例资源,也没有经费支持,小医生该怎么发表论文啊?

别急,教程这不就来了吗

2024年9月3日,The BMJ又发布了论文《Developing clinical prediction models: a step-by-step guide》(《开发临床预测模型:分步指南》)。

本文提供了一份分步指南,旨在帮助研究人员开发和评估临床预测模型。该指南涵盖了定义目标和用户、选择数据源、处理缺失数据、探索替代建模选项以及评估模型性能的最佳实践。通过复发缓解型多发性硬化症的实例,具体展示了这些步骤,同时附有全面的 R 代码供参考。

题目:Developing clinical prediction models: a step-by-step guide

杂志:The BMJ

影响因子:IF=93.6

中科院分区:医学一区

发表时间:2024年9月

一、术语表

术语表表1总结了所使用的基本概念和术语,便于读者快速理解关键内容。

二、临床预测模型的13个步骤

每年发布的许多预测模型常常存在方法上的缺陷,限制了其内部有效性和适用性。为此,制定了13步指南,帮助医疗保健专业人员和研究人员开发和验证预测模型,避免常见陷阱。

Step 01:确定目标、组建团队、查看文献、开始编写方案

Step 02:选择开发新模型或更新现有模型

Step 03:定义结果衡量标准

Step 04:确定候选预测因子并指定测量方法

候选预测变量

我们应根据文献综述和专家知识确定潜在的预测因子(第1步)。这些因子应使用既定的、可靠的方法进行客观定义和衡量,同时理解支持预测因子与结果关联的生物途径是关键。应优先纳入已证实或怀疑与结果有因果关系的预测因子,以提高模型的泛化性。但不应先验排除与结果没有因果关系的潜在预测因子,因为它们可能仍对模型性能有帮助。我们必须仅包括基线预测因子,即在做出预测时可获得的信息。对连续预测变量进行二分法或分类会减少信息并削弱统计能力,应避免。此外,不应仅根据相关模型性能选择连续结果的类别,而是应在测试多个分类阈值后做出决策。

考虑预测模型的用户

考虑模型的预期用途(在第1步中定义)和数据的可用性至关重要。应明确哪些变量在临床实践中常规测量,哪些在数据库中可用,以及与其测量相关的成本和实际问题,例如侵入性程度。比如,退伍军人老龄化队列研究指数(VACS指数2.0)预测HIV感染者的全因死亡率,但某些预测因子如肝纤维化指数(FIB-4)在许多HIV高发地区的常规实践中不可用。同样,对多发性硬化症预后模型的系统评价发现,75个模型中有44个(59%)包含不太可能在初级保健或标准医院环境中测量的预测因子。

Step 05:收集并检查数据

Step 06:考虑样本大小

简单模型或基于无关协变量的模型在开发数据和新数据中表现不佳,称为欠拟合。相反,过多预测因子的模型在小型数据集中虽表现良好,却无法准确预测新数据。过拟合比欠拟合更常见,因为数据集通常较小,研究者倾向于追求最佳性能。因此,确保数据量足够以开发稳健模型至关重要。

Step 07:处理缺失数据

如步骤5所述,删除具有大量缺失值的预测变量或结果后,我们仍需处理保留数据中的缺失值。仅依靠完整个案(即所有变量数据齐全的参与者)进行模型开发可能会显著减少样本量。为减少在模型开发和评估过程中有价值信息的损失,研究人员应考虑对缺失数据进行插补。

Step 08:拟合预测模型

①注意偏差-方差权衡

②欠拟合与过拟合

Step 09:评估预测模型的性能

①区分度、校准度,不同类型结果预测模型应选择不同的性能测量指标。

②内部验证、内部-外部验证、外部验证(作者呼吁外部验证研究应该与模型开发分开,最好是不同研究人员来做)

Step 10:确定最终模型

在性能接近的模型中选择更简单的模型(奥卡姆剃刀原理,一个有名的机器学习模型选择依据)

例如,当逻辑回归模型的性能与用于区分年轻人1型和2型糖尿病的优化机器学习模型相似时,我们更倾向于选择逻辑回归,因为它更简单、更易于沟通和使用。

Step 11:执行决策曲线分析

Step 12:评估单个预测变量的预测能力

在预测建模中,关键不在于评估单个预测因子的影响,而是优化整体模型的预测性能。尽管识别重要预测因子仍有价值,特别是在评估新生物标志物或可修改因子时,研究人员可选择评估预测变量的预测能力。通过查看广义线性回归模型的估计系数,可以简单评估不同预测因子的影响,但在假设不满足(如共线性)时,这些估计可能不可靠。另一种方法是比较包含和不包含某预测变量的模型,以观察性能变化。更高级的方法如排列重要性和SHAP算法可以提供进一步分析。无论采用何种方法,谨慎解读结果至关重要,因为数据中的关联不一定反映因果关系,需进行深入的因果推理分析以确认因果关联。

Step 13:撰写并发布

三、基础流程图

论文提供了一个分步指南,用于开发和验证临床预测模型(如下图所示)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2199703.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电力央企数智化转型中的大模型构建及智能巡检机器人的应用

在全球经济数字化转型的大背景下,电力行业面临着多重挑战,包括能源结构的转型、市场竞争的加剧以及环境保护的压力。电力央企作为国家能源供应的中坚力量,亟需通过数智化转型提升竞争力和服务水平。 随着今年年初我国首次将“开展‘人工智能行…

第十四届蓝桥杯嵌入式省赛程序设计题解析(基于HAL库)

一.题目分析 (1).题目 (2).题目分析 1.PWM输出分析 模式切换时,占空比要不变, 在五秒之内就要变化成目标频率,同时要求频率的步进值要小于200hz 为了使步进值小于200hz,那么在五秒的时间之内…

AI绘画:人工智能颠覆艺术创作的新时代

*AI绘画的震撼与魅力* 你是否曾幻想过,手握画笔便能创造出前所未有的艺术作品?当我们谈及艺术,总会联想到那份独特的创意和灵感。而如今,随着人工智能的迅猛发展,AI绘画正以其独特的方式,颠覆着传统的艺术…

XTR115电流环电路原理研究【文献】

作者:昝 勇,罗永红,王沛莹 中航工业 摘要: 针对各种数据采集与监控中抗恶劣电磁干扰环境的需求,给出一种基于XTB115的低功耗两线4~20 mA电流环数据传输电路,首先讨论了XTR115的性能特点和工作原…

RabbitMQ简介及安装类

RabbitMQ概述-MQ介绍 RabbitMQ是一个开源的消息代理和队列服务器,它支持多种消息协议,并且可以轻松地与多种编程语言和框架集成。RabbitMQ是使用Erlang语言编写的,因此它具有高并发和高可用性的特点。以下是RabbitMQ的一些关键特性和概念 消息…

两文读懂DDD领域驱动设计,举例说明,通俗易懂【值得收藏】

最近对架构莫名的感兴趣,慢慢觉得架构本身是为了提供方便,定制规范,目标一致并更好的协作,它的变动也并不是像变形金刚一样,而是像幼苗一样按规律成长起来的 DDD是一种方法也是一种思想,大家前面个别概念看…

C++-再探构造函数(进阶)

个人主页:Jason_from_China-CSDN博客 所属栏目:C系统性学习_Jason_from_China的博客-CSDN博客 所属栏目:C知识点的补充_Jason_from_China的博客-CSDN博客 前言 来到类和对象最后一个章节,这里的难度已经极大程度的降低了 再探构造…

FFMpeg源码分析,关键结构体分析(一)

http://lazybing.github.io/blog/categories/ffmpegyuan-ma-fen-xi/ 一、下载FFmpeg的编译源码 进入网站:http://ffmpeg.org/download.html二、编译源码 执行下述命令: ./configure --prefix/usr/local/ffmpeg --enable-debug3 --enable-ffplay sudo …

22年408数据结构

第一题&#xff1a; 解析&#xff1a; 观察一下这个程序&#xff1a;我们注意到最外层的循环是从i1开始的&#xff0c;每次ii*2&#xff0c;直到i<n为止&#xff0c;假设程序总共执行k次执行&#xff0c;则有2^(k1)>n。则k1>log(2)n这里是以2为底n的对数, k>log(2)…

Oracle11g服务器linux 安装

一&#xff0e;安装前准备 1.检查硬件&#xff08;内存&#xff0c;交换分区&#xff0c;tmp分区&#xff0c;cpu信息&#xff0c;内核版本&#xff09; # grep MemTotal /proc/meminfo # grep SwapTotal /proc/meminfo # df -k /tmp&#xff08;>400M&#xff09; # grep …

汽车氛围灯行业分析:未来几年年复合增长率CAGR为7.15%

汽车氛围灯是一种起到装饰和指示作用的照明灯&#xff0c;它属于装饰类的照明灯。通常是红色、蓝色、绿色等&#xff0c;主要是为了使车厢更加绚丽&#xff0c;烘托气氛&#xff0c;营造室内情调。氛围灯能够具有以下特性&#xff1a;功能性、舒适性、设计感、豪华感、个性化、…

【C++】——继承

P. S.&#xff1a;以下代码均在VS2019环境下测试&#xff0c;不代表所有编译器均可通过。 P. S.&#xff1a;测试代码均未展示头文件stdio.h的声明&#xff0c;使用时请自行添加。 博主主页&#xff1a;Yan. yan.                        …

深入解析MySQL事务管理:ACID特性与基本操作

&#x1f49d;&#x1f49d;&#x1f49d;欢迎莅临我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐&#xff1a;「storm…

自动猫砂盆是养猫新型智商税吗?测评2024年热门款智能猫砂盆分享

铲屎官们只要一察觉到猫主子拉屎&#xff0c;就要马上去铲掉&#xff0c;这不仅是为了猫砂盆中其他干净的猫砂&#xff0c;更是为了防止猫屎残留发臭&#xff0c;特别是便便这种东西&#xff0c;一旦放久了就很招虫子&#xff0c;家里出现这些虫子又要大扫除消杀&#xff0c;特…

2024 年顶级智能文档处理解决方案

在当今的数字时代&#xff0c;智能文档处理(IDP) 对于提高业务效率和降低成本至关重要。IDP 可实现文档处理的自动化&#xff0c;最大限度地减少人工劳动和错误。由于有众多 IDP 解决方案可供选择&#xff0c;因此选择合适的解决方案可能具有挑战性。 本指南回顾了 10 款最…

Android Handler消息机制完全解析-同步屏障(三)

Android 消息机制Handler完全解析(一) Android 消息机制Handler完全解析(二) 前面两篇我们主要讲了Handler消息机制的一些基础&#xff0c;今天来看下消息屏障&#xff0c;通过本篇文章你将学到如下知识点 (1)什么是同步屏障 (2)为什么要有同步屏障 (3)同步屏障的原理 (4…

获取时隔半个钟的三天

摘要&#xff1a; 今天遇到需求是配送时间&#xff0c;时隔半个钟的排线&#xff01;所以需要拼接时间&#xff01;例如2024-10-08 14&#xff1a;30&#xff0c;2024-10-08 15&#xff1a;00&#xff0c;2024-10-08 15&#xff1a;30 <el-form-item label"配送时间&a…

24下软考中级系统集成项目管理工程师怎么备考?

备考资料&#xff1a; 1.教材 教材可以准备由清华大学出版社出版的系统集成项目管理工程师教材&#xff0c;这也是官方所推荐的教材&#xff0c;准备这本书是绝对没错的。 2.真题 真题也是在备考过程中少不了的资料之一&#xff0c;而且系统集成项目管理工程师考试就是需要多…

初始项目托管到gitee教程,开箱即用

0.本地仓库与远程仓库关联&#xff08;需先在gitee创建仓库&#xff09; ①打开powershell生成ssh key ssh-keygen -t ed25519 -C "Gitee SSH Key"-t key 类型-C 注释 生成成功如下&#xff0c;并按下三次回车 ②查看公私钥文件 ls ~/.ssh/输出&#xff1a; id_…

华为---Super VLAN简介及示例配置

目录 1. Super VLAN技术产生背景 2. Super VLAN概念 3. Super VLAN应用场景 4. Super VLAN工作原理 5. Super-VLAN主要配置命令 6. Super-VLAN主要配置步骤 7. 示例配置 7.1 示例场景 7.2 网络拓扑 7.3 配置代码 7.4 代码解析 7.5 测试验证 1. Super VLAN技术产生背…