R语言生存分析可视化分析

news2024/11/24 2:51:10

生存分析指的是一系列用来探究所感兴趣的事件的发生的时间的统计方法。

生存分析被用于各种领域,例如:

癌症研究为患者生存时间分析,

“事件历史分析”的社会学

在工程的“故障时间分析”。

在癌症研究中,典型的研究问题如下:

某些临床特征对患者的生存有何影响?

个人三年存活的概率是多少?

各组患者的生存率有差异吗?

 

 视频:R语言生存分析原理与晚期肺癌患者分析案例

R语言生存分析Survival analysis原理与晚期肺癌患者分析案例

最近我们被客户要求撰写关于生存分析的研究报告,包括一些图形和统计输出。

基本概念

在这里,我们从定义生存分析的基本术语开始,包括:

生存时间和事件

生存函数和风险函数

癌症研究中的生存时间和事件类型

有不同类型的事件,包括:

复发

死亡

观察开始到观察终止的时间通常称为生存时间(或事件发生的时间)。

癌症研究中两个最重要的评价方法包括:i)死亡时间;和ii)无复发存活时间,其对应于治疗反应与疾病复发之间的时间。它也被称为无病生存时间和无事件生存时间

如上所述,生存分析侧重于直到发生感兴趣事件(复发或死亡)的期望持续时间。

Kaplan-Meier生存评估

Kaplan-Meier(KM)方法是一种非参数方法,用于估计观察到的生存时间的生存概率(Kaplan和Meier,1958)。

生存曲线是管理生存概率与时间的关系曲线,它提供了一个有用的数据总结,可以用来估计诸如中位生存时间之类的衡量指标。

R生存分析

生存分析总结和可视化生存分析结果

示例数据集

我们将使用生存包中提供的肺癌数据。

head(lung)

  inst time status age sex ph.ecog ph.karno pat.karno meal.cal wt.loss
1    3  306      2  74   1       1       90       100     1175      NA
2    3  455      2  68   1       0       90        90     1225      15
3    3 1010      1  56   1       0       90        90       NA      15
4    5  210      2  57   1       1       90        60     1150      11
5    1  883      2  60   1       0      100        90       NA       0
6   12 1022      1  74   1       1       50        80      513       0

inst:机构代码

时间:以天为单位的生存时间

状态:状态1 =审查,2 =死亡

年龄:年龄

性别:男= 1女= 2

ph.ecog:ECOG表现评分(0 =正常 5 =死亡)

ph.karno:Karnofsky表现评分(差 = 0 正常= 100)由医师评定

pat.karno:Karnofsky表现评分由患者评估

膳食:餐时消耗的卡路里

wt.loss:过去六个月的体重下降

计算生存曲线:survfit()

我们要按性别来计算生存概率。

函数survfit()可以被用来计算Kaplan-Meier生存估计。

使用函数Surv()创建的生存对象

要计算生存曲线,请输入以下内容:

print(fit)

       n events median 0.95LCL 0.95UCL
sex=1 138    112    270    212    310
sex=2  90    53    426    348    550

默认情况下,函数print()显示生存曲线的摘要。它显示观察数,事件数量,中位数生存和中位数的置信区间。

如果要显示生存曲线的更完整摘要,请输入以下内容:

# 生存曲线摘要
summary(fit)# 
summary(fit)$table

可视化生存曲线

我们 生成两组受试者的生存曲线。

ggplot(fit,
          pval = TRUE, conf.int = TRUE,
          risk.table = TRUE, # 添加风险表
          risk.table.col = "strata", # 按组更改风险表颜色

legend.labs更改图例标签。

ggplot(
   fit,                     # 具有计算统计信息的survfit对象。
   pval = TRUE,             # 显示对数秩检验的p值。
   conf.int = TRUE,         # 显示生存曲线点估计的置信区间。
   conf.int.style = "step",  # 自定义置信区间样式
   xlab = "Time in days",   # 自定义X轴标签。
   break.time.by = 200,     # 以200的时间间隔打断X轴。
   ggtheme = theme_light(), # 使用主题自定义绘图和风险表。
   risk.table = "abs_pct",  # 绝对数值

每组的中位生存时间表示生存概率S(t)为0.5的时间。

使用参数xlim可以缩短生存曲线范围,如下所示:

请注意,可以使用参数fun指定三个经常使用的转换:

 

累积风险是常用来估计风险概率。

 

Kaplan-Meier生命表:生存曲线的总结

如上所述,您可以使用函数summary()来获得生存曲线的完整摘要:

summary(fit)

 

Log-Rank检验比较生存曲线:survdiff()

数秩检验是比较两条或更多条生存曲线的最广泛使用的方法。零假设是两组在生存期间没有差异。 

可以使用survdiff()如下:


surv_diff


N Observed Expected (O-E)^2/E (O-E)^2/V
sex=1 138      112    91.6      4.55      10.3
sex=2  90      53    73.4      5.68      10.3
Chisq= 10.3  on 1 degrees of freedom, p= 0.00131

存活率差异的对数秩检验给出p = 0.0013的p值,表明性别组在存活方面差异显着。

 复杂的生存曲线

在本节中,我们将使用多个因素的组合计算生存曲线。接下来,我们将使用ggsurvplot()输出结果

ggplot(fit,
          conf.int = TRUE,
          risk.table.col = "strata", # 按组更改风险表颜色
          ggtheme = theme_bw(), # 更改ggplot2主题

可视化输出。下面的图显示了性别变量根据rx&adhere的值的生存曲线。

 

概要

生存分析是一组数据分析的统计方法,其中感兴趣的结果变量是事件发生之前的时间。

在这篇文章中,我们演示了如何使用两个R软件包来执行和可视化生存分析)。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/47519.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java中如何处理时间--Date类

文章目录0 写在前面1 介绍Date类2 构造方法举例2.1 Date()2.2 Date(long date)3 Date类中常用方法4 写在最后0 写在前面 在实际业务中,总会碰到关于时间的问题,例如收集当年的第一季度的数据。第一季度也就是当年的一月一日到三月三十一日。如何处理时间…

使用markdown画流程图、时序图等

概述 能表示的图类型还有很多,比如: sequenceDiagram时序图 classDiagram类图 stateDiagram:状态图 erDiagram:ER图 gantt: 甘特图 pie:饼图 requirementDiagram: 需求图 流程图 流程图代码以「graph 《布局…

【毕业设计】12-基于单片机的电子体温计(原理图工程+源码工程+仿真工程+答辩论文)

【毕业设计】12-基于单片机的电子体温计(原理图工程源码工程仿真工程答辩论文) 文章目录【毕业设计】12-基于单片机的电子体温计(原理图工程源码工程仿真工程答辩论文)任务书设计说明书摘要设计框架架构设计说明书及设计文件源码展…

Efficient Large-Scale Language Model Training on GPU ClustersUsing Megatron-LM

Efficient Large-Scale Language Model Training on GPU ClustersUsing Megatron-LM 1 INTRODUCTION 在这篇文章中展示了 如何将 tensor ,pipeline, data 并行组合,扩展到数千个GPU上。 提出了一个新的交错流水线调度,可以提升1…

卷积神经网络的工程技巧总结

参考 卷积神经网络的工程技巧(tricks) - 云社区 - 腾讯云 要成功地使用深度学习算法,仅仅知道存在哪些算法和解释它们为何有效的原理是不够的。一个优秀的机器学习实践者还需知道如何针对具体应用挑选一个合适的算法以及如何监控,并根据实验反馈改进机器…

基于 Hive 的 Flutter 文档类型存储

基于 Hive 的 Flutter 文档类型存储 原文 https://medium.com/gytworkz/document-type-storage-in-flutter-using-hive-a18ea9659d84 前言 长久以来,我们一直使用共享首选项以键对格式在本地存储中存储数据,或者使用 SQLite 在 SQL 数据库中存储数据。 存…

JSP | JSP原理深度剖析、基础语法

目录 一:分析使用纯粹Servlet开发web应用的缺陷 二:JSP原理深度剖析 三:JSP的基础语法 一:分析使用纯粹Servlet开发web应用的缺陷 (1)在Servlet当中编写HTML/CSS/JavaScript等前端代码存在什么问题&…

基于ATX自动化测试解决方案

在整车开发中,诊断功能实现后需要进行测试验证。测试验证主要分为两个方面:诊断协议层测试和诊断功能测试。诊断协议层测试:需要对服务层服务定义、传输层相关时间参数进行测试验证;诊断功能测试:需要对各诊断功能项&a…

国产操作系统之银河麒麟服务器版V10安装

一、银河麒麟操作系统简介 银河麒麟是目前国内国产化操作系统主流产品之一。银河麒麟高级服务器操作系统V10是针对企业级关键业务,适应虚拟化、云计算、大数据、工业互联网时代对主机系统可靠性、安全性、性能、扩展性和实时性等需求,依据CMMI5级标准研制…

Java中的引用

Java中的引用强引用软引用弱引用虚引用终结器引用(FinalReference)JDK 1.2版本之后,Java对引用的概念进行了扩充,将引用分为强引用(Strongly Reference)、软引用(Soft Reference)、弱引用&#…

时间序列:时间序列模型---移动平均过程(Moving Average Process)

本文是Quantitative Methods and Analysis: Pairs Trading此书的读书笔记。 我们从白噪声生成另一种时间序列。如下式: 这种时间序列的值由此刻的白噪声实现(white noise realization)加上beta倍的前一刻的白噪声实现。注意这个beta跟CAPM模型的beta没有…

Linux redict 输入输出重定向 详细使用方法 文件描述符

Linux redict 重定向 Linux 重定向 在 Linux 系统中,我们需要输入和输出让系统与外部进行交互,比如在我们使用鼠标、键盘等输入设备时其实就是通过输入的方式让数据进行系统中。而系统输出一般就会打印在显示器上、刻录光盘等等。而我们要讲的重定向也…

【学习笔记70】数据劫持

一、 数据驱动视图 多次渲染页面,多的时候,比较麻烦和繁琐const box document.querySelector(.box)const obj {name: QF666,age: 18}box.innerHTML 名字: ${obj.name}; 年龄: ${obj.age};obj.age 99;box.innerHTML 名字: ${obj.name}; 年龄:…

RabbitMQ系列【16】AmqpTemplate接口详解

有道无术,术尚可求,有术无道,止于术。 文章目录前言AmqpTemplateAPIsendconvertAndSendreceivereceiveAndConvertreceiveAndReplysendAndReceiveconvertSendAndReceive前言 RabbitTemplate 是spring-amqp提供的一个 RabbitMQ 消息操作模板类…

【Git】rebase 和 merge 的区别

前言 今天想把本地的两个提交压缩成一个提交,再推送到远程。用的是rebase命令解决的,于是乎又捡起了之前的遗留问题:rebase和 merge 有什么区别? 用的是idea内置的git插件,先把idea官网对 “update project” 选择 “…

postgresql使用pg_basebackup备份与恢复

postgresql可以使用pg_dump,pg_restore等命令来进行备份与恢复,那种情况不用停止pgsql服务,只需要执行备份恢复命令即可。 今天介绍的这种备份方式,类似于文件系统的备份与恢复,它需要使用pg_basebackup命令来进行备份&#xff0c…

C#医院门诊会员管理系统源码 通用会员系统源码

C#通用医院会员管理系统源码 源码分享! 本系统使用的技术为NhibernateEF,底层完全封装,可二次使用快速开发。 本技术具有以下特点: 1.面向对象方式访问数据库,摆脱SQL; 2.可移植性强,支持所有流行的数据…

光格科技递交科创板上会稿:拟募资6亿 预计年营收3亿

雷递网 雷建平 11月29日苏州光格科技股份有限公司(简称:“光格科技”)日前递交上会稿,准备在科创板上市。光格科技计划募资6亿,其中,3.1亿元用于分布式光纤传感系统升级研发及量产项目,8000万元…

Java EE|多线程基本操作

文章目录一、一个简单的线程程序及运行二、线程的创建三、线程类——Thread详解常见构造方法常见几个属性线程的启动——start()线程的中断线程的等待——join()线程引用的获取线程的休眠四、多线程编程效率举例一、一个简单的线程程序及运行 在写这样一个代码之前&#xff0c…

web框架

目录 1 左右分割窗口 2 上下分割窗口 3 嵌套分割窗口 4 内联框架 框架的作用是把浏览器窗口划分成若干个小窗口&#xff0c;每个小窗口可以分别显示不同的网页。 框架的基本结构主要分为框架集和框架两个部分&#xff0c;在网页中分别用<frameset>和<frame>标记…