【统计模型】生存分析基本知识介绍

news2025/1/11 20:52:09

目录

一、生存分析介绍

1.生存分析用途

2.传统方法在分析随访资料时的困难

(1)生存时间和生存结局都是我们关心的因素

(2)存在大量失访

(3)显然,将失访数据无论是算作死亡还是存活都不合理

3.生存分析的优劣势

(1)优势

(2)劣势

4.生存分析的主要研究内容

(1)描述生存过程(Kaplan-Meier方法)

(2)生存过程影响因素分析及结果预测(Cox回归法)

5.常用术语

(1)失效事件(Failure event)

(2)删失数据(截尾数据,Censored data)

(3)生存时间(Survival time)

(4)生存率(Survival rate)

6.生存分析方法分类

(1)参数法

(2)非参数法

(3)半参数法

二、Kaplan-Meier方法

三、Cox等比例风险模型

1.模型介绍

2.风险函数h(t)

四、加速失效模型


一、生存分析介绍

1.生存分析用途

        生存分析是一种常用于医学研究的方法,但该方法最早用于武器寿命的分析,如考虑炮弹存放一年后仍可正常使用的概率。该方法可用于其他很多领域,如:

(1)职员在公司任职的时间(员工在公司待k年的概率)

(2)产品的寿命预测(可靠性)

(3)治愈某疾病所需时间(使用药物k年后病人的存活率)

2.传统方法在分析随访资料时的困难

(1)生存时间和生存结局都是我们关心的因素

  • 除了生存结局之外,只要能让病人存活时间延长,这种药物也是有效的,即存活时间的延长也是我们关心的问题。
  • 如果将两者均作为因变量拟合多元模型,则生存时间分布不确定(肯定不呈正态分布,在不同情况下其分布规律也不同),生存结局是0-1分布,生存时间是连续型分布,将两者拟合多元模型很困难。

(2)存在大量失访

  • 失去连续(病人搬走,电话号码改变)
  • 无法观察到结局事件发生(死于其他原因)
  • 研究中止

(3)显然,将失访数据无论是算作死亡还是存活都不合理

3.生存分析的优劣势

(1)优势

        在针对总体生存时间都比较短的疾病的研究中,生存分析比考虑结局,不考虑时间因素的Logistic模型等方法的效率要高的多。

(2)劣势

        如果相应疾病的结局都非常好,比如几乎人人都可痊愈的感冒,生存分析的利用价值并不大,因为除非是特殊情况,感冒晚好两天对医生或病人来说并没有太大影响。

4.生存分析的主要研究内容

(1)描述生存过程(Kaplan-Meier方法)

  • 研究人群生存状态的规律
  • 研究生存率曲线的变动趋势
  • 是人寿保险业的基础(从加入保险开始,每年有多少理赔事件发生,公司收多少费用才能保证不赔)

(2)生存过程影响因素分析及结果预测(Cox回归法)

  • 了解哪些因素会影响生存过程
  • 对生存结局加以预测(如病人还能活多久):该方法在临床医学领域应用非常广泛

5.常用术语

(1)失效事件(Failure event)

        也被称为“死亡”事件或失败事件,表示观测到受访对象出现了我们所规定的结局。失效事件的认定是生存分析的重要环节,必须绝对准确。

        失效事件应当由研究目的而决定,并非一定是死亡(如研究灯泡寿命),而死亡也并非一定是发生了失效事件(如肺癌患者死于其他疾病)。

(2)删失数据(截尾数据,Censored data)

        终止随访不是由于失效时间发生,而是无法继续随访下去,常用符号“+”表示,如:

  • 生存但中途失访:包括拒绝访问、失去联系或中途退出试验。
  • 死于其它与研究无关的原因:如肺癌患者死于其他疾病,终止随访时间即为死亡时间。
  • 随访截止:随访研究结束时观察对象仍存活。

(3)生存时间(Survival time)

        随访观察持续的时间,按失效事件发生或失访前最后一次的随访事件记录,常用符号t表示。

        根据失效事件的定义不同,生存时间可能是各种类型的指标,甚至可能不是“时间”,如:

  • 设备从开始使用到失效的累计使用时间;
  • 汽车的累计行驶里程。

(4)生存率(Survival rate)

        生存率也称为生存函数S(t) ,指某个受访对象活过t时刻的概率,用S(t)=P(x>t) 表示,可见S(t)=1-F(t) ,其中F(t) 为生存时间的分布函数。

        根据不同研究问题定义的失效事件,生存率可以是产品有效率、可靠性等。

6.生存分析方法分类

(1)参数法

        首先要求观察的生存时间X 服从某一特定的分布,采用估计分布中参数的方法获得生存率P(X>t) 的估计值。

        生存时间的分布F(.) 可能为指数分布、weibull 分布、对数正态分布等,这些分布曲线都有相应的生存率函数形式。只需求得相应参数的估计值,即可获得P(X>t) 的估计值和曲线。

P(X>t)=1-F(t)

(2)非参数法

        实际工作中,多数生存时间的分布不符合上述常见的分布,就不宜用参数法进行分析,而应当用非参数法。

        这类方法的检验假设与以往所学的非参数法一样,原假设是两组或多组的总体生存率曲线分布相同(不论总体的分布形式和参数如何)。如检验服药组和对照组的生存曲线是否有显著差异,从而判断药物疗效。

        非参数法是生存数据的常用分析方法

(3)半参数法

        只规定了影响因素和生存状况间的关系,但是没有对事件(和风险函数h(t) )的分布情况加以限定。

        这种方法主要用于分析生存率的影响因素,属多因素生存分析方法,典型方法是Cox等比例风险模型。

二、Kaplan-Meier方法

        是最基本的一种生存分析方法,例如新药组与对照组疾病疗效的比较研究

三、Cox等比例风险模型

1.模型介绍

        Cox等比例风险模型属于半参数模型,与参数模型相比,该模型不能给出各时点的生存率,其对生存时间的分布无要求,可发掘在整个研究时段内对生存状况影响显著的因素,并估计出各因素对生存率的影响程度,因而应用范围更广。为了纪念Cox的贡献,统计学家把它称为Cox等比例风险模型(Cox回归模型)

2.风险函数h(t)

        生存到时刻t的观察对象在时刻t的瞬间死亡率称为风险函数(hazard function)。

        在比例风险模型中,假设在时点t个体出现观察结局的风险大小可以分解为两个部分:有一个基本风险量h0(t) ,代表没有任何自变量影响下的生存状况(反映病人不采取任何措施时的生存状况);第i个影响因素使得在任意一个时点t的死亡风险(风险函数值)从h0(t) 增加e(biXi) 倍,称为ht=h0(t)e(biXi)

        因此,如果在k各因素同时影响生存过程的情况下,在时点t的风险函数值就为:

上式取对数,移项得:

  • Rh(t) :k个因素影响下得新风险函数值与基本风险量之比。
  • h0(t) (基准风险函数):表示个体在时点t得基准生存状况(没有任何自变量影响下的风险函数)。
  • 两个人在某一特定时刻死亡风险比值如下:

  • bi :与以前相同,可直接理解为Xi 的回归系数;实际含义是,当变量Xi 改变一个单位时,引起的死亡风险改变倍数的自然对数值。
  • exp(bi) (相对危险度,Relative Risk):表示当变量Xi 改变一个单位时,前后两种情况下发病风险(风险函数值)之比RR=h(t,Xi+1)/h(t,Xi) ;如果RR>1则说明相应的自变量取值增加一个单位,会导致受访个体的发病/死亡风险增加若干倍;因此,RR在医学领域应用极为广泛,在该领域其使用价值高于优势比OR(odds ratio)。

四、加速失效模型

log(Z)=X'β+ε=β0+β1X1+β2X2+β3X3

其中,Z0=exp(ε) 称为基准生存时间,Z=Z0e(X'β) 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/659857.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CSS基础学习--20 提示工具(Tooltip)

一、定义 提示工具在鼠标移动到指定元素后触发&#xff0c;总共四种样式实例&#xff1a; 二、基础提示框(Tooltip) 提示框在鼠标移动到指定元素上显示 <!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>CSS基础学习-提…

【RV1126】IIC驱动--EEPROM

文章目录 原理图查找空闲的I2CEEPROM芯片改设备树编写驱动驱动端设备端驱动端和设备端编译成驱动模块应用层的测试代码 原理图查找空闲的I2C 由上面可以知道&#xff0c;空闲了I2C4接口&#xff0c;然后也引出来了。 再找原理图找到具体引脚&#xff1a; I2C4_SCL&#xff1…

第 5 章 机器学习技术的应用(下)

全文目录 机器学习技术的实施方法 预测阶段效果监控 离线预测在线预测 监控点击率的稳定性 真实点击率的稳定性 计算相邻两个区间内点击率分布的 PSI(Population Stability Index, 群体稳定性指标), 小于 0.1 可认为数据相对稳定;预测点击率的稳定性 与系统本身和用户发生变…

Dice Loss

导读 ​ Dice Loss是由 Dice 系数而得名的&#xff0c;Dice系数是一种用于评估两个样本相似性的度量函数&#xff0c;其值越大意味着这两个样本越相似&#xff0c;Dice系数的数学表达式如下&#xff1a; Dice 2 ∣ X ∩ Y ∣ ∣ X ∣ ∣ Y ∣ \text { Dice }\frac{2|X \ca…

Windows10完全卸载oracle19c

Windows10完全卸载oracle19c 1.停止服务2.卸载产品3.清理注册表4.清理环境变量5.清理文件夹 1.停止服务 winR输入service.msc进入服务列表&#xff0c;停止所有的服务 2.卸载产品 点击开始菜找到Oracle&#xff0c;然后点击Oracle安装产品&#xff0c;再点击Universal Inst…

如何安装PHP框架

目录 什么是PHP框架 第一步 安装PHP依赖包 第二步 导入PHP相关包 第三步 解包并切换进指定目录 第四步 在PHP目录内编译安装 第五步 编译 第六步 拷贝配置文件进行编辑 第七步 修改时区 第八步 修改文件指定路径 第九步 将命令加入指定目录进行识别 第十步 进入配置…

【Flutter】Audioplayers 4.1.0 简要使用说明

文章目录 一、前言二、安装和设置三、基本使用1.创建 AudioPlayer 实例2.设置音频源3.控制播放 四、示例代码五、总结 一、前言 Audioplayers 是一个非常实用的 Flutter 插件&#xff0c;它可以帮助我们在 Flutter 应用中播放音频。无论你是想在你的应用中添加背景音乐&#x…

【Python】在同一图形中更加优雅地绘制多个子图

1. 引言 数据可视化非常重要&#xff0c;有一句俗语叫做一图顶千言&#xff0c;我相信好多小伙伴应该都听说过这句话&#xff1b;即使是有人第一次听到&#xff0c;我想应该也会觉得赞成&#xff0c;这足以说明数据可视化的重要性。我们在前一篇博客中&#xff0c;介绍了如何利…

C语言基础 位域

C语言基础&#xff1a;位域 主题&#xff1a;位域&#xff08;bit-field&#xff09; 关键字&#xff1a;位域 冒号 结构体 存储空间 参考链接&#xff1a;C语言中文网&#xff1a;位域 、C菜鸟工具&#xff08;在线编译器&#xff09;、位域知乎问答 注&#xff1a;以下内容中…

VM安装linux虚拟机宿主机连接不上虚拟机问题处理及静态ip设置

VM安装linux虚拟机宿主机连接不上虚拟机问题处理 用 vm安装linux虚拟机宿主机连不上虚拟机&#xff0c;ipconfig宿主机发现VMnet1以及VMnet8的Ip都变成了169.254开头的地址&#xff0c;网上各种方式都试了都不行&#xff0c;要么 是 虚拟机连不上网&#xff0c;要么 是宿主机连…

金融测试岗面试有多难?我有秘招……

最近发现好多人都喜欢往金融测试岗跑&#xff0c;看来是真的很香了&#xff0c;但是你们知不知道面试金融测试岗还是很难的&#xff0c;如果想去面试真的要多做些了解再去&#xff0c;我在这里总结了一份面试文档分享给大家&#xff0c;若有需要&#xff0c;【留言777】即可。 …

windows 系统加固

其实Windows和Linux加固的方法都差不多 1.防火墙 1.防火墙的开启 2.入站规则进行设置 对一些端口更改后可以使用telnet 进行检测端口是否开放 2.安装杀毒软件 3.扫描漏洞&#xff0c;打补丁 一般漏洞扫描可以借用第三方平台对系统漏洞进行扫描。 开启补丁的自动更新 4.用…

【css系列】八股2023/6/18

1.说说设备像素、css像素、设备独立像素、dpr、ppi 之间的区别&#xff1f; css 像素&#xff1a;长度单位&#xff0c;在css规范中&#xff0c;长度单位分为两类&#xff1a;绝对单位 和 相对单位。 设备像素&#xff1a;物理像素&#xff0c;指设备能控制显示的最小物理单位…

计算机视觉的应用8-基于ResNet50对童年数码宝贝的识别与分类

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下计算机视觉的应用8-基于ResNet50对童年数码宝贝的识别与分类&#xff0c;想必做完90后的大家都看过数码宝贝吧&#xff0c;里面有好多类型的数码宝贝&#xff0c;今天就给大家简单实现一下&#xff0c;他们的分类任…

计网大题(6/18)

1.奈奎斯特定理和香农公式 1.奈奎斯特 B1/T ,T是波特 &#xff0c;B成为波特率 奎氏定理&#xff1a;R2Wlog2&#xff08;N&#xff09; &#xff08;W是理想信道带宽&#xff0c;单位是hz&#xff09; 香农公式 R是最大信道容量 信道带宽是W 信噪比是S/N ,(S是平均信号功率…

kotlin学习(二)泛型、函数、lambda、扩展、运算符重载

文章目录 泛型&#xff1a;in、out、where型变&#xff08;variance&#xff09;不变&#xff08;Invariant&#xff09;协变&#xff08;Covariant&#xff09;Java上界通配符<? extends T>Kotlin的关键词 outUnsafeVariance 逆变&#xff08;Contravariant&#xff09…

Portraiture4.1智能磨皮滤镜插件下载安装使用教程

ps磨皮插件portraiture是一款用于修饰人像照片的插件&#xff0c;可以在Photoshop中使用。它可以通过智能算法来自动识别照片中的肤色区域&#xff0c;然后对其进行磨皮处理&#xff0c;使得肌肤更加光滑细腻。不需要像曲线磨皮、中性灰磨皮那样需要复杂的操作&#xff0c;轻轻…

JavaScript之函数 (七):认识JavaScript函数、函数的声明和调用、函数的递归调用、局部和全局变量、函数表达式的写法、立即执行函数使用

1. 认识JavaScript函数 1.1 程序中的foo、bar、baz 在国外的一个问答网站stackover flow中&#xff0c;常常会使用这几个次进行变量&#xff0c;函数&#xff0c;对象等等声明&#xff0c;地位如同张三&#xff0c;李四&#xff0c;王五。foo、bar这些名词最早从什么时候、地…

【MySQL入门】-- 认识MySQL存储引擎

目录 1.MySQL存储引擎有什么用&#xff1f; 2.MySQL的存储引擎有哪些&#xff1f;分别有什么特点&#xff1f; 3.存储引擎的优缺点 4.关于存储引擎的操作 5. 存储引擎的选择&#xff1f; 6.InnoDB和MyISAM区别&#xff1f; 7.官方文档 1.MySQL存储引擎有什么用&#xff…

2022 年第十二届 MathorCup 高校数学建模挑战赛D题思路

目录 一、前言 二、问题背景 三、问题 四、解题思路 &#xff08;1&#xff09;针对问题1&#xff1a; &#xff08;2&#xff09;针对问题2&#xff1a; &#xff08;3&#xff09;针对问题3&#xff1a; 五、附上几个典型代码 &#xff08;1&#xff09;K-means算法…