深度学习用于医学预后-第二课第三周4-7节-关于事件的时间数据,认识处理删失数据

news2025/1/11 15:05:29

在本课中,我们将讨论生存数据。为了能够对生存进行建模,我们需要能够以我们可以处理的形式表示数据。

主要的挑战是删失数据,这是一种特殊形式的缺失数据。我们接下来将要研究这一点。

在这节课中,我们将谈论生存数据和删失。

之前当我们研究预后模型时,我们会问一个问题,过去五年的生存概率是多少?我们有如下格式的数据

我们有一群患者,之前我们使用1表示该患者有事件,0表示该患者可能在五年内没有事件。这就是我们使用的数据。

请注意,这里的关键是我们需要的答案/结果基本上是肯定的或否定的(1或者0)

但现在,当我们处理生存数据时,我们想回答一个不同的问题。“不仅过去五年,过去任何时间t的生存概率是多少?” 为了能够做到这一点,所以我们需要一个信息。让我们通过一个例子来看看我们如何在为患者提供信息时获得这些信息。

当中风未被发现时

例如,我们将观察接受治疗的患者,并监测他们是否发生中风事件。如果他们中风了,看看从治疗到中风之间经过了多长时间。


假设,我们的第一位患者于2018年9月接受了治疗,他们在2019年9月一年后中风。所以对于这个病人,假设我们追踪了月数。这相当于从治疗到发生中风事件的12个月。因此,我们将在这个表中输入已经过去的月数,即12个月。

让我们看看另一个病人。

因此,对于这名患者,于2018年8月接受了治疗,我们对他进行了一年多的跟踪,直到2019年10月,我们决定结束研究。在这段时间内,我们没有观察到任何中风事件。我们知道患者在14个月内没有发生任何事件。

如果他们发生了事件(中风),那应该是在14个月后。所以我们写了一个14+。

第三个例子,患者在2018年8月接受了治疗,仅仅三个月后的2018年11月,他们决定退出研究。这种情况非常常见,原因有很多。比方说,这位患者不得不更换国家,因此不得不退出研究。

所以我们知道,在2018年8月至2018年11月期间,他们没有中风,但我们不知道之后发生了什么。所以我们要说这个病人的时间是3个多月。所以我们把它输入到表格中。

现在,第二种和第三种情况就是我们所说的删失(或审查,censoring)。是生存数据的重要组成部分,需要加以考虑。

心脏病发作数据

让我们把这些知识应用到一个例子中。在这个例子中,我们将观察接受手术的患者,并观察他们在手术后是否心脏病发作。

我们有三名患者,我们于2015年1月开始研究,并于2019年7月结束研究。因此,患者在不同的时间来做手术,我们追踪了他们心脏病发作的时间。

因此,对于第一位患者,他们在2016年3月进行了手术,并在2017年3月心脏病发作,因此我们可以将其记下来,患者1的时间为12个月。

患者2在2015年7月进行了手术,直到2019年7月,我们没有观察到任何心脏病发作事件。所以这是一个四年的过程,相当于48个月。现在请注意,我们已经48个月没有看到任何活动了,所以我们要在这里加一个加号。

对于第三位在2015年11月接受手术的患者,他们在2017年11月退出了手术,所以我们对他们进行了两年或24个月的观察,我们观察到在这段时间内没有发生任何事件,所以我们写24个月+。

因此,通过这种方式,我们可以用图片右边的形式来表示我们的生存数据。

总结一下,我们有生存数据,从将数据表示为“是”或“否”的转变,就像我们在二进制设置中所做的那样,到询问何时以及表示从起源到事件的时间,以及将这些经过审查的观测作为我们数据的一部分,我们将很快对此进行研究。

右删失


我们之前简单地提到过删失,当我们看到一个病人做了2018年8月手术,然后在2018年11月研究结束前退出了研究。我们由此得出的结论是病人在三个月内没有发病。

现在,有可能这个病人在2019年1月发生了事件(如中风的事件),但这可能是任何事件。

但也有可能病人根本就没有发生过这种事,只是一直很健康。

注意到事件总是发生在最后一次接触之后,如果它发生的话,这就是所谓的“右删失”(right censoring)。正式地说,是事件发生的时间超过一定的值。

例如上图,如果这里是2018年8月,这里是2018年11月,那么事件发生的时间将超过三个月,所以我们把这个数据点写成3+。

我们研究过两种类型的右删失:

  • 第一种,我们有一个病人因为我们的研究结束而缺失,这被称为研究结束删失;
  • 第二种,我们有一个病人在研究结束前退出,这被称为失访删失。

现在,删失在生存数据中是一个非常重要的概念,它对于理解生存模型是非常必要的,我们很快就会看到。

下一章,我们将学习使用删失数据进行生存评估~

文章持续更新,可以关注微信公众号【医学图像人工智能实战营】获取最新动态,一个关注于医学图像处理领域前沿科技的公众号。坚持已实践为主,手把手带你做项目,打比赛,写论文。凡原创文章皆提供理论讲解,实验代码,实验数据。只有实践才能成长的更快,关注我们,一起学习进步~

我是Tina, 我们下篇博客见~

白天工作晚上写文,呕心沥血

觉得写的不错的话最后,求点赞,评论,收藏。或者一键三连
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/525546.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode 96 不同的二叉搜索树

题目: 给你一个整数 n ,求恰由 n 个节点组成且节点值从 1 到 n 互不相同的 二叉搜索树 有多少种?返回满足题意的二叉搜索树的种数。 示例 1: 输入:n 3 输出:5 示例 2: 输入:n 1 …

第七章:C语言的操作符

说起操作符大家都不陌生,从我们最初的 - c * / 加减乘除,到更加深奥的操作符,而今天我要有完整的系统来理清楚C语言的操作符到底有什么,和它们相关的用法,话不多说,直接走进今天的主题----C语言的操…

保护个人隐私和数据安全的方法与策略

引言 随着信息技术的普及和发展,我们享受到了便捷的互联网服务,但与此同时,个人隐私和数据安全问题也日益受到威胁。在这个所谓的"裸奔"时代,网络攻击、数据泄露和隐私侵犯已经成为常态。然而,我们并不无助…

sysfs文件系统

sysfs系统介绍 sysfs系统sysfs系统是什么?koject的内核对象模型基础kobject结构体定义kest bus如何管理driver和devicebus_type 结构体 小知识什么是挂载mount命令 📌————本章重点————📌 🔗了解sysfs系统概念; &#x1f5…

布谷鸟hash算法的并行化实现(一)

由于本人最近在写一个项目,为了实现数据查找以及数据修改部分的快速操作,所以采用hash对数据进行存储,而在此过程中接触到了布谷鸟hash,觉得这个hash算法还是很有意思并且高效,所以想着进行一些记录,本系列…

一文带你快速掌握如何读懂 YonBuilder移动开发 的项目源码

本文将通过四大步的简单讲述,让新手开发者朋友们快速掌握阅读YonBuilder移动开发项目源码的技巧方法。 1.读懂代码的第一步,了解项目的整体文件结构 CSS: 存放css样式的文件; feature:猜测是用来存放特征文件的,实际…

了解投影坐标系统,并在精美的地图上探索

投影坐标系简介 地球椭球体表面也是个曲面,而我们日常生活中的地图及量测空间通常是二维平面,因此在地图制图和线性量测时首先要考虑把曲面转化成平面。由于球面上任何一点的位置是用地理坐标(λ,φ)表示的&#xff0…

计算机三级网络技术总结(更新中)

🍿*★,*:.☆( ̄▽ ̄)/$:*.★* 🍿 🍟欢迎来到前端初见的博文,本文主要讲解我计算机三级网络技术🍟 👨‍🔧 个人主页 : 前端初见 🥞喜欢的朋友可以关注一下&#…

BEV专栏(二)从BEVFormer看BEV流程(下篇)

前言 书接上回,在上一篇文章中,我们介绍了BEVFormer这一先进的BEV算法。在本篇文章中,我们将深入探讨BEVFormer的实现细节,旨在帮助读者更深入地理解BEVFormer的工作原理和性能表现。 本教程禁止转载。同时,本教程来自…

【maven】自定义构建maven的jar包依赖

前言 自己定义自己的maven的jar包依赖&#xff0c;本地版本。 实现 pom.xml pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSche…

车载软件架构——闲聊几句AUTOSAR BSW(五)

我是穿拖鞋的汉子,魔都中坚持长期主义的工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 我们并不必要为了和谐,而时刻保持通情达理;我们需要具备的是,偶尔有肚量欣然承认在某些方面我们可能会有些不可理喻。该有主见的时候能掷地有声地镇得住场…

车载基础软件——基础软件验证平台(网络管理和诊断)

我是穿拖鞋的汉子&#xff0c;魔都中坚持长期主义的工程师。 老规矩&#xff0c;分享一段喜欢的文字&#xff0c;避免自己成为高知识低文化的工程师&#xff1a; 我们并不必要为了和谐&#xff0c;而时刻保持通情达理&#xff1b;我们需要具备的是&#xff0c;偶尔有肚量欣然承…

部署packstack及问题总结

目录 一、部署packstack 1.1 简介 1.2 性能搭配 1.3 准备工作 1.4 安装 二、出现的问题 2.1 安装中断临时文件 2.2 提示某个安装包出错 2.3 leatherman版本太高 三、安装成功 一、部署packstack 1.1 简介 对于openstack初学者而言&#xff0c;传统部署openstack流程…

MQ-rabbitMQ_基础篇

MQ-rabbitMQ_基础篇 1.MQ1.1什么是MQ1,2应用 2.常见消息中间件协议&#xff08;模型&#xff09;2.1JMS模型&#xff08;协议&#xff09;2.2AMQP协议 3.RabbitMQ3.1六种工作模式3.1.1Hello Word简单模式3.1.2word queues 工作队列能者多劳 3.1.3Publish/Subscribe 发布与订阅模…

在SwissTargetsPrediction数据库中预测成分靶点

1.对筛选的多肽成分进行靶点预测&#xff1a; ①用Uniport中的蛋白进行一系列操作&#xff08;水解&#xff0c;挑选2~8短肽&#xff0c;活性预测&#xff0c;毒性&#xff0c;过敏性预测&#xff0c;胃肠吸收度&#xff0c;半衰期和苦味的预测、生物活性功能预测&#xff09;…

mybatis连接池源码分析

文章目录 前言一、PooledDataSourceFactory二、获取连接三、归还连接 前言 其实大部分连接池的代码都大同小异&#xff0c;总体获取连接&#xff0c;归还连接逻辑大都相同。希望通过阅读本文章&#xff0c;能给你带来帮助。 测试用例 public void testMybatis()throws Excepti…

深入篇【C++】类与对象:运算符重载详解

深入篇【C】类与对象&#xff1a;运算符重载详解 ⏰一.运算符重载&#x1f553;1.<运算符重载&#x1f550;2.>运算符重载&#x1f552;3.运算符重载&#x1f551;4.运算符重载①.格式1.改进12.改进2 ②.默认成员函数1.功能2.不足 &#x1f553;5.<运算符重载&#x1…

学内核之十九:Linux文件系统结构大蓝图

目录 一&#xff1a;参考资料 二&#xff1a;整理的原因及基本原则 三&#xff1a;Linux文件系统大蓝图 四&#xff1a;补充说明 一&#xff1a;参考资料 博主梳理的关于文件系统的基础知识&#xff1a; 7.5 文件系统_定义_龙赤子的博客-CSDN博客 博主转载的关于page cac…

深入理解深度学习——正则化(Regularization):参数范数惩罚

分类目录&#xff1a;《深入理解深度学习》总目录 正则化在深度学习的出现前就已经被使用了数十年。线性模型&#xff0c;如线性回归和逻辑回归可以使用简单、直接、有效的正则化策略。许多正则化方法通过对目标函数 J J J添加一个参数范数惩罚 Ω ( θ ) \Omega(\theta) Ω(θ…

三、Neo4j 源码研究系列 - 持久化

version: v-2023051401 author: 路__ 说到数据库&#xff0c;那么离不开的模块就是持久化&#xff08;Persistence&#xff09;&#xff0c;数据持久化是数据库不可缺少的重要组成模块之一。可以说一个数据库少了持久化功能&#xff0c;可以说这个数据库就不足以称为数据库。…