多组学+机器学习+膀胱癌+分型+建模

news2025/1/4 5:28:16

图片

这是一个基于多组学+机器学习的分型建模文章,这里我们大概介绍一下,这篇文章做了啥

一、研究背景

1、尿路上皮癌是高度恶性的肿瘤,预后差,死亡率高

2、没有明显有效的治疗方法,多数患者在免疫治疗中无法受益,其原因可能是患者之间异质性

3、基于此,作者使用多组学数据与机器学习方法进行分析,以识别生物标志物,能够有效的改善患者预后,和免疫治疗的效果

过程:TCGA(mRNA+lncRNA+miRNA+甲基化)多组织整合构建分子亚型,并通过差异分析筛选预后相关的32个基因,通过10种机器学习的算法构建预后模型

二、数据准备

TCGA+IMvigor210+GEO(GSE13507,GSE31684,GSE32548,GSE32894,GSE48075,GSE48276)+ E-MTAB-1803的数据集(本文做的是膀胱癌,所以可以以IMvigor210作为训练集,大家在做的时候,需要注意,训练集样本量多)

三、方法和结果展示

分析流程

图片

1、多组学共识MUC预后相关分子亚型的构建

通过合并几套数据集,去批次,通过PCA查看去批次前后的各个数据集之间的分布

图片

通过MOVICS包对mRNA+lncRNA+miRNA+甲基化进行聚类,使用包中的getElites函数筛选出各组学中变化最大的前1500个基因(或突变频率最高的1500个基因),依次为特征,使用包中getMOIC函数中流程化的10种聚类算法: iClusterBayes, moCluster, CIMLR, IntNMF, ConsensusClustering, COCA, NEMO, PINSPlus, SNF和LRA,根据先前的研究指定将患者分为三型,获得每种算法的分型结果后,使用getConsensusMOIC函数整合10种分型的结果并最终生成一种稳健的分型(以下称为CSs)。图A是整合分型在多组学中的分型效果,图B展示了CSs以及10种分型的结果,图C的相关性热图也展示了各亚型内的相似性以及亚型间的不相关性,图D的KM曲线说明基于多组学和多模型构建的分型能够准确对患者预后进行分层。

图片

2、分子亚型之间功能的注释+免疫特征(分子景观)

通过收集一些关键的特征基因集(比如作者收集的与治疗反应相关以及膀胱癌相关的signature),通过ssGSEA的算法对三个亚型进行注释,结果发现CS2可能更倾向于目前公认的管腔样亚型,而CS3可能更倾向于基底样亚型(这个需要一定的背景去判断)。

接着分析了3个亚型在癌症染色质重塑相关的潜在调节因子和23个转录因子之间差异。进一步说明构建的CSs分型与染色质重塑相关

不同分子亚型关于免游已检查点,免疫浸润等等差异

图片

三个亚型之间进行了差异分析,选择了每一个亚型的 top20 个上调的基因作为特征绘制基因表达热图(图D),通过这20个基因作为一个分类器,对验证集分型,并绘制KM曲线(E),通过这20个基因的分类器使用NTP的算法构建计算分类的准确性。

图片

3、机器学习构建预后模型CMLS

基于10种机器学习组合算法对三个队列筛选特征基因构建风险模型(这里选择前面前面使用的各个亚型的top20的基因进行分析,可以在分析之前加入单因素cox分析),筛选出关键基因后,可以选择多因素计算系数建模,当然也可以通过Logistic回归方建模,单因素cox,多因素cox展示关键的预后情况,KM曲线

图片

4、CMLS与其他已经发表的模型做对比

在不同的数据集中比较作者筛选的特征基因构建的模型的c-index

图片

为了进一步说明模型的实用性,作者基于CMLS构建了诺莫图。校准曲线证明(图E),列线图的精度与实际情况相一致。决策曲线分析(DCA)显示,列线图对患者的临床获益明显高于单独使用CMLS(图F, G),且时间依赖的c指数进一步证明了列线图具有更好的预测性能(图H)

图片

5、CMLS 的免疫

TME相关的分析预测免疫评分,并比较高低组之间的差异

图片

ssGSEA分析,预测特征基因集的评分,并比较高低组之间的差异

图片

TMB+TNB(TCIA下载)的比较,巨噬细胞浸润相关性和比较,KM曲线

图片

6、CMLS 对免疫疗法反应预测能力

对IMvigor-210队列,作者评估了治疗 3 个月后患者的长期生存期差异,发现低分组显示出更好的预后效果(图A,B),图C表明在有反应组的CMLS得分低于无反应组。图D是基于TIP算法评估的抗肿瘤免疫7步骤活性在两组间的差异

图片

使用TIDE算法预测了免疫治疗反应(图E),高低CMLS组间有反应和无反应患者的比例,submap算法评估CMLS分组与抗PD1以及CTLA4疗效反应分组的一致性

图片

CMLS在另外三个免疫治疗队列中预测预后效能的评估,同样发现低CMLS的疗效可能更好。

图片

7、筛选潜在的治疗药物

GSEA富集分析发现高CMLS组患者的血管生成、EMT、缺氧等通路被明显激活,CTRP+PRISM(CCLE)计算药物的敏感性

图片

小结:

1、这篇文章使用一种新的聚类的方法构建分子亚型,并纳入和mRNA,miRNA,lncRNA,甲基化数据特征进行聚类,多组学分析,让整个结果更加准确

2、模型验证中纳入了NTP,我们网站之前使用的NTP的算法,基本上是通过两两进行对比,而在这次分析中,使用三种的亚型的敏感性比较,值得借鉴,但是原文筛选特征的基因的方法是使用差异基因做的。后面我们会对NTP的工具进行更新

3、多种机器学习的方法构建风险模型,做了两次模型的比较,第一次是机器学习算法的比较,第二次是与之前研究筛选到的特征基因进行比较,进一步突出作者筛选的特征基因,更具有研究价值

4、模型对于免疫治疗的具有非常好的预测作用

5、模型潜在治疗的药物的筛选

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1624607.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

STM32H750外设ADC之开始和结束数据转换功能

目录 概述 1 开始转换 1.1 使能ADSTART 1.2 使能JADSTART 1.3 ADSTART 通过硬件清零 2 转换时序 3 停止正在进行的转换( ADSTP、 JADSTP) 3.1 停止转换功能实现 3.2 停止转换流程图 概述 本文主要讲述了STM32H750外设ADC之开始和结束数据转换…

JavaScript-Vue入门

本文主要测分享Vue的一些基础 Vue简介 Vue.js 是一个构建数据驱动的 web 界面的渐进式框架。它的主要目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。 下是一些 Vue 的主要特点和概念: 1. 响应式数据绑定:Vue 使用基于 HTML 的模板语法…

Android --- SharedPreferences

SharedPreferences 对应sp文件的接口 使用 SharedPreferences API可以保存的相对较小键值对集合。SharedPreferences 对象指向包含键值对的文件,并提供读写这些键值对的简单方法。每个 SharedPreferences 文件均由框架进行管理,可以是私有文件&#xff…

李沐66_使用注意力机制的seq2seq——自学笔记

加入注意力 1.编码器对每次词的输出作为key和value 2.解码器RNN对上一个词的输出是query 3.注意力的输出和下一个词的词嵌入合并进入RNN 一个带有Bahdanau注意力的循环神经网络编码器-解码器模型 总结 1.seq2seq通过隐状态在编码器和解码器中传递信息 2.注意力机制可以根…

stable diffusion 的controlNet 安装和使用

stable diffusion 安装controlNet需要先下载扩展 扩展地址 下载了扩展以后,需要下载相应的模型,每个模型大约1.45G,可以按需下载。 模型地址 如果下载速度太慢,可以考虑去liblib下载,但是是全量模型 liblib 模型下载完后&#…

使用windows端MySQL创建数据库

1.命令行登录数据库 命令:mysql -u用户名 -p密码; 切记命令后面要以分号结尾 2. 查看和创建数据库 查看数据库命令:show database; 创建数据库命令:mysql> create database db_classes; 创建一个名为db_classes的…

通配符HTTPS安全证书

众多类型的SSL证书,要说适用或者说省钱肯定是通配符了,因为谁都想一本SSL证书包括了整条域名,而且也不用一条一条单独管理。 通配符HTTPS安全证书,其实就是通配符SSL证书,SSL证书主流CA的参数都一样,通配符…

使用riscv-tests进行指令测试(二)

使用riscv-tests进行指令测试(二) 1 测试用例命名规则2 测试用例dump文件介绍 本文属于《 TinyEMU模拟器基础系列教程》之一,欢迎查看其它文章。 1 测试用例命名规则 用例名称 TVM Name “-” Target Environment Name “-” “指令”…

【论文浅尝】Phi-3-mini:A Highly Capable Language Model Locally on Your Phone

Phi-3-mini phi-3-mini,一个3.8亿个参数的语言模型,训练了3.3万亿个token,其总体性能,通过学术基准和内部测试进行衡量,可以与Mixtral 8x7B和GPT-3.5等模型相媲美(在MMLU上达到69%,在MT-bench上达到8.38)&…

python_django农产品物流信息服务系统6m344

Python 中存在众多的 Web 开发框架:Flask、Django、Tornado、Webpy、Web2py、Bottle、Pyramid、Zope2 等。近几年较为流行的,大概也就是 Flask 和 Django 了 Flask 是一个轻量级的 Web 框架,使用 Python 语言编写,较其他同类型框…

13 如何利用缓存实现万级并发扣减

在上一讲的实现方案里我们讨论了采用纯数据库的扣减实现方案,如果以常规的机器或者 Docker 来进行评估,此方案较难实现单机过万的 TPS。之所以介绍,是想告诉你,架构是面向业务功能、成本、实现难度、时间等因素的取舍,…

广工电工与电子技术实验报告-8路彩灯循环控制电路

实验代码 module LED_water (clk,led); input clk; output [7:0] led; reg [7:0] led; integer p; reg clk_1Hz; reg [7:0] current_state, next_state; always (posedge clk) begin if(p25000000-1)begin …

对2023年图灵奖揭晓看法

2023年图灵奖揭晓,你怎么看? 2023年图灵奖,最近刚刚颁给普林斯顿数学教授 Avi Wigderson!作为理论计算机科学领域的领军人物,他对于理解计算中的随机性和伪随机性的作用,作出了开创性贡献。这些贡献不仅推…

C++修炼之路之多态---多态的原理(虚函数表)

目录 一:多态的原理 1.虚函数表 2.原理分析 3.对于虚表存在哪里的探讨 4.对于是不是所有的虚函数都要存进虚函数表的探讨 二:多继承中的虚函数表 三:常见的问答题 接下来的日子会顺顺利利,万事胜意,生活明朗--…

PPSSPPSDL for Mac v1.17.1 PSP游戏模拟器(附500款游戏) 激活版

PPSSPPSDL for Mac是一款模拟器软件,它允许用户在Mac上运行PSP(PlayStation Portable)游戏。通过这款模拟器,用户可以体验到高清甚至更高的分辨率的游戏画面,同时还能够升级纹理以提升清晰度,并启用后处理着…

安卓手机连接电脑实用技巧:实现文件传输与共享

在手机使用过程中,我们常常需要将手机中的文件传输到电脑,或者将手机与电脑进行共享。为了实现这一需求,掌握一些实用的安卓手机连接电脑技巧就显得尤为重要。本文将为您详细介绍2种简单、高效且安全的方法,让您轻松实现安卓手机与…

【网络安全】安全事件管理处置 — 事件分级分类

专栏文章索引:网络安全 有问题可私聊:QQ:3375119339 目录 一、安全事件分级 二、应急事件分级 三、安全事件分类 四、常见安全事件原因分析 1.web入侵 2.漏洞攻击 3.网络攻击 一、安全事件分级 在对安全事件的应急响应过程中&#xf…

如何最大程度使用AWS?

随着云计算技术的不断发展,AWS已经成为众多企业的首选,为其提供了强大的基础设施和服务。那么如何最大程度地、灵活地利用AWS,成为许多企业专注的焦点。九河云作为AWS的合作伙伴,为读者们提供一些技巧和策略,帮助读者充…

物联网鸿蒙实训解决方案

一、建设背景 在数字化浪潮汹涌的时代,华为鸿蒙系统以其前瞻的技术视野和创新的开发理念,成为了引领行业发展的风向标。 据华为开发者大会2023(HDC. Together)公布的数据,鸿蒙生态系统展现出了强劲的发展动力&#x…

Qt : 禁用控件默认的鼠标滚轮事件

最近在写一个模拟器,在item中添加了很多的控件,这些控件默认是支持鼠标滚动事件的。在数据量特别大的时候,及容易不小心就把数据给修改了而不自知。所有,我们这里需要禁用掉这些控件的鼠标滚轮事件。 实现的思想很简单&#xff0c…