2024 - 超火的多模态深度学习公共数据纯生信5+思路分享

news2024/11/18 20:25:20

超火的多模态深度学习公共数据纯生信5+思路分享

多模态深度学习具有处理和整合多种类型信息的优势,特别是在预测患者预后方面能够结合不同类型的生物医学数据,如临床数据、基因表达数据、蛋白质组学数据、成像数据等,进而提高预后预测的准确性和鲁棒性。因此,这一领域得到了快速发展,并成为当前生信分析中备受关注的热门领域。小编今天就和大家分享一篇今年6月发表在**Precision Clinical Medicine(5.1/Q1)**杂志上题为“Deep learning-based multi-modal data integration enhancing breast cancer disease-free survival prediction”基于多模态深度机器学习术前预测乳腺癌患者无病生存期(DFS)的文章。

图片

一.文章摘要

**研究从TCGA和中山大学中山纪念医院(SYSMH)收集了乳腺癌患者的病理影像、基因和临床数据,开发了一个基于深度学习的多模态模型(DeepClinMed-PGM)以预测患者DFS。**结果研究观察到多模态模型DeepClinMed-PGM在训练队列、内部验证队列和外部测试队列都表现出良好的预测效能。总之,该研究引开发了一个结合影像学、分子和临床数据的多模态乳腺癌预后预测模型,提高了乳腺癌患者DFS预测的准确性,为患者个性化治疗提供了参考。

二.文章的主要内容及结果

1.基于病理的深度学习模型的开发

**文章首先介绍了研究涉及患者的主要特征。**研究纳入了来自SYSMH和TCGA的1020例非转移性乳腺癌患者(表1),后续分析中这些患者被划分为训练队列(n = 741),内部验证队列(n = 184)和外部测试队列(n = 95)。

图片表1 TCGA和SYSMH组患者的临床特征

**文章接着介绍了基于深度学习开发乳腺癌多模态预后预测模型的流程。**研究整合患者病理及基因分子、临床数据基于深度机器学习开发了多模态预后预测模型DeepClinMed-PGM,主要流程如图1所示。具体来说研究首先以8:2的比例将925例TCGA患者随机分为训练组和内部验证组。接着对单个整张切片图像(WSIs)进行操作,使用改进的CLAM架构和弱监督学习训练原发肿瘤组织区域。接下来研究从病理图像中自动提取原发肿瘤斑块,并开发了一个基于深度病理的多实例学习生存模型,以预测基于患者的DFS风险,该模型使用改进的ResNet50架构进行特征提取和迁移学习算法,能够有效地识别出关键特征(图1B)。此外,研究进一步将分子和临床病理特征与基于病理的生存模型相结合,形成DeepClinMed-PGM,其整合了分子和临床病理数据,为DFS预测提供了个性化的方法(图1C)。

图片图1 本研究的工作流程和图形方法概述

2.整合多模态数据和临床信息加强预测

**文章接着整合多模态及临床数据对模型进行优化。**研究首先分析了PAM50亚型、年龄、临床TNM分期和免疫细胞浸润等219个基因和临床病理因素。接着研究将32个临床病理特征与深度学习模型相结合,结果发现能够显著提高训练及验证队列预测的准确性(图2A-C)。此外,研究通过DeepClinMed-PGM模型得分将患者分为高和低风险组,并观察到DeepClinMed-PGM模型的稳健判别能力在不同的队列中都是一致的(图2D-F)。研究通过决策曲线(DCA)分析也观察到所有队列中,与基于病理的生存模型、基因特征和单独的病理特征相比,DeepClinMed-PGM模型性能始终更优越(图2G-I),这一结果强调了DeepClinMed-PGM模型在早期DFS预测中的重要临床价值。

图片图2 训练集、验证集和测试集的AUC和KM曲线

3.模型结果可视化

**文章接着介绍了模型结果的分析及可视化。**研究利用病理样本的WSIs进行分析,并结合训练队列的RNA测序数据,识别了高和低风险组间的219个差异表达基因(图3A)。接着研究对这些基因进行GO及KEGG富集分析,结果观察到这些基因富集到与免疫和转录相关的关键功能和通路(图3B,C)。此外,研究在训练队列中也观察到KMT2C和MAP3K1具有很高的突变频率(图3D)。同时研究观察到高风险组和低风险组间免疫细胞浸润也存在显著差异(图3E)。

图片图3 高低组差异分析

**研究也绘制了病理热图展示肿瘤组织与模型预测的关联。**热图中的暖色(如红色)表示对模型预测有较高影响,冷色(如蓝色)表示对模型预测的影响较低。较深的阴影表示更强的网络反应,具有更高的权重,表明模型对这些特定区域的关注更加强烈。蓝色阴影的主要代表肿瘤的边界、形状和纹理等结构。研究观察到复发或转移风险高的患者在肿瘤附近和远处均有集中的热点,而无复发或转移风险的患者热点则主要集中在肿瘤区域内(图4)。

图片图4 病理热图显示人工智能识别出的感兴趣区域(ROI)

4.多模态模型结果评估

**文****章最后对构建的多模态模型的结果进行了解读及评估。**首先为了评估临床特征对乳腺癌患者DFS的预测作用,研究在训练和试验队列进行了单因素回归分析,结果发现年龄、分期、T分期和N分期等临床特征不能独立预测乳腺癌患者的DFS,而多模态风险评分在训练和试验队列中都是更有效的预测因子(图5A-B )。接着研究使用CIBERSORT算法进行免疫浸润分析,结果发现高风险组中M2和M0巨噬细胞的浸润较高(图5C)。此外,研究分析也发现免疫检查点基因在低风险组的表达普遍较高(图5D)。

图片图5 不同危险人群差异分子特征的验证

此外研究也发现低风险组免疫因子相关基因的表达也较高(图6A)。研究对免疫因子相关基因进行富集分析发现其主要富集在补体激活、吞噬、雌激素信号、趋化因子信号、细胞黏附及细胞通讯等通路(图6B-D)。

图片图6 不同风险人群差异分子特征的免疫学分析

到这里文章的主要内容就介绍完啦,总结一下**该研究基于深度学习构建了乳腺癌DFS预测多模态模型,并在多个数据集中验证了该模型的预测准确性,同时也对预测结果进行了相关表达、功能及免疫浸润等的全面解读。**相较于经典的构建预后特征方法,多模态深度学习能够融合不同模式的数据,更好地处理、解释并整合不同来源的数据信息。因此,多模态深度学习也成为了近期大火的发文思路,感兴趣的小伙伴不要错过呀。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2243005.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

抽象java入门1.5.3.1——类的进阶

前言:在研究神技代码Hello word的时候,发现了一个重大公式bug,在代码溯源中,我发现了一个奇怪的东西,就是OUT不是类中类(不是常规类的写法) 内容总结: 代码运行的顺序复习 正片开始…

k8clone二进制工具迁移k8s中的无状态应用

1 概述 k8clone是一个简便的Kubernetes元数据克隆工具,它可以将Kubernetes元数据(对象)保存为本地压缩包,在恢复时可将这些元数据恢复到目标集群中(已存在的资源不会被覆盖)。它不依赖远程存储&#xff0c…

HelloMeme 上手即用教程

HelloMeme是一个集成空间编织注意力的扩散模型,用于生成高保真图像和视频。它提供了一个代码库,包含实验代码和预训练模型,支持PyTorch和FFmpeg。用户可以通过简单的命令行操作来生成图像和视频。 本文将详细介绍,如何在GPU算力租…

Chrome 浏览器开启打印模式

打开开发者工具ctrl shift p输入print 找到 Emulate CSS print media type

3步实现贪吃蛇

方法很简单,打开页面,复制,粘贴 一.整体思维架构 我们根据游戏的开始,运行,结束,将整个游戏划分成三个部分。在每个部分下面又划分出多个功能,接下来我们就根据模块一一实现功能。 二.Gamesta…

使用 Go 实现将任何网页转化为 PDF

在许多应用场景中,可能需要将网页内容转化为 PDF 格式,比如保存网页内容、生成报告、或者创建网站截图。使用 Go 编程语言,结合一些现有的库,可以非常方便地实现这一功能。本文将带你一步一步地介绍如何使用 Go 语言将任何网页转换…

.NET 9.0 中 System.Text.Json 的全面使用指南

以下是一些 System.Text.Json 在 .NET 9.0 中的使用方式,包括序列化、反序列化、配置选项等,并附上输出结果。 基本序列化和反序列化 using System; using System.Text.Json; public class Program {public class Person{public string Name { get; se…

.netcore + postgis 保存地图围栏数据

一、数据库字段 字段类型选择(Type) 设置对象类型为:geometry 二、前端传递的Json格式转换 前端传递围栏的各个坐标点数据如下: {"AreaRange": [{"lat": 30.123456,"lng": 120.123456},{"lat": 30.123456…

用pyspark把kafka主题数据经过etl导入另一个主题中的有关报错

首先看一下我们的示例代码 import os from pyspark.sql import SparkSession import pyspark.sql.functions as F """ ------------------------------------------Description : TODO:SourceFile : etl_stream_kafkaAuthor : zxxDate : 2024/11/…

算法日记 26-27day 贪心算法

接下来的题目有些地方比较相似。需要注意多个条件。 题目:分发糖果 135. 分发糖果 - 力扣(LeetCode) n 个孩子站成一排。给你一个整数数组 ratings 表示每个孩子的评分。 你需要按照以下要求,给这些孩子分发糖果: 每…

编写一个生成凯撒密码的程序

plain list(input("请输入需要加密的明文(只支持英文字母):"))key int(input("请输入移动的位数:"))base_A ord(A)base_a ord(a)cipher []for each in plain:if each :cipher.append( )else:if each.i…

PyCharm2024.2.4安装

一、官网下载 1.从下面的链接点进去 PyCharm: The Python IDE for data science and web development by JetBrains 2.进入官网后,下载pycharm安装包 3.点击下载能适配你系统的安装包 4.安装包下载完成 二、安装 1.下载完成后,打开点击右键&#xff…

【MySQL】MySQL数据库入门:构建你的数据基石

🍑个人主页:Jupiter. 🚀 所属专栏:MySQL初阶探索:构建数据库基础 欢迎大家点赞收藏评论😊 目录 🦅数据库基础🐀什么是数据库🐏主流数据库🦆MySQL数据库的基本…

基于Python 和 pyecharts 制作招聘数据可视化分析大屏

在本教程中,我们将展示如何使用 Python 和 pyecharts 库,通过对招聘数据的分析,制作一个交互式的招聘数据分析大屏。此大屏将通过不同类型的图表(如柱状图、饼图、词云图等)展示招聘行业、职位要求、薪资分布等信息。 …

OMV7 树莓派 tf卡安装

​ 升级7之后,问题多多,不是docker不行了,就是代理不好使 今天又重装了一遍,用官方的链接,重新再折腾一遍…… 使用raspberry pi imager安装最新版lite OS。 注意是无桌面 Lite版 配置好树莓派初始化设置&#xff0…

idea 弹窗 delete remote branch origin/develop-deploy

想删除远程分支,就选delete,仅想删除本地分支,选cancel; 在 IntelliJ IDEA 中遇到弹窗提示删除远程分支 origin/develop-deploy,这通常是在 Git 操作过程中出现的情况,可能是在执行如 git branch -d 或其他…

GitCode光引计划有奖征文大赛

一、活动介绍 GitCode平台汇聚了众多杰出的G-Star项目,它们犹如璀璨星辰,用各自的故事和成就,为后来者照亮前行的道路。我们诚邀广大开发者、项目维护者及爱好者,共同撰写并分享项目在GitCode平台上托管的体验,挖掘平…

qt移植到讯为rk3568,包含一些错误总结

qt移植到arm报错动态库找不到 error while loading shared libraries: libAlterManager.so.1: cannot open shared object file: No such file or directory 通过设置环境变量 LD_LIBRARY_PATH就行了。 LD_LIBRARY_PATH是一个用于指定动态链接器在运行时搜索共享库的路径的环…

Android Framework AMS(16)进程管理

该系列文章总纲链接:专题总纲目录 Android Framework 总纲 本章关键点总结 & 说明: 说明:本章节主要解读AMS 进程方面的知识。关注思维导图中左上侧部分即可。 我们本章节主要是对Android进程管理相关知识有一个基本的了解。先来了解下L…

(一)- DRM架构

一,DRM简介 linux内核中包含两类图形显示设备驱动框架: FB设备:Framebuffer图形显示框架; DRM:直接渲染管理器(Direct Rendering Manager),是linux目前主流的图形显示框架; 1&am…