7+单细胞+分型+机器学习,最近大热的生信思路,要拿分趁现在

news2024/10/6 6:49:11

今天给同学们分享一篇生信文章“Machine learning-based integration develops a neutrophil-derived signature for improving outcomes in hepatocellular carcinoma”,这篇文章发表在Front Immunol期刊上,影响因子为7.3。

0b7171f5c8054d9c163d7112e7303584.jpeg

结果解读:

单细胞的降维和聚类

经过质量控制措施和过滤,共获得17,277个细胞。为了降低维度并确定锚点,作者使用RunPCA方法进行了主成分分析(PCA)。此外,作者还使用Runt-SNE函数对17,277个细胞进行了t-分布随机邻域嵌入(t-SNE)分析。对于聚类分析,作者使用FindNeighbors和FindClusters函数,将分辨率设置为0.2,维度设置为20。结果发现了10个不同的亚群。细胞注释是使用已知标记基因进行的,其中亚群0、1、2和4分别表达T细胞标记基因CD2、CD3D、CD3E和CD3G。亚群6表达B细胞标记基因CD19、CD79A和MS4A1。亚群9表达树突状细胞标记基因CLEC4C,而亚群3、7和8分别表达中性粒细胞标记基因CSF3R、S100A8和S100A9。


图1A显示了一个t-SNE分布图,描述了不同的样本群体。图1B显示了一个t-SNE分布图,专门关注了10个亚群体。此外,图1C显示了一个带有注释的t-SNE分布图,突出显示了亚群体。为了在这些亚群体中识别标记基因,使用了FindAllMarkers函数,并设置了特定的参数,包括logFC为0.5和不同表达基因的最小百分比(Minpct)为0.35。这项分析得出了四个亚群体,其校正P值小于0.05。图1D显示了这些亚群体中前五个显著标记基因的表达情况。此外,对这四个亚群体的标记基因进行了KEGG注释。结果显示它们参与了各种功能和疾病病理过程,突显了免疫细胞在维持整体健康中的重要作用(图1E)。

e3a0519907cb63666ed552c8ab4a6158.jpeg


分子亚型的构建

在使用208个特异于中性粒细胞的标记物后,作者继续构建分子亚型。为了确定最佳的聚类数目,作者使用了累积分布函数(CDF)分析。CDF Delta面积曲线表明,选择3个聚类可以得到相对稳定的聚类结果(图2A、B)。因此,作者选择了“k”值为3来定义三个不同的分子亚型(图2C)。值得注意的是,这三个亚型在预后上显示出显著差异(图2D,P = 0.011),聚类3的患者预后最差。同样,当将相同的方法应用于HCCDB18数据集时,作者得到了三个具有可比较预后意义的亚型(图2E;P <0.0001)。关于这两个数据集的分子亚型的详细信息可以在tcga.subtype.cli.txt和HCCDB18.subtype.cli.txt表中找到。此外,作者基于特异于中性粒细胞的标记基因进行了主成分分析(PCA),生成了一个散点图,展示了三个亚型的分布情况,如图2F所示。作者的分析表明,肝细胞癌患者之间观察到的显著异质性可能归因于不同的“中性粒细胞特征”。"请不要解释我的原文。"

9d434dd3fb10b94533c225203f41fe41.jpeg


分子亚型的临床特征

此外,作者对TCGA数据集中不同分子亚型的临床和病理特征进行了全面分析。具体而言,作者比较了三种分子亚型之间各种临床特征的分布,以确定潜在差异。在作者的分析中,应用卡方检验时,作者发现聚类3样本中G3加G4期患者的比例较其他亚型更高。这一发现暗示了分子亚型与肿瘤分级之间的潜在关联(图3)。

f5010cfa492a577bb654b6a2003bb4c4.jpeg


免疫相关途径的功能分析在分子亚型之间

首先,作者使用ESTIMATE算法计算患者的免疫得分。比较结果显示,与预后不良相关的2和3类亚型表现出较高的免疫细胞得分(图4A)。随后,作者使用MCPcounter软件包计算了10种不同类型免疫细胞的得分。这些结果也表明,2和3类亚型显示出较高的免疫细胞得分(图4B)。此外,作者使用CIBERSORT方法计算了22种不同类型免疫细胞的得分。这项分析显示,在三个亚型中,大多数免疫细胞类型之间存在显著差异(图4C)。此外,作者对免疫检查点基因的表达水平进行了比较。除了TNFSF4和ICOSLG之外,大多数免疫检查点基因在三个亚型中的表达水平各不相同。值得注意的是,2和3类亚型显示出较高的免疫检查点基因表达水平(图4D)。总结起来,作者的综合分析表明,与预后不良相关的2号和3号亚型显示出更高水平的免疫浸润。

a3f8da07ec2eddb8e3144ce41c36ccfb.jpeg


分子亚型之间炎症途径的分析

作者使用TIDE在线工具来预测患者免疫逃避的可能性,其中较高的TIDE分数表示更显著的免疫逃避潜力。如图5A所示,与预后不良相关的2和3亚型显示出比亚型1更高的TIDE分数,表明更大的免疫逃避倾向。由于构建的分子亚型与免疫系统密切相关,作者从KEGG网站获取了与炎症相关的通路基因集,并使用ssGSEA方法计算了通路分数。如图5B所示,作者观察到亚型1的炎症通路分数明显较低,与其他亚型相比。

fbb9d88093aa0be998e561653b76b913.jpeg


KEGG通路分析的分子亚型

为了探索肝细胞癌(HCC)患者的异质性,作者从GSEA网站获取了与KEGG通路相关的基因集,并使用R软件包GSVA计算了每个患者的通路得分。通过分析这些得分,作者确定了在三种HCC亚型之间显示显著差异的多个通路,如图6A所示。作者将进一步的细节和分析结果总结在pathwy_p_fit.txt中。此外,作者对不同亚型之间的差异基因表达进行了比较,并使用R软件包clusterProfiler进行了GSEA分析。图6B-D显示了在不同HCC亚型中观察到的通路激活和抑制模式。总之,作者的研究结果表明,与中性粒细胞相关的标记基因有效区分了HCC患者的异质性。有趣的是,这些标记基因表明了不同HCC亚型患者中存在“中性粒细胞特征”。

c60da2c5e2dfb888960ec237e9a24a8b.jpeg


构建中性粒细胞衍生的特征,并研究RTN3在HCC中的作用

根据HCC患者中确定的“中性粒细胞特征”,作者进行了一项分析以确定与预后相关的基因。使用显著性水平为P <0.001的单变量Cox回归分析,作者确定了20个基因,如图7A所示。这些基因是基于中性粒细胞的标记基因,并从TCGA数据库中获取。为了开发一个一致的预后模型,作者使用基于机器学习的整合程序,将这20个确定的基因作为输入特征。具体而言,作者使用留一交叉验证(LOOCV)框架拟合了101个预测模型。作者计算了每个模型在所有验证数据集上的C-index,如图7B所示。最佳模型将CoxBoost和RSF结合起来,平均C-index最高,为0.671。

9e03825d5d17c051b9047af0f58d505a.jpeg


基于不同临床特征的风险评分比较

为了研究RiskScore与肿瘤的临床特征之间的关联,作者使用TCGA数据集进行了分析。作者的研究结果显示,临床分级与风险评分呈正相关(图8A、B)。此外,作者比较了不同临床分级下高风险评分和低风险评分的患者,并观察到临床分级较高的患者风险评分较高(图8C)。随后,作者进行了单变量和多变量Cox回归分析,以研究这些临床特征的预后意义,如图8D、E所示。结果表明,T分期(P <0.001)、分期(P <0.001)和RiskScore(P <0.001)均与预后相关,并作为独立的风险因素。然而,多变量Cox回归分析显示,只有RiskScore(P <0.001)与预后显著相关。此外,作者构建了一个包含RiskScore、T分期和分期的Nomogram。通过计算曲线下面积(AUC)值来评估其性能,发现其预测准确性与仅使用RiskScore相似(图8F)。这些发现表明,作者基于风险评分的模型对患者具有重要的预后价值。

088591c828acd44efd9f1523cc5b4ccb.jpeg


预测模型的突变特征

使用R语言maftools包,作者生成了一个瀑布图,显示了具有突变的前20个基因。数据显示高风险组的突变频率高于低风险组(图9A)。此外,作者对高风险组和低风险组进行了比较,检查了同源重组缺陷的分布(P <0.001),改变的比例(P <0.001),片段数(P <0.001)和肿瘤突变负荷(P <0.001)。如图9B所示,高风险组和低风险组之间的改变比例、片段数和肿瘤突变负荷存在显著差异。作者还获得了拷贝数变异(CNV)数据,并显示了构建风险模型所使用的10个基因的缺失和扩增比例(图9C)。

488635f79b2b0781af812f33801c677f.jpeg


预测模型的免疫特征

作者使用ssGSEA方法(图10A)进行了分析,以检查RiskScore与28种免疫细胞之间的相关性。值得注意的是,几种免疫细胞与RiskScore呈显著相关。为了对这些相关性进行可视化呈现,作者生成了散点图来描述12种免疫细胞与RiskScore之间的相关性(图10B)。此外,作者使用TIDE软件(可在http://tide.dfci.harvard.edu/上获得)来评估免疫治疗与作者的风险模型结合的潜在临床效果。较高的TIDE预测分数表示更大的免疫逃避可能性和减少从免疫治疗中获益的可能性。如图10C所示,高RiskScore的患者倾向于具有较高的TIDE预测分数,表明从免疫治疗中获益的可能性降低。此外,作者的分析发现,非响应组中高风险患者的比例较高,相比之下,响应组中高风险患者的比例较低(图10D)。值得注意的是,非响应组表现出较高的TIDE预测分数(图10E)。这些研究结果共同表明,作者基于风险评分的模型具有预测免疫治疗反应和识别可能无法获得实质性益处的患者的能力。

6e8c38764141bed1e729111d041a1ec0.jpeg


HCC潜在治疗药物的鉴定

为了确定具有更高药物敏感性的候选药物,作者采用了两种不同的方法,使用来自癌症治疗反应门户网站(CTRP)和混合物中的相对抑制(PRISM)数据的药物反应数据。首先,作者通过比较基于药理学评分(PPS)的前10%和后10%组进行了差异药物反应分析。这种分析使作者能够确定具有log2FC > 0.10的化合物,在高RiskScore组中表现出较低的AUC估计值。其次,作者在AUC值和RiskScore之间进行了Spearman相关性分析。作者选择显示负相关系数(CTRP和PRISM的Spearman's r分别为<-0.10和<-0.1)的化合物。两种方法的结果一致表明,所有确定的化合物在高RiskScore组中具有较低的AUC估计值,并且与RiskScore呈负相关(图11A,B)。

c086522c7d1316379c0d71d5e6aea398.jpeg


总结

本研究的主要目的是证明利用中性粒细胞基因特征对HCC患者进行有效分层。NDS的应用理论上在临床决策中更有效,因为它主要涉及常见表达的转录组基因。这种方法提供了具有成本效益和个性化的分子特征描述,以帮助制定有效的治疗策略和评估疾病进展。然而,这项研究有一定的局限性,需要加以考虑。首先,样本来源、数据预处理和分析方法的差异可能导致基因特征的变化,影响预测的稳定性和再现性。其次,基因特征模型依赖于基因表达水平的差异,可能会忽略其他类型的遗传变异、转录后修饰和其他可能影响预测的因素。对这篇文章的思路感兴趣的老师,欢迎咨询!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1321813.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GaN图腾柱无桥 Boost PFC(单相)九-EMI 滤波器容性电流影响分析

前言 为了防止 PFC 变换器中高频开关谐波对电网产生影响&#xff0c;同时抑制电网中的高频干扰对变换器运行的影响&#xff0c;一般通过在 PFC 变换器与交流电源之间加入EMI 滤波器消除共模干扰和差模干扰&#xff0c;使变换器满足相应的 EMI 标准。在基于GaN 功率器件的图腾柱…

A01、深入了解性能优化

1、常用性能评价/测试指标 1.1、响应时间 提交请求和返回该请求的响应时间之间使用的时间&#xff0c;一般比较关注平均响应时间。常用操作的响应时间列表&#xff1a; 操作响应时间打开一个站点几秒数据库查询一条记录&#xff08;有索引&#xff09;十几毫秒机械磁盘一次寻…

三菱PLC FX3U滑动平均值滤波

三菱PLC滑动平均值滤波其它相关写法,请参考下面文章链接: https://rxxw-control.blog.csdn.net/article/details/125044013https://rxxw-control.blog.csdn.net/article/details/125044013滑动平均值滤波程序总共分为三部分,第一步为:滑动采样。 第二步为:队列求和,第三…

坐标前后限制转点的坐标取值+网络流拆维拆点:agc031_e

https://vj.imken.moe/contest/598718#problem/J 观察到数据范围很小&#xff0c;但一个很重要的信息我们缺失了&#xff0c;就是珠宝的数量&#xff0c;所以我们考虑枚举珠宝的数量 k k k。 对于横纵坐标什么至多至少的限制&#xff0c;比如 a i a_i ai​ 前最多偷 b i b…

openwrt docker nginx 站点搭建

应为家里一直是 openwrt 软路由&#xff0c;这样以来也不用 重新买服务器了&#xff0c;就直接在 openwrt 上面跑个 nginx就行了。把自己的一些东西就可以放上面了。资源再利用哈哈&#xff1b; 先 ssh 连接上 openwrt &#xff1a;我这里的 openwrt 最近刚更新的固件&#xff…

confluence 备份与恢复

备份 confluence 每天会自动备份文件到 /var/atlassian/application-data/confluence/backups 新增定时任务&#xff0c;每天将备份的文件拷贝到远程服务器: crontab -l 0 0 3 * * ? sh /var/atlassian/application-data/confluence/backups/backup.sh#!/bin/shscp_linux_pa…

Ansys Speos SSS|传感器特性与EMVA1288标准以及Lumerical传感器验证

附件下载 联系工作人员获取附件 概述 本文是Speos Sensor System exporter&#xff08;SSS&#xff09;的使用指南&#xff0c;这是一个强大的解决方案&#xff0c;用于camera sensor模拟结果的后处理。本文介绍了一组实际示例&#xff0c;以演示该工具基于EMVA 1288标准从传…

鸿蒙OS:打破界限的操作系统新星

导言 鸿蒙OS&#xff08;HarmonyOS&#xff09;是华为公司为应对技术封锁而推出的分布式操作系统&#xff0c;其背后蕴含着华为构建全球数字生活愿景的雄心。本文将深入剖析鸿蒙OS的起源、核心特性&#xff0c;并展望其未来在数字生态中的角色。 1. 背景与起源 华为的…

Ubuntu 常用命令之 sed 命令用法介绍

sed是一个在Linux和其他Unix-like系统中常用的流编辑器&#xff0c;用于对输入流&#xff08;文件或管道&#xff09;进行基本的文本转换。它可以非常方便地进行文本替换、插入、删除等操作。 sed命令的基本格式为 sed [options] command file(s)其中&#xff0c;常用的参数有…

【回溯】【回文字符串】131.分割回文串

题目 法1&#xff1a;DFS双指针 必须掌握基础方法&#xff01; 注意&#xff1a;使用ArrayList删除尾元素比LinkedList要快很多&#xff01;&#xff01;&#xff01; class Solution {public List<List<String>> partition(String s) {List<List<String&…

2023/12 拜个师傅带你学算法写论文

文章目录 1. 自我介绍2. 你是否遇到如下问题3. 解决方案4. Tips5. 同学的学习历程&#xff08;每日更新&#xff09;2023/12/18 关注公众号&#xff1a;『AI学习星球』 算法学习、4对1辅导、论文辅导或核心期刊可以通过公众号或CSDN滴滴我 1. 自我介绍 本人是985大学计算机硕…

【AIGC重塑教育】AI大模型驱动的教育变革与实践

文章目录 &#x1f354;现状&#x1f6f8;解决方法✨为什么要使用ai&#x1f386;彩蛋 &#x1f354;现状 AI正迅猛地改变着我们的生活。根据高盛发布的一份报告&#xff0c;AI有可能取代3亿个全职工作岗位&#xff0c;影响全球18%的工作岗位。在欧美&#xff0c;或许四分之一…

天猫数据分析-天猫分析工具-天猫数据在哪里看-11月天猫宝宝辅食行业销售分析报告

随着居民可支配收入的增长&#xff0c;家长对宝宝健康的关注程度也随之上涨&#xff0c;尽管出生率下降&#xff0c;但越来越多的家长逐渐认可外购辅食的价值&#xff0c;因此辅食也逐渐“刚需化”&#xff0c;辅食市场也保持着较大的市场规模。 根据鲸参谋电商数据分析平台的相…

【MySQL】 表的操作

// 创建表 create table 表名();// 查看表结构 desc 表名;// 新增一列表信息 alter table 表名 add 字段名 字段类型 (after 原表某一字段名);// 删除一列表信息 alter table 表名 drop 字段名;// 修改表字段名字 alter table 表名 change 原字段名 新字段名 类型; // 新字…

Ubuntu安装ARM交叉编译器

Ubuntu安装交叉编译器 更新apt # 更新apt sudo apt update安装gcc sudo apt install build-essential查看gcc版本 gcc -v下载交叉编译工具 复制到用户目录 解压 tar -xvf gcc-linaro-5.5.0-2017.10-x86_64_arm-linux-gnueabihf.tar.xz移动到/opt/下 sudo ./gcc-linaro-5.…

分享一个好看的vs主题

最近发现了一个很好看的vs主题&#xff08;个人认为挺好看的&#xff09;&#xff0c;想要分享给大家。 主题的名字叫NightOwl&#xff0c;和vscode的主题颜色挺像的。操作方法也十分简单&#xff0c;首先我们先在最上面哪一行找到扩展。 然后点击管理扩展&#xff0c;再搜索栏…

机器学习——支持向量机

目录 一、基于最大间隔分隔数据 二、寻找最大间隔 1. 最大间隔 2. 拉格朗日乘子法 3. 对偶问题 三、SMO高效优化算法 四、软间隔 五、SMO算法实现 1. 简化版SMO算法 2. 完整版SMO算法 3. 可视化决策结果 六、核函数 1. 线性不可分——高维可分 2. 核函数 …

【Proteus仿真】【Arduino单片机】视力保护仪

文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真Arduino单片机控制器&#xff0c;使LCD1602液晶&#xff0c;DS18B20温度传感器、按键、蜂鸣器、继电器开关、HC05蓝牙模块等。 主要功能&#xff1a; 系统运行后&#xff0c;LCD16…

读书心得(表达式与基本语句篇)

内容取自《高质量C/C编程指南》 读者可能怀疑&#xff1a;连 if、for、while、goto、switch 这样简单的东西也要探讨编程风格&#xff0c;是不是小题大做&#xff1f;我真的发觉很多程序员用隐含错误的方式写表达式和基本语句&#xff0c;我自己也犯过类似的错误。表达式和语句…

共同编辑文档功能实现(websocket)

目录 前言 websocket封装 wangeditor下载 共同编辑文档代码实现 HTML样式部分 JS部分 css部分 前言 功能&#xff1a;实现文档共同编辑功能&#xff0c;可以实时接收到其他人的信息 思路&#xff1a;先调用接口获取相应的数据进行渲染&#xff0c;然后通过webSocket建…