说在前面
学文不看刊
这篇分析总体来说工作量不算大,scRNA联合bulkRNA分析,多种机器学习组合预测模型,最后用了AlphaFold2预测蛋白及AutoDock分子对接
非常适合小白学习和模仿,其次在筛选出核心基因后可以再加几个外部数据集观察表达表征,单细胞层次也可再次进行验证,堆上工作量
今天给大家分享的一篇文章:Unveiling the molecular complexity of proliferative diabetic retinopathy through scRNA-seq, AlphaFold 2, and machine learning
- 标题:通过 scRNA-seq、AlphaFold 2 和机器学习揭示增生性糖尿病视网膜病变的分子复杂性
- 期刊名称:Frontiers in Endocrinology
- 影响因子:5.2
- JCR分区:Q1
- 中科院分区:医学2区
- 小类:内分泌学与代谢2区
摘要
背景: 增生性糖尿病视网膜病变(PDR
)是失明的主要原因,其发病机制复杂。本研究整合单细胞 RNA 测序(scRNA-seq
)、非负矩阵分解(NMF
)、机器学习和 AlphaFold 2 方法,探索 PDR 的分子水平。
方法: 我们分析了 PDR 患者和健康对照者的 scRNA-seq 数据,以确定不同的细胞亚型和基因表达模式。NMF 用于定义 PDR 中的特定转录程序。利用 Meta-Program 1 中确定的氧化应激相关基因 (ORG
),使用 12 种机器学习算法构建预测模型。此外,我们使用 AlphaFold 2 预测蛋白质结构,并辅以分子对接以验证潜在治疗靶点的结构基础。我们还分析了蛋白质-蛋白质相互作用 (PPI
) 网络和关键 ORG 之间的相互作用。
结果: 我们的 scRNA-seq 分析显示 PDR 患者有五种主要细胞类型和 14 种亚细胞类型,与对照组相比,基因表达存在显著差异。我们确定了三个关键元程序,强调了小胶质细胞在 PDR 发病机制中的作用。确定了三个关键 ORG(ALKBH1
、PSIP1
和 ATP13A2
),其中表现最佳的预测模型表现出较高的准确度(训练队列中的 AUC 为 0.989,验证队列中的 AUC 为 0.833)。此外,AlphaFold 2 预测与分子对接相结合显示白藜芦醇对 ALKBH1 具有很强的亲和力,表明其具有作为靶向治疗剂的潜力。PPI 网络分析揭示了中心 ORG 与其他基因之间复杂的相互作用网络,表明其在 PDR 发病机制中发挥着集体作用。
结论: 本研究深入了解了 PDR 的细胞和分子方面,并使用先进的技术方法确定了潜在的生物标志物和治疗目标。
关键词: ALKBH1;AlphaFold 2;NMF;PPI;糖尿病视网膜病变;机器学习;氧化应激;单细胞分析。
结果
图 1增生性糖尿病视网膜病变 (PDR) 样本与正常样本的单细胞 RNA 测序分析比较。
- (A) PDR 和正常样本的单细胞 RNA 测序数据的质量控制。
- (B)高度变异基因的鉴定。前 2000 个变异基因显示为红点。
- ©主成分分析。据此,我们将细胞组分为两类。主成分的 ElbowPlot (D)和 JackStrawPlot (E) 。
- 不同组(F)、8 个样本(G)、26 个簇(H)、5 种主要细胞类型(I)和 14 种亚细胞类型(J)的 t 分布随机邻域嵌入(t-SNE) 分析。
图 2 PDR 中细胞间通讯和基因表达的详细分析。
- (A、B)基于所涉及基因数量(A)和相互作用权重/强度(B)的五种主要细胞类型的细胞间通讯网络图。
- (C-F)小胶质细胞和间充质细胞的基因表达分析。两种细胞类型中上调(C)和下调(D)基因。(E)间充质细胞中下调的基因,但小胶质细胞中上调的基因。(F)间充质细胞中上调的基因,但小胶质细胞中下调的基因。
图 3小胶质细胞中的 PDR 基因模块目录。
- (A)热图展示了小胶质细胞中 PDR 基因模块之间重叠的重要性,确定了三个共识模块:元程序 1、元程序 2 和元程序 3。
- (B)从 Gene Ontology 和 PathCards 数据库中识别出元程序 1 和氧化应激相关基因 (ORG) 交叉处的 15 个基因。
图 4机器学习衍生的预测模型的开发。
- (A)训练和验证队列中机器学习算法组合的 AUC 结果。训练队列为 GSE160306,验证队列为 GSE102485。
- (B)性能最高的模型中包含的三个中心 ORG 的描述。
- (C)使用 AlphaFold 2 预测的三个中心 ORG 的蛋白质结构。
图 5白藜芦醇与 ALKBH1 的分子对接。
- (A) ALKBH1 蛋白的三维结构。
- (B) ALKBH1 蛋白与白藜芦醇之间的结合相互作用图。
- (C)白藜芦醇与 ALKBH1 的分子对接的近距离视图,突出显示局部扩增细节。
图 6蛋白质-蛋白质相互作用 (PPI) 网络的构建及三个枢纽 ORG 的功能富集分析。
- (A)基于与三个枢纽 ORG 密切相关的 50 个基因构建 PPI 网络。
- (B)使用七种分析算法确定了 PPI 网络中的前十个枢纽基因。
- © UpSet 图显示所有算法确定的重叠基因。
图 7三种关键 ORG 与阴性对照基因 PXDNL 在各种疾病条件下的相互作用。
- 分析使用比较毒理基因组学数据库 (CTD;http://ctdbase.org/ ) 进行。三个枢纽 ORG 与(A)糖尿病视网膜病变、(B)视网膜疾病、©眼部疾病、(D)血管疾病、(E)糖尿病并发症和(F)糖尿病之间的推断分数以条形图显示。
小结
- 主要数据及方法:
Types | Notes |
---|---|
分析数据 | scRNA:GSE165784;bulkRNA:GSE102485、GSE160306;氧化应激相关基因:Gene Ontology、PathCards |
分析方法 | 单细胞标准流程;小胶质细胞非负矩阵;机器学习组合ORG预测模型;AlphaFold2蛋白结构预测;AutoDock分子对接;PPI多算法网络拓扑分析;CTD评分可视化 |