二区5分纯生信|单细胞+非负矩阵+AlphaFold+机器学习组合

news2025/1/17 23:24:34

说在前面

学文不看刊

这篇分析总体来说工作量不算大,scRNA联合bulkRNA分析,多种机器学习组合预测模型,最后用了AlphaFold2预测蛋白及AutoDock分子对接

非常适合小白学习和模仿,其次在筛选出核心基因后可以再加几个外部数据集观察表达表征,单细胞层次也可再次进行验证,堆上工作量


今天给大家分享的一篇文章:Unveiling the molecular complexity of proliferative diabetic retinopathy through scRNA-seq, AlphaFold 2, and machine learning

  • 标题:通过 scRNA-seq、AlphaFold 2 和机器学习揭示增生性糖尿病视网膜病变的分子复杂性
  • 期刊名称:Frontiers in Endocrinology
  • 影响因子:5.2
  • JCR分区:Q1
  • 中科院分区:医学2区
  • 小类:内分泌学与代谢2区

摘要

背景: 增生性糖尿病视网膜病变(PDR)是失明的主要原因,其发病机制复杂。本研究整合单细胞 RNA 测序(scRNA-seq)、非负矩阵分解(NMF)、机器学习和 AlphaFold 2 方法,探索 PDR 的分子水平。

方法: 我们分析了 PDR 患者和健康对照者的 scRNA-seq 数据,以确定不同的细胞亚型和基因表达模式。NMF 用于定义 PDR 中的特定转录程序。利用 Meta-Program 1 中确定的氧化应激相关基因 (ORG),使用 12 种机器学习算法构建预测模型。此外,我们使用 AlphaFold 2 预测蛋白质结构,并辅以分子对接以验证潜在治疗靶点的结构基础。我们还分析了蛋白质-蛋白质相互作用 (PPI) 网络和关键 ORG 之间的相互作用。

结果: 我们的 scRNA-seq 分析显示 PDR 患者有五种主要细胞类型和 14 种亚细胞类型,与对照组相比,基因表达存在显著差异。我们确定了三个关键元程序,强调了小胶质细胞在 PDR 发病机制中的作用。确定了三个关键 ORG(ALKBH1PSIP1ATP13A2),其中表现最佳的预测模型表现出较高的准确度(训练队列中的 AUC 为 0.989,验证队列中的 AUC 为 0.833)。此外,AlphaFold 2 预测与分子对接相结合显示白藜芦醇对 ALKBH1 具有很强的亲和力,表明其具有作为靶向治疗剂的潜力。PPI 网络分析揭示了中心 ORG 与其他基因之间复杂的相互作用网络,表明其在 PDR 发病机制中发挥着集体作用。

结论: 本研究深入了解了 PDR 的细胞和分子方面,并使用先进的技术方法确定了潜在的生物标志物和治疗目标。

关键词: ALKBH1;AlphaFold 2;NMF;PPI;糖尿病视网膜病变;机器学习;氧化应激;单细胞分析。

结果


图 1增生性糖尿病视网膜病变 (PDR) 样本与正常样本的单细胞 RNA 测序分析比较。

  • (A) PDR 和正常样本的单细胞 RNA 测序数据的质量控制。
  • (B)高度变异基因的鉴定。前 2000 个变异基因显示为红点。
  • ©主成分分析。据此,我们将细胞组分为两类。主成分的 ElbowPlot (D)和 JackStrawPlot (E) 。
  • 不同组(F)、8 个样本(G)、26 个簇(H)、5 种主要细胞类型(I)和 14 种亚细胞类型(J)的 t 分布随机邻域嵌入(t-SNE) 分析。


图 2 PDR 中细胞间通讯和基因表达的详细分析。

  • (A、B)基于所涉及基因数量(A)和相互作用权重/强度(B)的五种主要细胞类型的细胞间通讯网络图。
  • (C-F)小胶质细胞和间充质细胞的基因表达分析。两种细胞类型中上调(C)和下调(D)基因。(E)间充质细胞中下调的基因,但小胶质细胞中上调的基因。(F)间充质细胞中上调的基因,但小胶质细胞中下调的基因。


图 3小胶质细胞中的 PDR 基因模块目录。

  • (A)热图展示了小胶质细胞中 PDR 基因模块之间重叠的重要性,确定了三个共识模块:元程序 1、元程序 2 和元程序 3。
  • (B)从 Gene Ontology 和 PathCards 数据库中识别出元程序 1 和氧化应激相关基因 (ORG) 交叉处的 15 个基因。


图 4机器学习衍生的预测模型的开发。

  • (A)训练和验证队列中机器学习算法组合的 AUC 结果。训练队列为 GSE160306,验证队列为 GSE102485。
  • (B)性能最高的模型中包含的三个中心 ORG 的描述。
  • (C)使用 AlphaFold 2 预测的三个中心 ORG 的蛋白质结构。


图 5白藜芦醇与 ALKBH1 的分子对接。

  • (A) ALKBH1 蛋白的三维结构。
  • (B) ALKBH1 蛋白与白藜芦醇之间的结合相互作用图。
  • (C)白藜芦醇与 ALKBH1 的分子对接的近距离视图,突出显示局部扩增细节。


图 6蛋白质-蛋白质相互作用 (PPI) 网络的构建及三个枢纽 ORG 的功能富集分析。

  • (A)基于与三个枢纽 ORG 密切相关的 50 个基因构建 PPI 网络。
  • (B)使用七种分析算法确定了 PPI 网络中的前十个枢纽基因。
  • © UpSet 图显示所有算法确定的重叠基因。


图 7三种关键 ORG 与阴性对照基因 PXDNL 在各种疾病条件下的相互作用。

  • 分析使用比较毒理基因组学数据库 (CTD;http://ctdbase.org/ ) 进行。三个枢纽 ORG 与(A)糖尿病视网膜病变、(B)视网膜疾病、©眼部疾病、(D)血管疾病、(E)糖尿病并发症和(F)糖尿病之间的推断分数以条形图显示。

小结

  • 主要数据及方法:
TypesNotes
分析数据scRNA:GSE165784;bulkRNA:GSE102485、GSE160306;氧化应激相关基因:Gene Ontology、PathCards
分析方法单细胞标准流程;小胶质细胞非负矩阵;机器学习组合ORG预测模型;AlphaFold2蛋白结构预测;AutoDock分子对接;PPI多算法网络拓扑分析;CTD评分可视化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1712592.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【最优化方法】实验四 约束最优化方法的MATLAB实现

实验的目的和要求:通过本次实验使学生较为熟练使用MATLAB软件,并能利用该软件进行约束最优化方法的计算。 实验内容: 1、罚函数法的MATLAB实现 2、可行方向法的MATLAB实现 学习建议: 本次实验就是要通…

抠像标签合并到原图,jpg 和 png合并,查看标签是否准确

抠像 原图 和 标签合并,查看抠像是否准确 合并后的图,是带有 羽化 效果的 import osimport cv2 import numpy as npdef apply_mask_with_feathering(original_image_path, mask_image_path):# 读取原图和mask图original_image cv2.imread(original_im…

一分钟教你学浪app视频怎么缓存

你是否在学浪app上苦苦寻找如何缓存视频的方法?你是否想快速、轻松地观看自己喜欢的视频内容?那么,让我们一起探索一分钟教你如何缓存学浪app视频的技巧吧! 学浪下载工具我已经打包好了,有需要的自己下载一下 学浪下…

豆瓣内容抓取:使用R、httr和XML库的完整教程

概述 在数据分析和统计领域,R语言以其强大的数据处理能力和丰富的包库资源而闻名。它不仅提供了一个灵活的编程环境,还拥有专门用于数据抓取和处理的工具,如httr和XML库。这些工具使得从各种网站上抓取数据变得简单而高效。 豆瓣网站作为一个…

Excel 单元格式 “万” 和 “亿” 展示

先看结果 实现方法: 将单元格式 格式设置为 [>999999]0!.00,,"亿";[>999]0!.0,"万";0 我这里设置的是大于 999 和 99万 生效对应的万和 亿 如果想要达到1万 和达到 1亿 才生效可以设置为如下 [>1000000000]0!.00,,"亿"…

RUST 和 GO 如何管理它们的内存

100编程书屋_孔夫子旧书网 Go 中的内存管理 Go 中的内存不会在缓存键被驱逐时立即释放。 相反,垃圾收集器会经常运行以发现任何没有引用的内存并释放它。 换句话说,内存会一直挂起,直到垃圾收集器可以评估它是否真正不再使用,而…

AI架构设计6:vLLM

训练大型语言模型以及微调的教程比比皆是,但关于在生产环境中部署它们并监控其活动的资料相对稀缺。上个章节提到了未来云原生的AI是趋势,然而涉及到云原生会比较偏技术。而在此之前为了解决大模型部署量产的问题,社区也一直在探索&#xff0…

OLED曲面屏手机跌下神坛,曲面边缘老化迅速,泛黄严重

在过去国产手机都喜欢将曲面屏用到旗舰手机上,借此凸显旗舰手机的优越性和独特性,然而在实际使用中,曲面屏的弊端日益明显,如今笔者就遭遇了这个问题。 因手上刚购买的天玑6080、骁龙4G2新机存在卡顿问题,使用很不爽&a…

面向链接预测的知识图谱表示学习方法综述

源自:软件学报 作者:杜雪盈, 刘名威, 沈立炜, 彭鑫 注:若出现无法显示完全的情况,可搜索“人工智能技术与咨询”查看完整文章 摘 要 作为人工智能的重要基石, 知识图谱能够从互联网海量数据中抽取并表达先验知识, 极大程度解决…

【数据结构】冒泡排序、直接插入排序、希尔排序详解!

文章目录 1. 冒泡排序🍎2. 直接插入排序🍎3. 希尔排序(缩小增量排序)🍎 1. 冒泡排序🍎 🐧 基本思想: 比较相邻的元素。如果第一个比第二个大,就交换他们两个。 大的数据…

【Python-基础】函数合集

def嵌套def 调用外部函数aa时,如果aa中没有调用内部函数bb,则bb函数不执行。 def aa():print("1")def bb():print("2")print("3")if __name__ "__main__":aa()未待完续…

LeetCode---链表

203. 移除链表元素 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 代码示例1:(直接使用原来的链表来进行移除节点操作) //时间复杂度: O(n) //空间复杂度: O(1) class Solu…

海博思创储能系统产品再获认可,获得杰出项目类别入围资格

近日,2024年欧洲智慧能源展览会大奖(The smarter E AWARD 2024)公布了入围名单,该奖项设有五个类别:光伏、储能、电动出行、智能综合能源和杰出项目奖,旨在表彰能源领域中的卓越创新成果。 在入围项目中&a…

基于STM32实现智能楼宇对讲系统

目录 引言环境准备智能楼宇对讲系统基础代码示例:实现智能楼宇对讲系统 音频输入和输出按键控制显示屏和用户界面网络通信应用场景:楼宇安防与智能家居问题解决方案与优化收尾与总结 1. 引言 本教程将详细介绍如何在STM32嵌入式系统中使用C语言实现智能…

菜鸟的JavaSE学习之旅7

这是一个目录 数组工具类Arrays数学工具类Math继承重写(Override)覆盖、覆写注意 构造方法super关键字用法this关键字super和this 抽象抽象方法和抽象类格式抽象方法和抽象类使用抽象方法和抽象类注意事项 数组工具类Arrays java.util.Arrays是一个与数…

手写promise、call、apply、debounce、throttle 等

1、promise 1.1 实现resolve和reject class MyPromise {// 构造方法constructor(executor) {// 初始化值this.initValue()// 初始化this指向this.initBind()try {// 执行传进来的函数executor(this.resolve, this.reject)} catch (e) {// 捕捉到错误直接执行rejectthis.rejec…

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

大型语言模型(llm)是在巨大的文本语料库上训练的,在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在培训结束时被“具体化”。在预训练结束时,模型实际上停止学习。 对模型进行对齐或进行…

【NumPy】全面解析arange函数:高效创建数值范围数组

🧑 博主简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向…

如何高效搜索?99%的人都不知道的搜索进阶小技巧

如何高效搜索任何你想要的信息? 比如怎么找第一手的行业研究报告? 在哪查高清无码的图片素材? 怎么搜最新的AI工具教程? 遇到以上问题你会怎么搜? 可能大部分人都是直接打开百度查关键词,虽然随便一搜…

2024年学浪课程下载工具

学浪下载工具我已经打包好了,有需要的自己下载一下 学浪下载器链接:百度网盘 请输入提取码 提取码:1234 --来自百度网盘超级会员V10的分享 1.首先解压好我给大家准备好的压缩包 2.打开解压好的文件夹里面的N_m3u8D文件夹,然…