5+非肿瘤分析,分型+WGCNA+机器学习筛选相关基因

news2024/10/7 4:36:35
今天给同学们分享一篇非肿瘤+分型+机器学习+WGCNA+实验的生信文章“Identification of diagnostic markers related to oxidative stress and inflammatory response in diabetic kidney disease by machine learning algorithms: Evidence from human transcriptomic data and mouse experiments”,这篇文章于2023年3月7日发表在Front Endocrinol (Lausanne)期刊上,影响因子为5.2。
ca68a4128afd3bd534580851fc652ceb.jpeg

糖尿病肾病(DKD)是糖尿病的长期并发症,引起肾脏微血管病变。它也是终末期肾脏疾病(ESRD)的主要原因之一,其病理生理过程复杂。及时预防和治疗对延缓DKD的发展具有重要意义。本研究旨在利用生物信息学分析找到可能成为DKD治疗靶点的关键诊断标志物。


1. 数据处理

 作者从GEO数据库下载了七个数据集,共计214个样本,并使用“sva” R软件包的“ComBat”函数去除来自不同来源的数据的批次效应。PCA图表显示了在去除批次效应之前和之后的数据分布(分别为图1A、B),结果表明批次效应已经得到有效纠正。在合并数据后,可以准确区分DKD和正常样本(图1C)。使用“limma” R软件包进行差异分析, 作者鉴定出共计772个差异表达基因(其中381个上调,391个下调),如火山图所示(图1D)。接下来, 作者对差异基因进行ORA富集分析。从圆形网络图中可以看出,这些基因富集在“炎症反应”、“上皮间质转化”、“凋亡”和“TNFA信号通路通过NFKB”等途径中(图1E)。TreeMap显示,上调基因主要参与免疫激活、T细胞激活和细胞黏附等生物过程,而下调基因主要富集在与代谢调节相关的生物功能中(图1F)。这些发现通过Kyoto Encyclopedia of Genes and Genomes (KEGG)通路富集分析得到了相应的验证(图1G)。

41cff33674ce645f86c086f280c25934.jpeg

图1 糖尿病肾病(DKD)的差异表达基因(DEG)鉴定和富集分析


2. DKD的不同亚组的鉴定

首先, 作者将氧化应激和炎症反应相关基因(OS Infla)与先前获得的差异表达基因(DEGs)进行交叉,并获得了84个差异表达的氧化应激和炎症反应相关基因(DEOIGs)(图2A)。接下来, 作者使用R软件包“ConsensusClusterPlus”根据这84个DEOIGs将DKD患者分为不同的亚组。当一致性矩阵k值为2时,DKD样本之间的交叉最小,符合选择标准(图2B-E)。因此,113个DKD样本被分为两个明显的聚类,即DKD亚型1和2(分别为C1和C2)。热图显示大多数DEOIGs在C1亚型中上调,在C2亚型和正常样本中下调(图2F)。GSEA富集分析表明,C1亚型富集了细胞外基质受体相互作用,而C2亚型富集了代谢途径(图2G)。 作者量化了不同免疫细胞亚群的ssGSEA富集分数,以用于研究DKD亚型与免疫细胞之间的关系。结果表明,C1亚型在更多与免疫相关的细胞中富集,如调节性T细胞、巨噬细胞、活化的B细胞和浆细胞样树突状细胞。然后, 作者通过查阅文献并使用ssGSEA分析量化结果,找到了近年来与DKD密切相关的通路。山地图显示了两个亚型和正常样本的通路ssGSEA得分,揭示了Wnt、Notch和凋亡通路在C1亚型中较高,而过氧化物酶活化受体(PPAR)、过氧化物酶体、哺乳动物雷帕霉素靶蛋白(mTOR)、自噬、AMPK和其他通路在C1亚型中较低(图2H)。

a8cefb49cd382eca543ad6246bbc252b.jpeg

图2 DKD亚型的鉴定


3. 构建WGCNA并识别关键模块

 作者使用了来自七个不同数据集的113个DKD样本,使用中位数绝对偏差对前5000个基因进行了WGCNA分析的筛选。随后, 作者根据尺度自由拟合指数和不同软阈值幂的平均连接度,基于尺度自由R2进行了评估。 作者的研究选择了软阈值幂β = 6和尺度自由R2 = 0.8744133来构建一个标准的尺度自由网络,使用Pick Soft Threshold函数(图3A)。最终, 作者确定了六个模块(图3B)。 作者使用相关热图来探索每个模块与糖尿病肾病的相关性,发现MEblue模块与C1和C2亚型的相关性最高(图3C)。基因重要性评分被用来分析基因与DKD亚型之间的关联,结果显示MEblue模块具有最高的基因重要性评分(图3D)。相关散点图进一步证明了MEblue模块中的基因不仅与MEblue模块强相关,而且与糖尿病肾病亚型显著相关(图3E)。因此, 作者提取了MEblue模块中的基因进行后续分析。

38a4199ccfbe271366761be4a3f6ee32.jpeg

图3 加权基因共表达网络分析(WGCNA)


4. 糖尿病肾病的诊断标志物鉴定

&nbsp;作者通过对糖尿病肾病的两个亚型进行差异分析,获得了473个差异基因(|log2FC| > 1,padj < 0.05)。Venn图显示,在与MEblue模块中的1458个基因相交后,发现了347个相交基因。使用STRING在线网络工具构建了上述347个基因的PPI网络图,并在Cytoscape软件中进行了分析。使用Upset图选择满足CytoHubba插件的12种算法的相交基因,最终获得了279个基因(附图4)。基于这279个基因,&nbsp;作者进一步使用不同的生物信息学方法筛选出诊断标志物。使用LASSO回归算法,挑选出了12个潜在生物标志物(图4A、B)。随机森林(RF)算法确定了15个候选基因(图4C、D)。SVM-RFE算法显示,当特征基因数为64时,准确率最高达到0.956(图4E)。最终,&nbsp;作者获得了四个基因作为DKD的诊断标志物(图4F)。

e22e4e44dbea78ef1e128e64a6f9024d.jpeg

图4 诊断标记物的鉴定


5.&nbsp;四个诊断标志物的诊断价值和验证

箱线图显示了在七个合并的GEO数据集中四个标志基因的表达情况(图5A)。可以看出,DKD样本中四个基因的表达高于正常样本。Nephroseq v5在线数据库中的样本也验证了它们的高表达(图5B),表明它们在DKD的发生和发展过程中可能起到重要作用。在合并的GEO数据集中,当将所有四个基因作为一个变量进行拟合时,ROC曲线下面积(AUC)为0.808,比单独使用它们作为诊断变量时获得了更好的结果(图5C)。&nbsp;作者还评估了这四个基因在来自GSE142025数据集的独立患者队列中的诊断效能。每个基因的ROC曲线下面积(AUC)值都大于0.8,表明这四个基因可以诊断DKD(图5D)。相关分析显示,四个基因的表达与肌酐呈正相关(图5E),与肾小球滤过率呈负相关(图5F)。

300d4626a0490fe565b2cfd784af0544.jpeg

图5 诊断效能和诊断标志物的外部验证


6.&nbsp;基于特征基因的DKD诊断模型的Nomogram构建

基于四个诊断标志物的表达,&nbsp;作者基于逻辑回归构建了一个诊断模型,并绘制了一个图表(图6A)。在这个图表中,参与构建诊断模型的每个基因对应一个分数,它们的分数相加得到一个总分,该总分对应不同的DKD诊断效果。校准曲线显示该图表能可靠地诊断DKD(图6B)。ROC曲线表明该模型的AUC值为0.801(图6C)。DCA结果通过四个单独的基因或它们的组合来评估DKD患者的结果,显示了净效益(NB)。结果表明,组合的图表模型能显著增加净效益(图6D)。

242fbe51baca3379b89a91b00629c41e.jpeg

图6 DKD诊断模型的构建


7.&nbsp;诊断标志物的功能富集分析

为了探索与诊断标志物相关的生物过程,&nbsp;作者分析了这四个诊断标志物与免疫细胞的相关性。结果表明,它们与大多数免疫细胞浸润呈正相关(图7A),如活化的CD4 T细胞、活化的树突状细胞、调节性T细胞、巨噬细胞等。接下来,&nbsp;作者根据基因表达将DKD样本分为高表达组和低表达组。对高表达组和低表达组中的差异表达基因进行GSEA分析,以探索可能涉及的信号通路,结果发现这四个基因的通路富集是一致的。因此,它们在TNFA SIGNALING VIA NFKB、KRAS SIGNALING UP、INTERFERON GAMMA RESPONSE、INFLAMMATORY RESPONSE、EPITHELIAL MESENCHYMAL TRANSITION等方面均显著富集(图7B)。功能富集分析显示,这四个基因的高表达组均富集在ADAPTIVE IMMUNE RESPONSE、T CELL ACTIVATION、IMMUNE RESPONSE REGULATING CELL SURFACE RECEPTOR SIGNALING PATHWAY等方面。低表达组在生物过程中富集了一些如SMALL MOLECULE CATABOLIC PROCESS、FATTY ACID CATABOLIC PROCESS、INNER MITOCHONDRIAL MEMBRANE PROTEIN COMPLEX等的过程(图7C)。

22cb5a92c8056daaae4ebc6905e4bdd3.jpeg

图7 诊断标志物的生物学功能富集


8.&nbsp;动物模型中的验证

为了进一步验证这四个标志物在早期DKD诊断中的诊断价值,&nbsp;作者利用12周龄的db/db小鼠作为自发性DKD模型。&nbsp;作者发现,与正常对照组小鼠相比,DKD组小鼠的体重、血糖、HbA1c、血清肌酐、血尿素氮和尿白蛋白/肌酐水平显著增加(图8A)。病理染色还显示DKD组小鼠的肾组织中有系膜细胞增生、系膜基质扩张以及肾小球和肾小管基底膜不规则增厚(图8B),表明自发性DKD模型已成功建立。接下来,&nbsp;作者检测了四个生物标志物(包括TNC、PXDN、TIMP1和TPM1)的mRNA表达水平。结果显示,TNC、TPM1和PXDN在小鼠模型中显著升高。不幸的是,TIMP1呈上升趋势,两组之间没有差异(图8C)。&nbsp;作者还检测了小鼠血液和尿液中的四个生物标志物中的三种分泌蛋白。结果显示,TNC和PXDN在血液和尿液中持续升高,而TIMP1在尿液中显著升高,但在血液中没有显著差异(图8D)。相关分析显示,无论是血液样本还是尿液样本,这些标志物与尿白蛋白/肌酐比值明显呈正相关。至于血糖和HbAc1,这些标志物与它们之间没有显著相关性。免疫组化结果显示,TNC、TPM1、TIMP1和PXDN的表达水平在DKD小鼠模型中升高(图8E)。为了进一步验证上述变化与DKD而不是糖尿病有关,&nbsp;作者的研究还添加了两组6周龄的db/db小鼠和正常小鼠。&nbsp;作者发现,与正常对照小鼠相比,DM小鼠的体重、血糖和HbA1c显著增加,但两组小鼠的血清肌酐、血尿素氮和尿白蛋白/肌酐水平之间没有差异。同时,在肾脏病理染色中没有发现显著差异。qRT-PCR的结果显示,TPM1和TIMP1的mRNA表达水平在两组之间没有统计学差异。TNC和PXDN的表达在DM组中增加。此外,检测了DM组小鼠的血液和尿液样本中三种分泌蛋白的表达水平,并发现只有血液样本中的TNC在DM小鼠中显著增加。对于尿液样本,DM小鼠中的TNC和TIMP1的升高存在显著差异。

bee9a632782d6b438298fe01402d208e.jpeg

图8 动物实验中诊断标志物的验证


总结

总之,&nbsp;作者通过全面系统的生物信息学分析和实验验证,确定了TNC、PXDN、TIMP1和TPM1作为DKD的潜在诊断标志物,并建立了一个包含这四个诊断标志物的图表,并初步探讨了它们在DKD的发生和发展中可能的生物学功能。这些发现将为DKD的早期诊断和治疗提供新的思路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1089676.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# U2Net Portrait 跨界肖像画

效果 项目 下载 可执行文件exe下载 源码下载

【环境】Ubuntu20.04 安装 Anaconda 顺顺利利

ubuntu里面安装的Anaconda也是顺顺利利 别忘了source source一下 参考链接 中间遇到了一个问题&#xff0c;用下面的链接轻松解决了 关于修改anaconda安装路径的问题

RT-Thread MQTT(学习)

MQTT背景应用 MQTT是机器对机器&#xff08;M2M&#xff09;/物联网&#xff08;IoT&#xff09;连接协议&#xff0c;英文全名为“Message Queuing Telemetry Transport”&#xff0c;“消息队列遥测传输”协议。它是专为受限设备和低带宽、高延迟或不可靠的网络而设计的&…

基于SpringBoot的社区团购系统

基于SpringBoot的社区团购系统的设计与实现 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBootMyBatisVue工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 【主要功能】 角色&#xff1a;用户、管理员管理员&#xff1a;登录、个人中心、用户管理、…

【aloam】ubuntu20.04 配置 aloam 环境,编译过程报错及成功解决方法

为什么写这篇博客 ALOAM是slamer的必经之路&#xff0c;official提供的基础环境推荐ubuntu16.04或者18.04&#xff0c;而我用20.04已经有一段时间了&#xff0c;不方便换&#xff0c;但由于其他原因也不得不去配置。过程中出现了几个问题&#xff0c;在这里也就20分钟&#xf…

【网安专题10.11】软件安全+安全代码大模型

软件安全安全代码大模型 写在最前面一些启发科研方法科研思路 课程考察要求软件供应链安全漏洞复制1、代码克隆2、组件依赖分析 关键组件安全不足&#xff0c;漏洞指数级放大供应链投毒内部攻击源代码攻击分发、下载网站攻击更新、补丁网站攻击 形成技术壁垒&#xff08;找方向…

链表——单链表的简单介绍

前提须知&#xff1a; 顺序表的简单介绍_明 日 香的博客-CSDN博客 顺序表的缺点&#xff1a; 从之前的博客中&#xff0c;我们得知&#xff0c;顺序表的本质实际上是一种数组。而数组的最大特征就是连续的空间。也因此&#xff0c;在线性表中&#xff0c;顺序表是一种物理上…

[每周一更]-(第67期):docker-compose 部署php的laravel项目

容器化部署laravel框架的php项目 操作步骤 参考&#xff1a; https://www.cnblogs.com/jingjingxyk/p/16842937.htmlhttps://developer.aliyun.com/article/708976 0、plv项目修改 composer install.env 修改后台地址 IP:端口chmod -R 777 public / chmod -R 777 storagevi…

ELK下载(Elasticsearch、Logstash、Kibana)

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。 每个人都有惰性&#xff0c;但不断学习是好好生活的根本&#xff0c;共勉&#xff01; 文章均为学习整理笔记&#xff0c;分享记录为主&#xff0c;如有错误请指正&#xff0c;共同学习进步。…

Simple RPC - 01 框架原理及总体架构初探

文章目录 概述RPC 框架是怎么调用远程服务的&#xff1f;客户端侧的逻辑服务端侧的逻辑完整流程 客户端是如何找到服务端地址的呢&#xff1f;核心&#xff1a;NamingService跨语言的RPC实现原理 RPC 框架的总体结构对外接口服务注册中心如何使用业务服务接口客户端服务端 模块…

【数据结构】:栈的实现

1 栈 1.1栈的概念及结构 栈&#xff1a;一种特殊的线性表&#xff0c;其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶&#xff0c;另一端称为栈底。栈中的数据元素遵守后进先出LIFO&#xff08;Last In First Out&#xff09;的原则 压栈…

Linux实现原理 — I/O 处理流程与优化手段

Linux I/O 接口 Linux I/O 接口可以分为以下几种类型&#xff1a; 文件 I/O 接口&#xff1a;用于对文件进行读写操作的接口&#xff0c;包括 open()、read()、write()、close()、lseek() 等。 网络 I/O 接口&#xff1a;用于网络通信的接口&#xff0c;包括 socket()、conne…

多目标鳟海鞘算法(Multi-objective Salp Swarm Algorithm,MSSA)求解微电网优化MATLAB

一、微网系统运行优化模型 微电网优化模型介绍&#xff1a; 微电网多目标优化调度模型简介_IT猿手的博客-CSDN博客 参考文献&#xff1a; [1]李兴莘,张靖,何宇,等.基于改进粒子群算法的微电网多目标优化调度[J].电力科学与工程, 2021, 37(3):7 二、多目标鳟海鞘算法MSSA 多…

Go持续改进与代码审查

通过Golang提高软件质量 在快节奏的软件开发世界中&#xff0c;保持领先至关重要。在实现软件工程卓越的基石之一是持续改进的实践&#xff0c;而在这个旅程中的一个关键工具是代码审查过程。在本文中&#xff0c;我们将深入探讨持续改进的重要性&#xff0c;并探讨代码审查在…

【数据结构-字符串 三】【栈的应用】字符串解码

废话不多说&#xff0c;喊一句号子鼓励自己&#xff1a;程序员永不失业&#xff0c;程序员走向架构&#xff01;本篇Blog的主题是【字符串转换】&#xff0c;使用【字符串】这个基本的数据结构来实现&#xff0c;这个高频题的站点是&#xff1a;CodeTop&#xff0c;筛选条件为&…

Android位置服务和应用权限

Github:https://github.com/MADMAX110/Odometer 一、使用位置服务 之前的Odometer应用是显示一个随机数&#xff0c;现在要使用Android的位置服务返回走过的距离。 修改getDiatance方法使其返回走过的距离&#xff0c;为此要用Android的位置服务。这些服务允许你得到用户的当…

当10年程序员是什么体验?存款几位数?

最近网上一个话题吸引了许多人的讨论&#xff0c;当10年程序员&#xff0c;是一种什么体验&#xff1f; 都说程序员的高收入和工作年限应该成正比&#xff0c;真的是这样吗&#xff1f;工作10年的程序员&#xff0c;工资应该是什么水平&#xff1f;不少网友纷纷“现身说法”..…

qt中json类

目录 QJsonValue QJsonObject QJsonArray QJsonDocument 案例&#xff1a; Qt 5.0开始提供了对Json的支持&#xff0c;我们可以直接使用Qt提供的Json类进行数据的组织和解析&#xff0c;下面介绍4个常用的类。 QJsonValue 该类封装了JSON支持的数据类型。 布尔类型&#xf…

希尔贝壳受邀参加《人工智能开发平台通用能力要求 第4部分:大模型技术要求》标准第一次研讨会

随着大模型技术与经验的不断累积&#xff0c;该方向也逐渐从聚焦技术突破&#xff0c;到关注开发、部署、应用的全流程工程化落地。为完善人工智能平台标准体系建设&#xff0c;满足产业多样化需求&#xff0c;2023年9月7日&#xff0c;中国信通院云大所在线上召开《人工智能开…

C# Thread.Sleep(0)有什么用?

一、理论分析 回答这个要先从线程时间精度&#xff08;时间片&#xff09;开始说起。很多参考书说&#xff0c;默认情况下&#xff0c;时间片为15ms 左右&#xff0c;但是这是已经过时的知识。在老的 Windows 操作系统里&#xff0c;应用程序模式时时间片 15ms 左右&#xff0…