今天给同学们分享一篇生信文章“Identification of biomarkers for the diagnosis of chronic kidney disease (CKD) with non-alcoholic fatty liver disease (NAFLD) by bioinformatics analysis and machine learning”,这篇文章发表在Front Endocrinol (Lausanne)期刊上,影响因子为5.2。
结果解读:
通过WGCNA鉴定了NAFLD样本中的关键模块基因
GSE89632是一個代表性的數據集,用於研究NAFLD,我們使用它來獲取與NAFLD最相關的模塊基因。首先,我們使用WGCNA來識別與NAFLD最相關的模塊基因。基於尺度獨立性和平均連接性,我們選擇β = 26作為软阈值(圖2A)。然後,我們選擇不同的顏色來表示9個基因共表達模塊(GCMs),如圖2B所示。NAFLD樣本與GCMs之間的相關性如圖2C所示,而被認為是關鍵模塊的深青色模塊(412個基因)與NAFLD樣本之間的相關性最高(相關係數= -0.85,p = 5.3e-19)。此外,在NAFLD樣本的深青色模塊中觀察到模塊成員質量和基因重要性之間的顯著正相關(r = 0.68,p = 4.2e-57),如圖2D所示。
CKD和NAFLD之间的NAFLD相关交集基因的鉴定
接下来,在GSE104954数据集中找到了386个差异表达基因(DEGs),其中227个上调,159个下调。图3A展示了差异表达基因的火山图。图3B绘制了数据集中前50个最显著的差异表达基因的热图。然后,将386个DEGs和412个模块基因进行交集运算,最终得到了45个与非酒精性脂肪肝相关的共享基因,如图3C的维恩图所示。
45个与非酒精性脂肪肝相关的共享基因的富集分析
为了探索NAFLD相关共享基因在CKD发展中的生物功能和途径,对45个共享基因进行了GO和KEGG富集分析。共获得563个显著相关的生物过程和23个KEGG信号通路(详细结果请参见补充材料S2)。对共享基因进行GO分析以揭示其生物功能(图4A-C)。正如作者所见,在GO类别中,大多数共享基因主要涉及“程序性细胞死亡”、“炎症反应”、“代谢过程的正调控”和“免疫系统过程”(BP);“细胞外基质”、“含胶原的细胞外基质”(CC);“DNA结合转录激活因子活性,RNA聚合酶II特异性”、“DNA结合转录因子活性”等(MF)。KEGG通路富集结果显示,最常涉及的通路是IL-17信号通路、TNF信号通路、MAPK信号通路、凋亡、Toll样受体信号通路等,这些通路与免疫反应和炎症密切相关(图4D)。
通过Cytoscape和机器学习鉴定与NAFLD相关的关键基因,并验证它们的差异表达
根据STRING数据库构建了共享基因的蛋白质相互作用网络,以揭示每个蛋白质的相互作用。图5A中有38条边和45个节点,随后使用Cytoscape软件进行分析。MCODE插件用于发现PPI网络中的重要模块,结果显示图5B中的两个亚型中有8个关键基因紧密相连,作为重要模块。另一方面,图5C中通过随机森林算法确定了7个MeanDecreaseGini> 1.5的关键基因。图5D中的Venn图显示了4个关键基因(DUSP1,FOSB,NR4A1,ZFP36)的交集,它们被用作与非酒精性脂肪肝相关的关键基因。此外,在另外两个CKD数据集(GSE32591,GSE66494)中,这4个与非酒精性脂肪肝相关的基因明显下调(图6A,B),与GSE104954的变化一致。
使用ROC曲线评估CKD和NAFLD的诊断效能
4个与NAFLD相关的基因(DUSP1、FOSB、NR4A1、ZFP36)在训练集GSE104954中的ROC曲线下的AUC分别为0.961、0.954、0.866和0.960(图7A)。同时,在验证集GSE32591中,这些关键基因的AUC分别为0.828、0.796、0.927和0.689,无法区分样本的来源是肾小球还是肾小管间质(图7B)。同时,在另一个验证集GSE66494中,关键基因的AUC分别为0.958、1.000、0.889和0.932(图7C)。综合分析验证集和训练集的结果表明,这4个与NAFLD相关的基因可以作为CKD诊断的有效标志物。
免疫浸润分析和相关性分析
根据富集分析的结果,与NAFLD相关的共享基因可能参与CKD进展的免疫相关机制。因此,进一步探索4个诊断标志基因与CKD中免疫细胞浸润之间的相关性是值得关注的。首先,使用CIBERSORTx评估GSE104954数据集中22种免疫细胞的比例(图8A)。在CKD样本中,记忆B细胞、M1巨噬细胞、静息肥大细胞和γδT细胞的水平显著上调;然而,幼稚B细胞、调节性T细胞和活化肥大细胞的水平显著下调。接下来,探索了四个诊断标志基因与CKD免疫细胞的相关性(图8B)。FOSB表达与幼稚B细胞、调节性T细胞和活化肥大细胞的比例呈正相关,与静息肥大细胞、γδT细胞、M0巨噬细胞和M1巨噬细胞呈负相关。ZFP36和DUSP1与调节性T细胞和静息NK细胞的比例呈负相关。NR4A1与B细胞初生、静止树突状细胞和激活肥大细胞的比率呈正相关,与静止肥大细胞、M1巨噬细胞和B细胞记忆呈负相关。在探索四个诊断标志基因表达之间的相互关系时,有趣的是它们彼此之间都呈正相关(图8C),这表明它们可能参与了一种共同机制来促进CKD的发展。此外,还探讨了免疫细胞的相互作用(图8D)。调节性T细胞和激活肥大细胞之间具有最强的正相关性(r = 0.53)。相反,静止肥大细胞与激活肥大细胞之间呈最强的负相关性(r = -0.83)。
总结
在这项研究中,作者确定了4个与非酒精性脂肪性肝病(NAFLD)相关的基因(DUSP1、NR4A1、FOSB、ZFP36)作为慢性肾脏病(CKD)患者的诊断标志物,并且NAFLD可能通过免疫和炎症途径加速CKD的发展。作者还阐明了CKD中免疫细胞浸润的变化以及与诊断标志物的显著相关性。作者的研究可能为患有NAFLD的CKD患者提供诊断标志物和治疗靶点。