小白的福利教学。4+共病+WGCNA+机器学习+实验,简单易复现

news2024/11/23 9:30:30


今天给同学们分享一篇共病+WGCNA+机器学习+实验的生信文章“Exploring immune related gene signatures and mechanisms linking non alcoholic fatty liver disease to atrial fibrillation through transcriptome data analysis”,这篇文章于2023年10月16日发表在Scientific Reports期刊上,影响因子为4.6。

e456dd2138ccc0a0c0090b56999808b4.jpeg

房颤(AF)是最常见的持续性心律失常,目前患病率在2%至4%之间。然而,由于人口老龄化和对未诊断房颤进行更加密集的筛查,预计这一比例将增加2.3倍。房颤的患病率上升可以归因于多种风险因素,包括年龄增长、遗传易感性、肥胖、吸烟、糖尿病(DM)和炎症性疾病。然而,并非所有房颤病例都可以通过上述风险因素来解释,这凸显了发现新的诱因的重要性。

fac5879508903fd1a05402f53cc469a3.jpeg

 图1 流程图


1. NAFLD和AF相关关键模块的识别

NAFLD数据集的功率值设置为3,AF数据集的功率值设置为8,以满足拟合指数超过0.85的无标度拓扑条件,然后相应地构建了WGCNA网络。NAFLD数据集的所有基因被分为25个模块。作者评估了每个模块与年龄、性别以及五个肝脏病理特征(细胞膨胀分级、纤维化分期、小叶炎症分级、NAS和脂肪变性分级)之间的相关性。类似地,AF数据集的所有基因被分为19个模块,并对每个模块进行了与AF发生的模块特征相关性分析。如图2所示,来自NAFLD数据集的棕色模块(图2A中的MEbrown)和黄色模块(图2A中的MEyellow),以及来自AF数据集的黑色模块(图2B中的MEblack)与临床特征具有最高相关性,因此被选择为最相关的模块。对这三个模块进行了GO、KEGG和REACTOME通路富集分析。GO结果显示,在NAFLD数据集中,棕色模块在与中性粒细胞介导的免疫、对未折叠蛋白的应答以及中性粒细胞颗粒溶解相关的过程中显著富集。在同一数据集中,黄色模块在与T细胞激活、白细胞细胞间粘附以及淋巴细胞增殖相关的过程中表现出最高的富集程度。在AF数据集中,黑色模块在与T细胞激活和filamin结合相关的过程中富集程度最高。在这三个关键模块中,最显著富集的GO术语与淋巴细胞和中性粒细胞介导的免疫相关。

5bcb59bae418413c9a82a0c360c17364.jpeg

图2 加权共表达网络中模块-特征关系的相关热图


2. 加权共表达网络中模块-特征关系的相关热图

为了研究NAFLD相关模块和AF相关模块中共享基因的潜在生物学功能,作者合并了两个关键的NAFLD模块(NAFLD-brown模块和NAFLD-yellow模块)中的重叠基因,与一个关键的AF模块(AF-black模块)合并。这个合并的基因集被称为NASGS(图3A)。GO富集分析显示,NASGS主要富集在T细胞介导的免疫反应中,如T细胞激活(图3B)。为了更好地理解GO术语的相互作用,作者通过“ClueGO”构建了一个从NASGS到整合的GO通路网络。一致地,显著富集的GO术语的功能组分布表明,“T细胞激活”和“髓样白细胞迁移”是最主要的聚类(图3C)。

b5c2eda1b5f03c79396fb9850ecad523.jpeg

图3 最相关的NAFLD和AF模块的共享基因和生物途径


此外,作者对NAFLD黄色和棕色模块以及AF黑色模块的高度相互连接的聚类应用了GO富集分析。结果显示,NAFLD黄色模块和AF黑色模块在免疫过程中显著富集,尤其是T细胞激活(图4),表明这两个模块在NAFLD和AF期间与免疫过程更为相关。


18190df854589c6e5063970c316a1e39.jpeg

图4 从选定的NAFLD和AF相关模块中,对高度相互连接的聚类进行PPI网络和通路富集分析


为了进一步阐明T细胞介导的免疫在非酒精性脂肪肝(NAFLD)和房颤(AF)中的参与,选择了包含59个样本的AF数据集GSE115574和NAFLD数据集,提取P值<0.05的差异表达基因(DEGs)。在NAFLD或AF中,共有311个基因发生了显著变化。对这些基因进行GO通路富集分析证实,包括T细胞激活通路在内的免疫过程参与了NAFLD-AF共享的病理生理过程。


3.&nbsp;AF和NAFLD数据集的免疫细胞浸润分析

富集分析表明,免疫过程在非酒精性脂肪肝(NAFLD)和房颤(AF)中起着重要作用。此外,作者应用ssGSEA方法对NAFLD数据集和AF数据集进行分析,以分析每个样本中免疫细胞的丰度。在将肝脏样本按照NAS(非酒精性脂肪肝活动性评分)分为“NAFLD组”和“对照组”(以5为分界值)后,作者比较了两组之间每种免疫细胞的丰度。激活的CD4 T细胞、激活的CD8 T细胞、1型辅助T细胞(T1)、调节性T细胞、中央记忆CD4 T细胞、中央记忆CD8 T细胞、效应记忆CD4 T细胞、效应记忆CD8 T细胞、激活的树突状细胞、未成熟的树突状细胞、自然杀伤T细胞、γδT细胞、T辅助细胞、髓源性抑制细胞、单核细胞和肥大细胞在NAFLD组中显著增加(P < 0.05)(图5A)。在AF数据集中,激活的CD4 + T细胞,激活的CD8 + T细胞,T H 1,调节性T细胞,中央记忆CD8 + T细胞,效应记忆CD4 + T细胞,γδT细胞,效应记忆CD8 + T细胞,髓源性抑制细胞,激活的树突状细胞,未成熟的树突状细胞,自然杀伤细胞,巨噬细胞,单核细胞,肥大细胞和中性粒细胞在AF组中显著增高(P < 0.05)(图5B)。


8a5a56bcd6b29f84915c4436d61ac68c.jpeg

图5 在NAFLD数据集中,使用单样本基因集富集分析算法比较(A)NAS < 5和NAS ≥ 5之间的免疫细胞浸润情况,以及在AF数据集中比较(B)SR组和AF组。


4.&nbsp;通过PPI分析和机器学习的方法鉴定NAGDS

通过将最显著富集于免疫过程的NAFLD黄色模块和AF黑色模块进行交叉,建立了NAGDS。从STRING数据库中可视化了PPI网络(图6A)。通过最大团中心性算法确定了前20个中心基因(图6B)。结合SVM-RFE(图6C)和LASSO回归分析(图6D、E),以提高诊断效果并减少噪音信息。通过这两种机器学习算法选择了四个基因,分别是C–C motif chemokine 4(CCL4)、CD48 antigen(CD48)、integrin beta-2(ITGB2)和ribonuclease K6(RNASE6)(图6F)。

48f979a2221766f5371618c946dfa7cd.jpeg

图6 使用LASSO回归和SVM-RFE算法构建NAGDS


5.&nbsp;NAGDS在NAFLD和AF数据集中的验证

每个NAGDS在NAFLD和AF(图7A,B)数据集中的表达均高于对照组(P < 0.05)。ROC分析显示了每个NAGDS的潜在诊断性能,反映在AUC上。在NAFLD数据集中,CCL4、CD48、ITGB2和RNASE6的AUC分别为78.92%、78.15%、75.15%和75.77%(图7C),在AF数据集中,AUC分别为87.50%、95.83%、100%和100%(图7D),表明这四个基因在NAGDS中具有相对较高的诊断价值。接下来,作者评估了NAFLD和AF数据集中NAGDS得分及其诊断价值的水平。一致地,NAFLD和AF数据集中的NAGDS得分较高(图7E,F),整体NAGDS得分的AUC不低于单个NAGDS(图7G)。为了进一步验证NAGDS得分的稳定性,作者在两个外部数据集中研究了其ROC曲线。在GSE63067的NAFLD数据集中,NAGDS得分的AUC为71.4%,在GSE14975的AF数据集中为84.0%。

dcb9953e9742a5724509b9e1becbd202.jpeg

图7 NAGDS的验证


6.&nbsp;NAFLD小鼠模型中肝脏和心房的NAGDS验证

每个NAGDS的表达在NAFLD小鼠模型(n = 12)的肝脏和心房组织以及AF小鼠模型(n = 8)的心房组织中通过qRT-PCR进行了验证。与NAFLD和AF数据集中的结果一致,每个NAGDS的mRNA在NAFLD(图7H-O)和AF(图7P-S)中显著上调(P < 0.05)。


7.&nbsp;NAGDS的生物学意义和临床相关性

为了研究NAGDS的生物学意义,作者按照NAGDS分数重新分组了样本。GSEA分析表明,在NAFLD和AF数据集中,高NAGDS分数组与低NAGDS分数组相比,T细胞激活和巨噬细胞激活等与巨噬细胞和T细胞相关的GO术语显著富集(图8A、B)。NAGDS分数与28种免疫细胞丰度之间的相关分析表明,在NAFLD和AF数据集中,激活的T细胞和巨噬细胞与NAGDS分数显著正相关(图8C)。NAFLD和AF数据集附带有临床特征,包括肝脏病理特征和AF持续时间。相关分析表明,在NAFLD数据集中,NAGDS与肝NAFLD活动分数、纤维化阶段、小叶炎症分级、脂肪变性分级和细胞球化分级呈正相关(图8D),在AF数据集中与AF持续时间呈正相关(图8E)。作者观察到总体NAGDS评分和个体NAGDS与T细胞、巨噬细胞、肝脏病理特征和AF持续时间等免疫细胞之间存在强烈的相关性。因此,作者打算研究针对NAGDS的潜在治疗调控网络。NAFLD和AF在HMDD数据库中共有15个miRNA,其中7个miRNA被发现能够靶向NAGDS(图8F)。作者认为hsa-miR-26a-5p可能与临床更相关,因为它能够靶向三个NAGDS,并在转录后调控的miRNA-mRNA网络中发挥核心作用。

f885e782d1ce269968d54ac0579127c2.jpeg

图8 NAGDS的生物学意义和临床相关性


总结

总结一下,作者的工作提出了NAFLD和AF之间的免疫调节网络,首次揭示了T细胞激活介导的免疫反应在NAFLD中可能是AF的一个重要易感因素,并建立了NAGDS模型,可以准确诊断NAFLD和AF。这些NAGDS基因也可能成为免疫调节治疗的潜在靶点。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1145289.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

c++学习MFC还是QT?

c学习MFC还是QT&#xff1f; 建议学习Qt, Qt开发不仅跨平台&#xff0c;而且社区活跃度和网上的资料也比较多一点&#xff0c;特别是跨平台这一点很重要&#xff0c;最近很多小伙伴找我&#xff0c;说想要一些QT资料&#xff0c;然后我根据自己从业十年经验&#xff0c;熬夜搞了…

Proteus仿真--基于51单片机的LED模拟交通灯仿真(仿真文件+程序)

本文主要介绍基于51单片机的LED模拟交通灯仿真&#xff08;完整仿真源文件及代码见文末链接&#xff09; 仿真运行视频 Proteus仿真--基于51单片机的LED模拟交通灯仿真&#xff08;仿真文件程序&#xff09; 附完整Proteus仿真资料代码资料 百度网盘链接: https://pan.baidu.c…

软件测试必问的面试题(答案+文档)

前言 &#xff08;第一个就刷掉一大批人&#xff09; 有很多“会自动化”的同学来咨询技术问题&#xff0c;他总会问到我一些元素定位的问题。元素定位其实都不算自动化面试的问题。 一般我都会问&#xff1a;你是定位不到吗&#xff1f;通常结果都是说确实定位不到。 做自…

视频剪辑高手必学:批量制作画中画效果的秘诀

随着社交媒体的兴起&#xff0c;视频制作越来越受到人们的关注。在视频制作中&#xff0c;画中画效果是一种常见的技术&#xff0c;它能够让多个画面同时出现在屏幕上&#xff0c;增强视频的视觉效果。然而&#xff0c;对于许多初学者来说&#xff0c;制作画中画效果可能是一项…

python会计应用实操-企业收入与发票比对

案例&#xff1a;企业收入与开票 公司月底或一个季度盘点一下&#xff0c;收入账款与开票数额是否匹配。 使用工具&#xff1a;jupter lab和python 数据&#xff1a; 上海电子税务局已开票统计excel表 银行流水单excel表 编程思路&#xff1a; 两个excel对比金额&#x…

4.OsgEarth加载Mbtiles

愿你出走半生,归来仍是少年&#xff01; 1.Mbtiles mbtiles是在GIS开发中最常用的瓦片包格式&#xff0c;在移动端、桌面端都是常用的格式。 2.代码 通过OsgEarth的MBTilesImageLayer图层进行加载&#xff0c;也是封装成了一个静态的方法方便调用。 /// <summary&g…

【ROS入门】机器人导航(仿真)——导航模块概述

文章结构 导航模块简介全局地图自身定位路径规划运动控制环境感知 导航之坐标系坐标系变换 导航模块简介 在ROS中机器人导航(Navigation)由多个功能包组合实现&#xff0c;ROS 中又称之为导航功能包集&#xff0c;关于导航模块&#xff0c;官方介绍如下: 一个二维导航堆栈&…

拥有DOM力量的你究竟可以干什么

如果你希望访问 HTML 页面中的任何元素&#xff0c;那么您总是从访问 document 对象开始&#xff01; 查找HTML元素 document.getElementById(id) 通过元素 id 来查找元素 <!DOCTYPE html> <html> <head><meta charset…

OSPF 的10种网络类型和5种区域类型

10种网络类型&#xff0c;也有称7类的&#xff0c;因为8、9、10类是V3专有的&#xff0c;如下&#xff1a; LSA 类型描述传播范围使用与目的Type 1路由器LSA (Router LSA)区域 (Area)描述路由器连接的直连网络和链路信息&#xff0c;用于建立拓扑图和计算最短路径。Type 2网络…

Nginx性能优化

简介 nginx作为常用的web代理服务器&#xff0c;某些场景下对于性能要求还是蛮高的&#xff0c;所以本片文章会基于操作系统调度以及网络通信两个角度来讨论一下Nginx性能的优化思路。 基于操作系统调度进行Nginx优化 CPU工作方式 对于用户进程&#xff0c;CPU会按照下面的…

10个简单好用的Python装饰器

_装饰器&#xff08;Decorators&#xff09;_是Python中一种强大而灵活的功能&#xff0c;用于修改或增强函数或类的行为。装饰器本质上是一个函数&#xff0c;它接受另一个函数或类作为参数&#xff0c;并返回一个新的函数或类。它们通常用于在不修改原始代码的情况下添加额外…

Linux操作系统概述3——进程相关操作讲解(进程概念、xinetd守护进程、进程管理命令)

目录 进程的概念 程序与进程的关系 进程的分类 守护进程的分类 进程的PID 进程的状态 xinetd 守护进程服务 xinetd基本概念 xinetd工作原理 xinetd相关文件介绍 守护进程的管理命令 chkconfig 命令 service 命令 systemctl命令 查看进程状态相关命令 一般程序处…

CLIP文章精读

核心&#xff1a; loss的设计&#xff1a;分布针对固定image匹配text和固定text匹配image设计了两个交叉熵loss

Spring Boot进阶(89):Spring Boot和Zookeeper搭建分布式系统,提高系统可靠性

&#x1f4e3;前言 在当今信息化时代&#xff0c;互联网公司在面对海量访问请求时往往需要采用分布式系统来提高系统的可扩展性和可靠性。分布式系统具有多节点、相互协作的特性&#xff0c;不仅可以提高系统的吞吐量&#xff0c;而且还能在某个节点出现故障时自动切换到其他节…

APC学习记录

文章目录 APC概念APC插入、执行过程逆向分析插入过程执行过程总结 代码演示参考资料 APC概念 APC全称叫做异步过程调用&#xff0c;英文名是 Asynchronous Procedure Call&#xff0c;在进行系统调用、线程切换、中断、异常时会进行触发执行的一段代码&#xff0c;其中主要分为…

【Bond随你温故Kubernetes之】壹图复盘service与内部通信

最近跟朋友聊到了k8s 我&#xff1a; “环境给了就只管用呗&#xff0c;副本自动管理地妥妥的&#xff0c;有啥可以复盘的&#xff1f;“ 朋友&#xff1a; “容器的通讯与服务暴露还是有点东西的” 我&#xff1a; “嗯&#xff5e;&#xff5e;&#xff08;抿嘴点…

Android S从桌面点击图标启动APP流程 (六)

系列文章 Android S从桌面点击图标启动APP流程 (一)Android S从桌面点击图标启动APP流程 (二) Android S从桌面点击图标启动APP流程 (三) Android S从桌面点击图标启动APP流程 (四) Android S从桌面点击图标启动APP流程 (五) Android 12的源码链接&#xff1a; android 1…

基于Or-Tools的指派问题建模求解(PythonAPI)

基于Or-Tools的指派问题建模求解&#xff08;PythonAPI&#xff09; 指派问题&#xff08;又称为分配问题&#xff0c;assignment problem&#xff09;基于Or-Tools的指派问题建模求解&#xff08;PythonAPI&#xff09;导入pywraplp库数据准备声明MIP求解器初始化决策变量初始…

自然语言处理 (NLP) 简介

自然语言处理 &#xff08;Natural Language Processing NLP&#xff09; 简介 本课程是关于NLP 101的4部分系列中的第1部分&#xff1a; 自然语言处理导论&#xff08;今天的教程&#xff09;BagofWords模型简介Word2Vec&#xff1a;自然语言处理中嵌入的研究BagofWords与Wo…

3年轻量:腾讯云轻量2核2G4M应用服务器366三年!

腾讯云轻量应用服务器三年特价&#xff0c;3年轻量2核2G4M服务器&#xff0c;2023双十一优惠价格366元三年&#xff0c;自带4M公网带宽&#xff0c;下载速度可达512KB/秒&#xff0c;300GB月流量&#xff0c;50GB SSD盘系统盘&#xff0c;阿腾云atengyun.com分享腾讯云轻量2核2…