铜死亡+多组机器学习+WGCNA+分型

news2024/11/24 7:46:31
今天给同学们分享一篇铜死亡+多组机器学习+WGCNA+分型的生信文章“Machine learning screening for Parkinson's disease-related cuproptosis-related typing development and validation and exploration of personalized drugs for cuproptosis genes”,这篇文章于2023年1月10日发表在Ann Transl Med期刊上,影响因子为3.616。
1dda9d854ea44f3526ab9ef1a1e3e46b.jpeg

帕金森病(PD)是一种常见的神经系统退行性疾病,其特征是黑质(SNpc)中的多巴胺能神经元死亡。越来越多的证据表明,铜(Cu)参与了髓鞘的形成,并通过调节突触活动和神经营养因子诱导的兴奋毒性参与细胞死亡。


1.研究流程

图 1 显示了所有分析过程。首先,从GEO数据库中检索了PD-脑黑质测序数据,并利用GSE49036数据集筛选CR-DEGs,探索其相关性和单基因GSEA通路分析。然后探讨了单个基因与免疫细胞之间的相关性,构建了CR-DEGs mRNA-miRNA-lncRNA网络,构建了基因-药物网络,并进行了分子对接以探讨其结合的可行性。然后探索了存在于帕金森病中的 CR-DEGs 分子亚型,构建了具有临床和聚类分型的 WGCNs,并将聚类分型与临床模块基因交叉。然后利用交叉基因通过机器学习构建诊断模型,并利用 GSE7621 和 GSE20141 验证了该诊断模型。

eab8ffd3c4e42e769b95d800d7e8847d.jpeg

图1 与杯突症相关的诊断基因和药物治疗的系统分析流程图


2.鉴别帕金森病的 CR-DEG 及基因间的相关性分析

对 GSE49036 数据进行归一化处理,使用 R 软件的 limma 包提取 CRGs,并进行 DEG 分析筛选。根据筛选标准:根据筛选标准:P<0.001,用 "***"表示;P<0.01,用 "**"表示;P<0.05,用 "*"表示,使用pheatmap和ggpubr软件包绘制热图(图2A)和箱形图(图2B),直观显示差异基因表达结果。

b6c9d0820308b9d6dec95a57c76da8bb.jpeg

图2 PD中的CR-DEGs


利用 R 软件的 corrplot 软件包对上述基因在 PD 患者中的表达进行了相关性分析,结果显示 ATP7B 与 NFE2L2 和 MTF1 负相关,NFE2L2 与 MTF1 正相关。利用circlize软件包还可视化了基因间表达相关性的结果(图3)。

a79a673c0fc7d5d43f18b56d39390b6b.jpeg

图3 CR-DEG 的相关性


3.PD 组织和 CR-DEG 的 GSEA

如图 4 所示,为了探索杯突相关基因如 NFE2L2、MTF1 和 ATP7B 在帕金森病中的潜在作用机制,作者进行了单基因 GSEA 富集分析。有趣的是,虽然NFE2L2和MTF1下调,ATP7B下调,但这3个基因都与突触囊泡循环有关。相反,ATP7B上调的信号通路还与柠檬酸循环(TCA循环)、尼古丁成瘾、视黄醇代谢、淀粉和蔗糖代谢等有关,而NFE2L2和MTF1则共同与蛋白酶体有关,MTF1下调的信号通路则与2-氧代羧酸代谢、糖磷脂生物合成-球蛋白和异球蛋白系列等有关。NFE2L2 下调与氨基酰-tRNA 生物合成、糖磷脂生物合成-球型和等球型系列等有关。

dfdf6862295e1aca73de277e69c61335.jpeg

图4 ATP7B、MTF1 和 NFE2L2 通路相关性探索

图5 图表格式相同


这些结果表明,NFE2L2、MTF1 和 ATP7B 可能参与了突触小泡循环的调控,进而影响脑神经递质的传递,并可能参与脑组织的有氧代谢,导致疾病进展。


4.PD组织和CR-DEG的免疫相关性分析

为了探讨PD中CR-DEGs的免疫细胞浸润,作者使用免疫基因组 "immune.gmt "对数据集GSE49036进行了GSEA,如图5A、5B所示。CD8 T细胞在正常对照组与PD组织中高表达,而质体树突状细胞(DC)、巨噬细胞、未成熟B细胞、髓源抑制细胞(MDSCs)、肥大细胞、中性粒细胞、自然杀伤(NK)T细胞、2型T辅助细胞、T滤泡辅助细胞和其他免疫细胞在PD黑质与正常脑组织中高表达。作者还探讨了 CR-DEGs 的个别基因与免疫细胞之间的关系(见图 6)。ATP7B 与活化的 B 细胞、CD56 dim NK 细胞、中央记忆 CD4 T 细胞、中央记忆 CD8 T 细胞、巨噬细胞、肥大细胞、MDSC、单核细胞、NK 细胞、NK T 细胞、浆细胞 DC 和 T 滤泡辅助细胞相关、和其他免疫细胞呈负相关,而 NFE2L2 与 MTF1 和 17 型 T 辅助细胞、类浆细胞 DC、NK T 细胞、中央记忆 CD8 T 细胞、NK 细胞、单核细胞呈负相关。记忆B细胞、肥大细胞和活化B细胞呈正相关,有趣的是,它们与效应记忆CD8 T细胞的表达呈负相关;这些免疫细胞可能参与了PD中脑黑质多巴胺能神经元的变性死亡,而NFE2L2、MTF1和ATP7B等CR-DEGs可能是PD免疫治疗的有希望的靶点。

825d8ed544430b63b121837cfc895380.jpeg

图5 PD和正常情况下免疫浸润模式的免疫基因组分析

3a78d1d8ad053430a024e66315e4e6aa.jpeg

图6&nbsp;


5.PD-CR-DEGs ceRNA 网络搜索

为了进一步探讨NFE2L2、MTF1和ATP7B基因之间复杂的分子相互作用机制,作者绘制了一个mRNA-miRNA-lncRNA网络关系图,如图7所示。这个复杂的网络有60个节点和99个相互作用,其中包括40个miRNA和17个lncRNA,这可能为作者探索杯突相关性脊髓灰质炎的发病机制提供了一个新的思路。

11ec8f0a51fdc2e8aabf0ec790810b01.jpeg

图7


6.治疗帕金森病的前瞻性小分子药物

为了探索用于PD治疗的前瞻性小分子药物,作者从DGIdb数据库中下载了NFE2L2、MTF1和ATP7B靶向药物的结果,并选择了有记录结果的药物,用Cytoscape展示了基因-药物结果(图8A)。最后,作者选择了 NFE2L2 基因-药物相互作用得分前 5 位的药物,利用 AutoDock 进行小分子药物-大分子蛋白质对接。对接所需的能量如图 8B 所示,其中 LAGASCATRIOL 与 NFE2L2 的对接所需的能量最低。图 9A 显示了 NFE2L2 蛋白与 LAGASCATRIOL 分子对接结果的全貌,图 9B 显示了小分子药物与蛋白质分子对接结果的局部视图,见图 9C。LAGASCATRIOL 能与 NFE2L2 第 456 位和第 504 位的精氨酸分别形成 1 个离子键,与第 457 位的天冬氨酸形成 2 个离子键。

52047bb1c0b4e2a6fec6ca5b49383d48.jpeg

图8

1344ae3552c86617074e60d60652f93c.jpeg

图9 NFE2L2 蛋白与 LAGASCATRIOL 的对接


7.基于 PD 样本中 CR-DEG 的聚类

在 GSE49036 中,作者进行了聚类分析,将 PD 样本分为不同的分子亚型,并根据上述选定的 3 个 CR-DEGs 的表达情况使用 PCA 对亚型进行了检验(图 10A、10B)。作者将这两个聚类分别命名为 CRGClusters C1 和 C2。对这 2 个 CRGClusters 的差异分析表明,C1 中 ATP7B 的表达量明显高于 C2,而 C1 中 NFE2L2 和 MTF1 的 ATP7B 表达量明显高于 C2,C2 的 ATP7B 表达量则明显低于 C1(图 10C)。在《京都基因组百科全书》(KEGG)中,比较 GSEA 中的两个群组,也发现了明显不同的 KEGG 通路富集谱,有趣的是 PARKINSONS_DISEASE 上,泛素介导的蛋白酶解、氧化磷酸化和柠檬酸循环 tca 循环也出现了上调,而 tgf beta 信号通路和剪接体则出现了下调(图 10D)。相反,在基因本体(GO)生物学下调的通路中:免疫突触形成、造血的正调控、b 细胞分化的正调控、内胚层细胞分化的调控、突触小泡内吞、树突延伸、突触前密核小泡外吞、突触后小泡外吞的调控和突触后细胞膜钙离子浓度的调控(图 10E)。这些结果表明,神经递质可能参与了大脑中神经递质的产生和传输,也可能参与了与帕金森病进展有关的树突状突触的产生,导致纹状体 DA 含量显著减少。

cfcf1c98368efcc69628fa63b52115ec.jpeg

图10


8.脊髓灰质炎样本的 WGCNA 共表达分析

作者首先对临床性状相关性进行了 WGCNA 分析,以选择波动最大的前 25% 基因进行 WGCNA 分析,并切断离群样本,将其余样本纳入分析(图 11A)。如图 11B 所示,当功率 =8 且平均一致性较高时,标度独立性达到 0.9。因此,使用功率 =8 来构建共表达模块,以获得初步的模块划分结果,WGCNA 的结果显示,不同的模块被识别为不同的颜色(图 11C)。为了检测离群值,利用模块的特征值构建树,然后合并属于同一分支的距离很近的树,并将截距值设为 0.5(图 11D)。共表达模块的构建如图 11E 所示,合并相似模块后得到结果。根据每个模块中样本的特征值和样本的特征,进行相关性分析以确定与特定性状相关的模块,结果发现以 MEblack 为代表的基因在 PD 中高度正相关(图 11F)。

cb8af331d527a7afc19c75408da375e1.jpeg

图11 PD 疾病相关模块共表达基因的 WGCNA 选择


与作者在分型后进行 WGCNA 相关性分析的方法相同,当幂次 =7、标度独立性达到 0.9 时,作者像图 12B 一样切掉离群样本(图 12A),通过颜色识别模块,最终发现分型后的特征(图 12C-12F),以 MEyellow 为代表的基因在 CRGCluster C1 中高度正相关(图 12F)。


d70c6c6d3e69360ddb239fa5d5bbab89.jpeg

图12 WGCNA 挑选 PD 群相关模块共表达基因


9.机器学习建立诊断模型

作者将临床性状和分型的常见性状基因模块进行交叉,共找到 72 个性状基因(图 13A)。作者使用 GSE49036 数据集提取了这 72 个性状基因,并使用 RF 树、SVM、XGB 和 GLM 算法建立了性状诊断模型。作者首先分析了数据样本的残差,绘制了四种算法残差的反向累积分布图(图 13B)。XGB 模型在大多数样本中的残差较小,而 GLM 在许多样本中的残差高于 XGB 模型。4 种算法残差的箱形图(图 13C)中,红点表示残差的均方根,排序如下:XGB < SVM < RF < GLM,并用 ROC 曲线验证了这 4 个模型。四个模型的 AUC 值如下:RF =0.833;SVM =0.833;XGB =0.917;GLM =0.833(图 13D)。

6e4c24b017e1028329f4e2be8c785f28.jpeg

图13


最后,作者选择了 XGB 模型,并使用 GSE7621 和 GSE20141 基因集验证了 XGB 模型的 ROC 曲线(图 13E、13F),相应的 AUC 值分别为 0.688 和 0.833。最后,将模型中的基因绘制成提名图(图 14),结果显示模型中的基因有 SLC35D3、FLJ22184、SYT17184、SLC35D3、FLJ22184、FLJ22184、SYT17 和 RIMS3。


dcdc7373423c091d4e61910945ae10d3.jpeg

图14 作者构建了一个提名图来预测帕金森病进展的概率


总结

通过生物信息学分析,在帕金森病患者的黑质中发现了 CR-DEG。ATP7B以及NFE2L2和MTF1被认为是有待进一步研究的候选基因。这项研究提供了在帕金森病发病机制中与铜积累导致细胞死亡相关的新基因,并为相关的神经退行性疾病探索了有前景的治疗靶点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1091094.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3.3 封装性

思维导图&#xff1a; 3.3.1 为什么要封装 ### 3.3.1 为什么要封装 **封装**&#xff0c;在Java的面向对象编程中&#xff0c;是一个核心的思想。它主要是为了保护对象的状态不被外部随意修改&#xff0c;确保数据的完整性和安全性。 #### **核心思想&#xff1a;** - 保护…

TSINGSEE青犀智能分析网关如何助力别墅区域监控智能化信息化发展?

谈到别墅&#xff0c;大家一般都会想到花园、草坪、泳池等等&#xff0c;联想到的都是舒适放松的环境。别墅优美环境是不可否认的&#xff0c;但是别墅占地大、空间广、人员稀少也使得常常被盗贼“光顾”&#xff0c;即使别墅一般都会配备保安进行巡逻检查&#xff0c;但传统人…

【python编程】python无法import模块的一种原因分析

python系统路径添加错误 报错原因原因分析解决办法补充 最近写代码的时候遇到一个问题&#xff0c;就是想添加工程下fu_convert文件夹下自己编写的convert_fw.py模块&#xff0c;但是出现报错&#xff0c;是个比较低级的问题&#xff0c;但还是简单记录一下 报错原因 无法找到…

PHP遇见错误了看不懂?这些错误提示你必须搞懂

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏:《速学数据结构》 《C语言进阶篇》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 文章目录 一、错误分类二、系统错误&#xff1a;2.1 编译错误2.2 致命错误2.3 警告错误2.4 通知错误 三、用户错误3.1 错…

GitLab使用步骤

GitLab使用步骤 1 注册用户 1 访问&#xff1a;http://10.0.0.203/users/sign_up地址 2 填入注册信息&#xff0c;注册成功&#xff0c;需要管理员审核 3 用root登录&#xff0c;地址&#xff1a;http://10.0.0.203/users/sign_in账号&#xff1a;root密码&#xff1a;xxxx…

接口测试总结及其用例设计方法

接口测试的总结文档 第一部分&#xff1a;主要从问题出发&#xff0c;引入接口测试的相关内容并与前端测试进行简单对比&#xff0c;总结两者之前的区别与联系。但该部分只交代了怎么做和如何做&#xff1f;并没有解释为什么要做&#xff1f; 第二部分&#xff1a;主要介绍为什…

指针(2)

1.数组名的理解 一般数组名就是数组首元素的地址 但是有2个例外&#xff1a;1.sizeof&#xff08;数组名&#xff09; 这里面数组名表示的是整个数组&#xff0c;计算整个数组的大小&#xff0c;单位为字节。 …

51 爬楼梯

爬楼梯 题解1 dp省点空间——斐波那契数列 题解2 矩阵快速幂&#xff08;适合n小&#xff0c;重点学习方法&#xff09; 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢&#xff1f; 示例 1&#xff1a; 输入…

C++特性——命名空间、I/O流以及缺省参数

C特性 文章目录 C特性1. 写在前面2. 命名空间2.1 命名空间的嵌套2.2 命名空间的完全展开2.3 命名空间的指定展开 3. C的I/O流4. 缺省参数4.1 使用缺省参数的注意事项 1. 写在前面 可以认为&#xff0c;C的语法和语义基本上包含了C语言的所有内容。二者之间的关系大致可以用下图…

十六、代码校验(4)

本章概要 调试 使用 JDB 调试图形化调试器 调试 尽管聪明地使用 System.out 或日志信息能给我们带来对程序行为的有效见解&#xff0c;但对于困难问题来说&#xff0c;这种方式就显得笨拙且耗时了。 你也可能需要更加深入地理解程序&#xff0c;仅依靠打印日志做不到。此时…

【牛客面试必刷TOP101】Day8.BM33 二叉树的镜像和BM36 判断是不是平衡二叉树

作者简介&#xff1a;大家好&#xff0c;我是未央&#xff1b; 博客首页&#xff1a;未央.303 系列专栏&#xff1a;牛客面试必刷TOP101 每日一句&#xff1a;人的一生&#xff0c;可以有所作为的时机只有一次&#xff0c;那就是现在&#xff01;&#xff01;&#xff01;&…

2015架构案例(五十一)

第5题 【说明】某信息技术公司计划开发一套在线投票系统&#xff0c;用于为市场调研、信息调查和销售反馈等业务提供服务。该系统计划通过大量宣传和奖品鼓励的方式快速积累用户&#xff0c;当用户规模扩大到一定程度时&#xff0c;开始联系相关企业提供信息服务&#xff0c;并…

关于RNNoise、webrtc_ns、三角带通滤波器、对数能量

语音特征参数MFCC提取过程详解 其中讲解了&#xff1a;三角带通滤波器 、计算每个滤波器组输出的对数能量、对数能量、经离散余弦变换&#xff08;DCT&#xff09;得到MFCC系数 推荐阅读某乎这位大佬的全部文章&#xff1a; 下面是几篇出自这位大佬的很好的文章&#xff1a; …

MySQL进阶(回望MySQL)——从数据资产谈起 MySQL的DOS命令、常用数据类型、SQL语句的分类 SQL函数

前言 SQL&#xff08;Structured Query Language&#xff09;是一种用于管理关系型数据库的标准化语言&#xff0c;它用于定义、操作和管理数据库中的数据。SQL是一种通用的语言&#xff0c;可以用于多种关系型数据库管理系统&#xff08;RDBMS&#xff09;&#xff0c;如MySQ…

小程序需带参数跳转

1、需要生成二维码的数据 直接在浏览器中替换成自己的appid&#xff0c;secret及可生成一个access_token https://api.weixin.qq.com/cgi-bin/token?grant_typeclient_credential&appidwxxxxx&secretxxxxx用access_token https://api.weixin.qq.com/wxa/getwxacode…

【LeetCode热题100】--215.数组中的第K个最大元素

215.数组中的第K个最大元素 本题主要是返回数组排序之后的倒数第k个位置 方法一&#xff1a;基于快速排序 思路和算法 我们可以用快速排序来解决这个问题&#xff0c;先对原数组排序&#xff0c;再返回倒数第 k 个位置&#xff0c;这样平均时间复杂度是 O(nlog⁡n)&#xff0…

管程的介绍

一、概述 1.引入原因 信号量机制实现同步存在编写程序困难&#xff0c;易出错问题 2.概念 是一种实现进程互斥与同步的机制&#xff0c; 3.组成 共享数据结构说明、对数据结构操作的过程/函数、初始化共享数据、管程名&#xff1b; 4.特点 类似类的结构(数据对象相关操…

IDEA通过Docker插件部署SpringBoot项目

1、配置Docker远程连接端口 找到并编辑服务器上的docker.service文件。 vim /usr/lib/systemd/system/docker.service在下面ExecStart替换成下面的 ExecStart/usr/bin/dockerd -H tcp://0.0.0.0:2375 -H unix://var/run/docker.sock2.重启docker systemctl daemon-reload s…

强化学习(Reinforcement Learning)与策略梯度(Policy Gradient)

写在前面&#xff1a;本篇博文的内容来自李宏毅机器学习课程与自己的理解&#xff0c;同时还参考了一些其他博客(懒得放链接)。博文的内容主要用于自己学习与记录。 1 强化学习的基本框架 强化学习(Reinforcement Learning, RL)主要由智能体(Agent/Actor)、环境(Environment)、…

CSS padding(填充)

CSS padding&#xff08;填充&#xff09;是一个简写属性&#xff0c;定义元素边框与元素内容之间的空间&#xff0c;即上下左右的内边距。 padding&#xff08;填充&#xff09; 当元素的 padding&#xff08;填充&#xff09;内边距被清除时&#xff0c;所释放的区域将会受到…