复现Nature图表:GSEA分析及可视化包装函数

news2025/1/13 17:33:37

这篇帖子主要的目的是写一个转录组GSEA分析和可视化通用的函数。起因是我们想要复现一篇文章的GSEA可视化图片,这个Nature文章GSEA可视化挺好的:

image.png

image.png

(reference:B-cell-specific checkpoint molecules that regulate anti-tumour immunity)后来干脆一不做二不休,写一个函数吧,有差异分析结果即可,可视化也是一键出结果。算是懒人福音吧。我们此部分一共有两个函数,一个是KS_GSEA,作用是进行转录组数据GSEA分析,提供clusterProfiler和fgsea两种R包分析方式,KS_GSEA适用于human和mouse两个物种,支持KEGG、GO(BP)的GSEA分析。KS_GSEA_plot作用是进行GSEA结果的可视化,可选择需要的通路进行展示。

image.png

image.png

image.png

image.png

这里我们以一个单细胞的数据为例,首先做一下差异分析。Bulk RNA的差异分析不再多说。GSEA分析是基于已经完成差异分析结果,且纳入所有基因。目前R做GSEA用的比较多的是clusterProfiler和fgsea包,所以这两种包的分析方式我们都包含进去了。使用的时候选择自己需要的即可。


library(Seurat)
library(msigdbr)
library(fgsea)
library(clusterProfiler)
library(ggplot2)
#加载函数
source('./KS_GSEA.R')
source('./KS_GSEA_plot.R')

#差异基因-----------------------------------------------------------------------
load("D:/KS项目/公众号文章/GSEA分析及可视化函数/sce_mar.RData")
df <- FindMarkers(Macrophage, min.pct = 0, logfc.threshold = 0,
                    group.by = "group",ident.1 ="BM",ident.2="GM")
df$gene = rownames(df)

得到的差异分析结果是一个数据框,包含gene symbol这一列,还有logFC这一列。我们知道GSEA分析需要对基因按照FC进行排序,我们这里的分析不需要事先进行排序,只要提供gene和logFC即可。两种R包的结果我们都做一下。

#GSEA分析-----------------------------------------------------------------------
GSEA_CP <- KS_GSEA(gene = df$gene,
                   LogFC = df$avg_log2FC,
                   analysis = "KEGG",
                   package = 'clusterProfiler',
                   OrgDb = 'org.Hs.eg.db')
class(GSEA_CP)
# [1] "gseaResult"
# attr(,"package")
# [1] "DOSE"


GSEA_F <- KS_GSEA(gene = df$gene,
                  LogFC = df$avg_log2FC,
                  analysis = "KEGG",
                  package = 'fgsea',
                  OrgDb = 'org.Hs.eg.db')
class(GSEA_F)
# [1] "data.table" "data.frame"

可以看到,clusterProfiler包返回的是一个gseaResult,fgsea包返回的是一个"data.table","data.frame"。这些结果就是我们下一步可视化的输入文件。运行结束后,分析结果已txt或者csv的形式直接保存到当前环境路径下!

image.png

image.png

我们对可视化函数进行了设置,NES>0的结果点用红色显示。NES<0的结果用蓝色点显示。这里我们挑选自己感兴趣的通路进行可视化。

#NES>0
p1=KS_GSEA_plot(inputType = "clusterProfiler",
             analysis = "KEGG",
             data = GSEA_CP,
             term = 'Oxidative phosphorylation',
             gene = df$gene,
             LogFC  = df$avg_log2FC,
             OrgDb = 'org.Hs.eg.db')


p2=KS_GSEA_plot(inputType = "fgsea",
             analysis = "KEGG",
             data = GSEA_F,
             term = 'Huntingtons disease',
             gene = df$gene,
             LogFC = df$avg_log2FC,
             OrgDb = 'org.Hs.eg.db')
p1+p2

image.png

image.png

NES<0,这里需要注意一个问题,clusterProfiler和fgsea虽然都是GSEA分析,但是两者得到的结果并不是一摸一样完全相同的,总是有一些出入,这是因为数据库,分析方式不一样。选择需要的包使用一个即可。


#NES<0
p3=KS_GSEA_plot(inputType = "clusterProfiler",
             analysis = "KEGG",
             data = GSEA_CP,
             term = 'JAK-STAT signaling pathway',
             gene = df$gene,
             LogFC  = df$avg_log2FC,
             OrgDb = 'org.Hs.eg.db')


p4=KS_GSEA_plot(inputType = "fgsea",
             analysis = "KEGG",
             data = GSEA_F,
             term = 'Jak stat signaling pathway',
             gene = df$gene,
             LogFC = df$avg_log2FC,
             OrgDb = 'org.Hs.eg.db')
p3+p4


image.png

image.png

当然了,我们可以利用循环一次性可视化通路。

#批量循环
#NES>0
pathway <- c('Oxidative phosphorylation',
             "Parkinson disease",
             "Biosynthesis of amino acids",
             "Cardiac muscle contraction")

pathway_list <- list()
for (i in 1:length(pathway)) {
  p = KS_GSEA_plot(inputType = "clusterProfiler",
                   analysis = "KEGG",
                   data = GSEA_CP,
                   term = pathway[i],
                   gene = df$gene,
                   LogFC  = df$avg_log2FC,
                   OrgDb = 'org.Hs.eg.db')
  pathway_list[[i]] <- p
  
}
#组合图
CombinePlots(pathway_list, ncol = 2)

image.png

image.png

用另一个数据批量做一下下调的。

#NES<0
pathway1 <- c('Melanoma',
              'Prostate cancer',
              'Ecm receptor interaction',
              'Tgf beta signaling pathway')

pathway_list1 <- list()
for (i in 1:length(pathway)) {
  p = KS_GSEA_plot(inputType = "fgsea",
                   analysis = "KEGG",
                   data = GSEA_F,
                   term = pathway1[i],
                   gene = df$gene,
                   LogFC  = df$avg_log2FC,
                   OrgDb = 'org.Hs.eg.db')
  pathway_list1[[i]] <- p
  
}
#组合图
CombinePlots(pathway_list1, ncol = 2)

image.png

image.png

这就是所有内容了,希望对你有所启发。这个函数其实并不是很完美,首先是物种只支持小鼠和人,其次是分析参数我没有再设置,用的是我常用的。当然了,这个函数框架我提供了,需要更加个性化的可以自行修改。更多精彩请至我们的公众号---KS科研分享与服务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/769772.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vscode报警和报错没有颜色

前言 解决方法来源 https://www.zhihu.com/question/506531863 解决步骤 安装IPython conda install IPython打开/anaconda3/envs/mmagic3/lib/python3.8/site-packages&#xff0c;然后创建一个文件&#xff0c;sitecustomize.py&#xff0c;里面写入 import sys frome IP…

Python(二十一)intput()函数的高级使用

❤️ 专栏简介&#xff1a;本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中&#xff0c;我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 &#xff1a;本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…

Kafka消息队列基础入门和实战例子

1、Kafka 1.1 Kafka部署配置 1.1.1 下载Kafka 下载Kafka https://kafka.apache.org/downloads.html https://archive.apache.org/dist/kafka/2.4.1/kafka_2.11-2.4.1.tgz下载Scala-2.11版本 Scala-2.11经典版本解压 直接解压到某个目录&#xff0c;可以一起放在Java相关的…

MathType公式编辑器右边选项变灰

今天在写论文的时候&#xff0c;想要给公式添加编号&#xff0c;发现Word中的MathType好多选项都变灰了&#xff0c;然后查找了一些资料&#xff0c;最终解决&#xff0c;这里记录一下&#xff0c;方便以后查阅。 MathType公式编辑器右边选项变灰 问题描述解决方案禁止MathType…

C++---树形DP---树的中心(每日一道算法2023.7.19)

注意事项&#xff1a; 本题为"树形DP—树的最长路径"的近似题&#xff0c;同时涉及到 单链表模拟邻接表存储图 的操作&#xff0c;建议先理解那篇文章。 题目&#xff1a; 给定一棵树&#xff0c;树中包含 n 个结点&#xff08;编号1~n&#xff09;和 n−1 条无向边…

pandas清洗客户编码异常数据

前言 在不同行业中&#xff0c;我们经常会遇到一个麻烦的问题&#xff1a;数据清洗。尤其是当我们需要处理客户编码异常数据时&#xff0c;这个问题变得尤为重要。想象一下&#xff0c;许多银行都是以客户为单位管理数据的&#xff0c;因此每个客户都有一个独特的编码。在处理…

LiveGBS流媒体平台GB/T28181功能-海康NVR摄像机自带物联网卡摄像头注册GB/T28181国标平台看不到设备的时候如何抓包及排查

海康大华宇视华为等硬件NVR摄像机注册到LiveGBS国标平台看不到设备的时候如何抓包及排查 1、设备注册后查看不到1.1、是否是自带物联网卡的摄像头1.2、关闭萤石云1.3、防火墙排查1.4、端口排查1.5、IP地址排查1.6、设备TCP/IP配置排查1.7、设备多网卡排查1.8、设备接入配置参数…

实战:ELK环境部署并采集springboot项目日志

文章目录 前言技术积累ELK组成及功能框架搭建基础 EIK环境搭建elasticsearch配置相关kibana配置相关logstash配置相关elk目录下增加docker-compose文件查看elk目录文件树编排elk springboot集成logstashpom.xmllogback-spring.xml启动项目logstash采集日志 写在最后 前言 相信…

Java8 stream toMap、groupingBy、mapping的综合应用

文章目录 一、stream toMap、groupingBy、mapping的综合应用1、前提准备①、实体类②、数据准备 2、核心代码&#xff1a;3、运行结果 一、stream toMap、groupingBy、mapping的综合应用 1、前提准备 ①、实体类 package com.cfay.demo;import lombok.AllArgsConstructor; i…

LCD拼接屏、LED显示屏和OLED显示屏的主要区别

我们在生活或工作中经常看到大大小小的显示屏&#xff0c;但很多人却分不清楚这些屏到底属于哪一类&#xff0c;今天sostron与大家一起来分享下关于&#xff1a;LCD拼接屏、LED显示屏、OLED透明屏三者的区别。 LCD拼接屏、LED显示屏和OLED显示屏是不同类型的显示技术&#xff0…

【116个】网络安全测试相关面试真题

1、Burpsuite常用的功能是什么&#xff1f; 2、reverse_tcp和bind_tcp的区别&#xff1f; 3、拿到一个待检测的站或给你一个网站&#xff0c;你觉得应该先做什么&#xff1f; 4、你在渗透测试过程中是如何敏感信息收集的&#xff1f; 5、你平时去哪些网站进行学习、挖漏洞提交到…

这样创建客户帮助中心,效果超好!

创建一个有效的客户帮助中心是为了为客户提供优质的支持和服务。在这个数字化时代&#xff0c;客户期望能够快速找到所需的信息&#xff0c;并得到准确和及时的解答。本文将分享创建有效客户帮助中心的最佳实践&#xff0c;帮助您提供出色的客户体验并提升客户满意度。 1. 了解…

Banana Pi M2 Zero 运行 openHAB 回顾

首先我要透露的是&#xff0c;BPI 的工作人员向我发送了一台免费的 BPi M2 Zero 来执行这些测试。我相信我的评论是公平和公正的&#xff0c;但我想坦率地说明这一事实。 硬件简介 与 Raspberry Pi Zero W 相比&#xff0c;Banana Pi BPI-M2 Zero 具有令人印象深刻的规格。以下…

git进阶操作

一、git 基础概念1. 1.1 三种状态&#xff1a; 工作区&#xff08;unstage&#xff09;——已修改&#xff08;modified&#xff09; 暂存区&#xff08;stage&#xff09;——已暂存&#xff08;staged&#xff09; 对象区——已提交&#xff08;commited&#xff09; 工作…

moment.js常见格式化处理各种时间方法

Moment.js 是一个简单易用的轻量级 JavaScript 日期处理类库,提供了日期格式化、日期解析等功能。它支持在浏览器和 NodeJS 两种环境中运行。此类库能够将给定的任意日期转换成多种不同的格式,具有强大的日期计算功能,同时也内置了能显示多样的日期形式的函数。另外,它也支…

博弈论--sg函数

sg函数------ 定义终止状态的SG函数值为0。如果游戏已经结束&#xff0c;即达到了终止状态&#xff0c;那么对应的SG函数值就是0。即先手的sg值为0&#xff0c;则先手必败&#xff0c;否则先手必胜。 如何求sg函数值--------对于每个可能的移动&#xff0c;将后续状态的SG函数…

「从零入门推荐系统」21:chatGPT、大模型介绍

作者 | gongyouliu 编辑 | gongyouliu 自2022年11月30日OpenAI发布chatGPT以来&#xff0c;大模型技术掀起了新一轮人工智能浪潮。chatGPT在各个领域&#xff08;包括对话、摘要、内容生成、问题解答、识图、数学计算与推理、代码编写等&#xff09;取得了比之前算法好得多的成…

测试开发之路 (工具篇)--Docker

目录 前言 什么是 docker 在 demo 中学习 mysql test link 更复杂点的场景 前言 Docker是一种开源的容器化平台&#xff0c;它可以帮助开发人员和测试人员更轻松地构建、部署和运行应用程序。在测试开发中&#xff0c;Docker可以提供许多便利和优势。 什么是 docker 官…

VMware Cloud Director 10.5 - 领先的云服务交付平台

VMware Cloud Director 10.5 - 领先的云服务交付平台 Support for vSphere 8.0U1 & NSX 4.1 请访问原文链接&#xff1a;https://sysin.org/blog/vmware-cloud-director-10/&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&#xff1a;sysin.or…

【ShenYu系列】ShenYu的SPI实现源码分析

前言 前面我已经介绍【面试系列】详细拆解Java、Spring、Dubbo三者SPI机制的原理&#xff0c;当已经有了合适的实现&#xff0c;shenyu自身的SPI和上面的有啥区别&#xff0c;值得玩味。 什么是SPI SPI就是Service Provider Interface&#xff0c;直译"服务提供方接口&…