一行代码绘制高分SCI火山图

news2024/12/23 6:39:51

一、概述

在近半年中,我读了很多的高分SCI文章,很多文章中都有多种不同的火山图,包括「普通的火山图渐变火山图、以及包含GO通路信息的火山图」!

经过一段时间的文献阅读和资料查询,终于找到了一个好用而且简单的包——ggVolcano, 它是一个基于R语言和ggplot2绘图包开发的生物信息学数据可视化工具。它可以用于绘制火山图(Volcano plot),帮助研究者分析高通量实验数据,如基因表达谱或蛋白质组学数据,以识别差异表达或差异富集的基因或蛋白质。

二、数据集

1. 安装及使用

由于无法直接安装ggVolcano,我们需要下载devtools,通过devtools直接从github下载,代码如下:

# 下载器
install.packages("devtools")
library(devtools)
# 火山图
devtools::install_github("BioSenior/ggvolcano")
library(ggvolcano)
# 拼图
install.packages("patchwork")
library(patchwork)
# 渐变色色彩修改
install.packages("RColorBrewer")
library(RColorBrewer)

2. 读取数据

首先,我们需要读取aSAH数据集,查看数据集信息

data(deg_data)
head(deg_data,3)

数据集展示

        row  baseMean log2FoldChange     lfcSE      stat       pvalue         padj
GCR1   GCR1 7201.5782       2.244064 0.2004959  11.19256 4.434241e-29 2.153711e-25
OPI10 OPI10 1009.4171      -2.257454 0.2096469 -10.76789 4.880607e-27 1.185255e-23
AGA2   AGA2  249.1173       3.829474 0.3623263  10.56913 4.143136e-26 6.707736e-23

三、基础用法

ggVolcano绘制的火山图可以根据指定的差异表达或统计显著性阈值,将基因或蛋白质标记为显著差异的或富集的(例如p值小于0.05或fold change大于2),并且根据其差异表达或显著性水平值的高低,用颜色或大小进行编码。此外,它还支持在图中显示用户自定义的标注、注释或基因集富集分析结果,以帮助观察者更好地理解和解释结果。该包主要配置了三个函数:

1. 普通火山图:ggvolcano

  • 方法参数解释:
    result: DEG结果数据。
    x: 对应于x轴的列名,默认为“log2FoldChange”。
    y: 对应于y轴的列名,默认为“padj”。
    pointSize: 点的大小。
    pointShape: 点的形状。
    fills: 包含点的填充颜色的向量。
    colors: 包含点的画笔颜色的向量。
    x_lab: x轴的标签。
    y_lab: y轴的标签。
    legend_title: 图例的标题。
    legend_position: 图例的位置。您可以从“UL”–左上,“UR”–右上,“DL”–左下和“DR”–右下中选择一个位置。
    log2FC_cut: log2FC的截止值。
    FDR_cut: FDR的截止值。
    add_line: 一个逻辑值,表示是否添加虚线,默认值为TRUE。
    add_label: 一个逻辑值,表示是否添加基因标签,默认值为TRUE。
    label: 对应于标签的列名。
    label_number: 您想在图中显示多少基因标签。
    custom_label: 包含您感兴趣的基因名称的向量,您想要添加到图中。
    output: 一个逻辑值,表示是否保存图片,默认值为TRUE。
    filename: 如果output=TRUE,请设置一个文件名。
  • 代码演示
    data <- add_regulate(deg_data, log2FC_name="log2FoldChange",
                      fdr_name = "padj",log2FC = 1, fdr = 0.05)
    ggvolcano(data, x = "log2FoldChange", y = "padj",
            label = "row", label_number = 10, output = FALSE)
    image
  • 火山图样式修改
p1 <- ggvolcano(data, x = "log2FoldChange", y = "padj",
          fills = c("red","green","blue"),
          colors = c("red","green","blue"),
          label = "row", label_number = 8, output = FALSE)

p2 <- ggvolcano(data, x = "log2FoldChange", y = "padj",
          label = "row", label_number = 8, output = FALSE,legend_position="DR")+
  ggsci::scale_color_aaas()+
  ggsci::scale_fill_aaas()
p1|p2

image

2. 渐变色火山图:gradual_volcano

  • 方法参数解释:
    result: DEG结果数据。
    x: 对应于x轴的列名,默认为“log2FoldChange”。
    y: 对应于y轴的列名,默认为“padj”。
    pointSize: 点的大小。
    pointShape: 点的形状。
    fills: 包含点的填充颜色的向量。
    colors: 包含点的画笔颜色的向量。
    x_lab: x轴的标签。
    y_lab: y轴的标签。
    legend_title: 图例的标题。
    legend_position: 图例的位置。您可以从“UL”–左上,“UR”–右上,“DL”–左下和“DR”–右下中选择一个位置。
    log2FC_cut: log2FC的截止值。
    FDR_cut: FDR的截止值。
    add_line: 一个逻辑值,表示是否添加虚线,默认值为TRUE。
    add_label: 一个逻辑值,表示是否添加基因标签,默认值为TRUE。
    label: 对应于标签的列名。
    label_number: 您想在图中显示多少基因标签。
    custom_label: 包含您感兴趣的基因名称的向量,您想要添加到图中。
    output: 一个逻辑值,表示是否保存图片,默认值为TRUE。
    filename: 如果output=TRUE,请设置一个文件名。
  • 代码演示
gradual_volcano(deg_data, x = "log2FoldChange", y = "padj",
                label = "row", label_number = 10, output = FALSE,legend_title="")

image

  • 火山图样式修改

这里不能直接修改颜色了,需要引入RColorBrewer包,用来调整色彩。


p1 <- gradual_volcano(data, x = "log2FoldChange", y = "padj",
          fills = brewer.pal(5, "RdYlBu"),
          colors = brewer.pal(10, "RdYlBu"),
          label = "row", label_number = 10, output = FALSE,legend_title="")

p2 <- gradual_volcano(data, x = "log2FoldChange", y = "padj",
          label = "row", label_number = 10, output = FALSE,legend_title="")+
  ggsci::scale_color_gsea()+
  ggsci::scale_fill_gsea()
p1|p2

image

3. GO通路火山图:term_volcano

参数和样式修改方法和上述两个方法类似,不再赘述,接下来展示基础使用方法:

data("term_data")

term_volcano(deg_data, term_data,
             x = "log2FoldChange", y = "padj",
             label = "row", label_number = 10, output = FALSE,
             legend_background_fill = "green")

image

本文由博客一文多发平台 OpenWrite 发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/509194.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

烽火HG680KA-Hi3798MV300-当贝纯净桌面-卡刷固件包

烽火HG680KA-Hi3798MV300-当贝纯净桌面-卡刷固件包-内有教程 特点&#xff1a; 1、适用于对应型号的电视盒子刷机&#xff1b; 2、开放原厂固件屏蔽的市场安装和u盘安装apk&#xff1b; 3、修改dns&#xff0c;三网通用&#xff1b; 4、大量精简内置的没用的软件&#xff…

乳杆菌属Lactobacillus——维持肠道和阴道健康不可忽缺的角色

谷禾健康 乳杆菌属&#xff08;Lactobacillus&#xff09;是厚壁菌门乳杆菌科下的一类革兰氏阳性菌&#xff0c;最早于19世纪在酸奶中发现。 乳杆菌在自然界中分布很广&#xff0c;在植物体表、乳制品、肉制品、葡萄酒、发酵面团、污水以及人畜粪便中&#xff0c;均可分离到。在…

dubbo高级特性分析

1.dubbo多协议支持 某些场景下&#xff0c;可能接口是使用的老的协议去发布的&#xff0c;此时希望接口能够以一种新的协议去发布&#xff0c;老的服务按照老的协议去调用&#xff0c;新的服务按照新的协议去调用 而dubbo服务就可以支持发布多种协议&#xff0c;如 dubbo / he…

c++入门第一篇

C 1 C是编译语言1.1 windows平台运行c1.2 linux平台运行c1.3 Clion和MinGW-w64&#xff08;编译器&#xff09;安装教程1.4 clion的使用教程1.5 c开发工具1.6 c发展应用领域1.7 c学习路线1.8 c学习资料1.9 编程界的四大派系 2 基本语法2.1 c程序各部分介绍2.2 编写C程序2.3 c第…

zeppos 开发工具模拟器 simulator 无法显示app

zeppos 开发工具模拟器 simulator 无法显示app 目录问题描述&#xff1a;simulator的 Apps 不显示 hello-world 工程解决方案 目录 问题描述&#xff1a;simulator的 Apps 不显示 hello-world 工程 已确认部分&#xff1a; 1.网卡驱动安装成功 2.simulator version:1.1.9 3.d…

【LinuxShell】Shell编程之数组

文章目录 一、数组二、数组的定义方式三、数组的相关概述1.数组包括的数据类型2.获取数组长度3.获取数组数据列表4.获取数据下标列表5.获取某下标赋值6.如何判断数组是否缺少元素 四、数组的操作1.数组遍历2.数组切片3.数组替换4.数组删除5.数组追加元素 五、函数与数组的使用1…

致力于中小企业JavaEE企业级快速开发平台、后台框架平台

一、开源项目简介 J2eeFAST 是一个 Java EE 企业级快速开发平台&#xff0c; 致力于打造中小企业最好用的开源免费的后台框架平台 。系统基于&#xff08;Spring Boot、Spring MVC、Apache Shiro、MyBatis-Plus、Freemarker、Bootstrap、AdminLTE&#xff09;经典技术开发&…

zigbee抓包器使用

软件名称&#xff1a;Ubiqua Protocol Analyzer 主要操作流程&#xff1a; 1. 添加物理抓包器 2. 抓包 3. 过滤

注入攻击(一)--------SQL注入(结合BUUCTF sqli-labs)

目录 写在前面一、暴力破解Basic-3-Brute 11.解题思路2.Burp Suite工具使用简介 二、基于GET的SQL注入Pre.使用校园网做题时可能遇到的小问题 2.1 Basic-4-SQL course 1&#xff08;sql注入&#xff09;1.解题思路 2.2 Basic-8-sqli-labs&#xff08;sql注入的各种攻击形式&…

iostat

目录 iostat 查看读写速度和占用CPU时间比率 一、包名 二、常用命令 三、模拟磁盘读写 iptop 看哪个进程使用存储多 iostat 查看读写速度和占用CPU时间比率 一、包名 sysstat &#xff08;和sar同一个包&#xff09; 二、常用命令 iostat 1 每一秒…

js执行思维导图

备注&#xff1a; js执行&#xff1a; 执行分为两部分&#xff1a;预执行和执行 预执行&#xff1a;创建好执行上下文 执行&#xff1a;执行栈中执行 js引擎&#xff1a; 读取并执行js 各个浏览器的引擎如下 …

总结846

学习目标&#xff1a; 月目标&#xff1a;5月&#xff08;张宇强化前10讲&#xff0c;背诵15篇短文&#xff0c;熟词僻义300词基础词&#xff09; 周目标&#xff1a;张宇强化前3讲并完成相应的习题并记录&#xff0c;英语背3篇文章并回诵 每日必复习&#xff08;5分钟&#…

软考A计划-重点考点-专题八(知识产权和标准化知识)

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例 &#x1f449;关于作者 专注于Android/Unity和各种游戏开发技巧&#xff0c;以及各种资源分享&am…

环保认证油烟监测装置餐饮业油烟污染如何治理?

摘要&#xff1a;城市餐饮业油烟污染成了困扰城区环境保护部门和人民群众日常生活的主要问题。油烟污染已经成为我国一个重大的污染源&#xff0c;是形成PM2.5的重要污染源之一&#xff0c;为了解决餐饮业油烟管理方面存在的问题&#xff0c;设计了餐饮业油烟在线监控系统&…

什么CRM客户管理系统最好?

产业互联网背景下&#xff0c;企业数字化转型日渐深化。毋庸置疑&#xff0c;客户是企业的命脉&#xff0c;企业发展的关键便是以客户为中心&#xff0c;为客户创造价值&#xff0c;并不断实现企业的可持续性增长&#xff0c;而这也是每个企业永不落幕的主题。 一套优秀的CRM客…

设计模式之【装饰者模式】,实现“穿衣打扮”自由原来这么简单

文章目录 一、什么是装饰者模式1、装饰者模式原理2、装饰者模式四大角色3、代理、桥接、装饰器、适配器 4 种设计模式的区别4、装饰者模式的应用场景5、装饰者模式和代理模式的对比6、装饰者模式优缺点7、抽象装饰器&#xff08;Decorator&#xff09;是必需的吗 二、实例1-煎饼…

上门推拿app开发软件|上门推拿o2o源码|上门推拿小程序

随着社会的发展&#xff0c;人们越来越注重身体健康&#xff0c;推拿按摩已经成为了不少人减轻身体疲劳、缓解压力的重要方式。但是&#xff0c;传统的推拿按摩前往店铺消费时间成本高、实现复杂&#xff0c;为此同城预约上门推拿小程序成为了时代的产物。   1. 市场需求大&a…

【机器学习】线性回归模型详解

PS&#xff1a;本文有一定阅读门槛&#xff0c;如果有不明白的地方欢迎评论询问&#xff01; 1 模型概述 接下来我们将要学习我们的第一个模型——线性回归。比如说我需要根据数据预测某个面积的房子可以卖多少钱 接下来我们会用到以下符号&#xff1a; m:训练样本数量x:输…

软考A计划-重点考点-专题七(软件工程)

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例 &#x1f449;关于作者 专注于Android/Unity和各种游戏开发技巧&#xff0c;以及各种资源分享&am…

当今自然语言处理领域中的成功之路:Transformer模型

当今自然语言处理领域中最重要和最成功的模型之一是Transformer模型。它是一种基于自注意力机制的神经网络模型&#xff0c;最初由Google公司的研究人员提出&#xff0c;并被广泛应用于机器翻译、文本生成、情感分析等任务中。 Transformer模型之所以被广泛使用&#xff0c;是因…