KEGG注释:KEGG富集可视化柱状图

news2024/10/7 2:17:51

很久很久以前,看到过文章中的KEGG富集可视化结果图。是对KEGG通路进行注释的。后来在一些测序公司的宣传页上也见到过类似的图:

image.png

image.png

其实这个图就是多了一个KEGG通路注释,近期也有小伙伴寻求怎么做。网上很多在线工具可以完成这个图,只需要按照相应的示例提供数据就可以一键出图,很方便。用到的数据就是分析完成的KEGG富集通路,关键的两列一个是KEGG同类名称,一列是counts,当然这个counts也可以选择展示怕值。例如这里的这个网站:微生信-免费在线绘制pathway富集结果分类图

出图的效果如下:

image.png

当然我们还是希望自己动手做出来,毕竟也不是什么难事。需要的文件一个是我们分析的富集通路文件,另外一个就是KEGG注释分类,这个文件在KEGG官网可以整理,这里我们已上传分享到QQ群文件了,可自行下载!

首先加载包和数据,做一个普通的柱状图很简单:

# setwd('D:/KS项目/公众号文章/KEGG通路注释')
library(dplyr)
library(ggplot2)
library(forcats)
library(dittoSeq)
kegg <- read.csv('KEGG.csv', header = T)
#其实做一个柱状图没有什么难度
ggplot(kegg,aes(Description, Gene.Count))+
  geom_bar(stat = "identity")+
  geom_text(aes(label=Gene.Count, y=Gene.Count+2),size=3)+
  coord_flip()+
  labs(x='',y='Gene count')+
  theme_bw()+
  theme(panel.grid = element_blank(),
        legend.position = 'none',
        axis.ticks.y = element_blank(),
        axis.text = element_text(colour = 'black', size = 10))

然后读入注释文件,将通路注释,这里使用的笨办法,直接筛选:

#注释文件
kegg_ann <- read.csv('kegg_annotation.csv')
rownames(kegg_ann) <- kegg_ann$directory3
df <- kegg_ann[kegg$Description,]
kegg1 <- cbind(kegg, df)
table(kegg1$directory1)


# Cellular Processes Environmental Information Processing 
# 1                                    3 
# Human Diseases                           Metabolism 
# 3                                    3 
# Organismal Systems 
# 2 
kegg1 <- kegg1[order(kegg1$directory1),]
kegg1$Description <- as.factor(kegg1$Description)
kegg1$Description <- fct_reorder(kegg1$Description)

p <- ggplot(kegg1,aes(Gene.Count,Description))+
  geom_bar(stat = "identity", aes(fill=directory1))+
  geom_text(aes(label=Gene.Count, x=Gene.Count+2),size=3)+
  labs(y='',x='Gene count')+
  theme_classic()+
  theme(panel.grid = element_blank(),
        legend.position = 'none',
        axis.ticks.y = element_blank(),
        axis.text = element_text(colour = 'black', size = 10),
        plot.margin = margin(0,0,0,-0.05, "cm"))+
  scale_fill_manual(values = dittoColors())

最后添加上右侧的注释就完成了:


#构建注释
df1<-data.frame(x="A", y=kegg1$Description, group=kegg1$directory1)

df1$group <- factor(df1$group, levels = c("Organismal Systems",
                                          "Metabolism",
                                          "Human Diseases",
                                          "Environmental Information Processing",
                                          "Cellular Processes"))

p1 <- ggplot(df1,aes(x,y, fill=group))+
  geom_tile(show.legend = F)+
  facet_grid(group~.,scales = 'free',space = 'free')+
  labs(x=NULL,y=NULL)+
  scale_x_discrete(expand = c(0,0))+
  scale_y_discrete(expand = c(0,0))+
  theme(panel.background = element_blank(),
        axis.ticks = element_blank(),
        axis.text = element_blank(),
        plot.margin = margin(0,-0.05,0,0, "cm"),
        strip.text.y = element_text(angle=0,size=10,color = "black",
                                    hjust = 0,margin = margin(b = 3,t=3)),
        strip.background = element_rect(colour=NULL,fill = 'white'),
        panel.spacing=unit(0, "mm"))+
  scale_fill_manual(values = c("#0072B2","#F0E442","#009E73","#56B4E9","#E69F00"))
  
 
#拼图
library(deeptime)
ggarrange2(p, p1,nrow = 1,widths =c(2,0.05))

当然了,网上也有别的形式的注释,这里不再演示,大概样子就是在柱状图y轴添加了分类的名称,有了注释文件就可以构造了。具体的做法可以参考我们之前的帖子:柱状图|GO、KEGG|标签与柱状图颜色对应。

那么最后还有一个问题,很多人肯定会想到,就是GO的结果可以注释嘛?我们知道GO分为BP、MF、CC三个,但是在BP中能不能继续注释,我是没有看到官方的文件,但是需要自己注释和作图可以参考我们这个帖子。希望分享对你有帮助,点个赞、分享下再走呗!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/642101.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第二节 柱状图

文章目录 1.数据分析流程图2. 列表与数组2.1 二者区别2.2 shape() 函数2.3 生成柱状图比较2.3.1 列表生成柱状图2.3.2 数组生成柱状图2.3.3 扩展案例练习 3. 坐标值3.1 添加横纵坐标值 4. 其他优化细节4.1 屏幕属性4.2 标题属性4.3 练习案例 5. 知识点总结 1.数据分析流程图 数…

功率放大器的工作原理及特点是什么

功率放大器是一种电子设备&#xff0c;用于将输入信号放大到更大的电压、电流或功率级别&#xff0c;以便驱动更大的负载或产生更大的输出功率。这种类型的放大器常用于音频、无线电通信、雷达、声呐、医疗设备和其他应用中。下面安泰电子将为大家介绍功率放大器的工作原理及特…

糖基化修饰:130548-92-4,Fmoc-L-Thr(Ac4-D-Glcβ)-OH,糖肽按照氨基酸和糖的连接方式分为多种

Fmoc-L-Thr(Ac4-D-Glcβ)-OH&#xff0c;糖基化修饰&#xff0c;即糖肽可以按照氨基酸和糖的连接方式分为四类&#xff1a;O 位糖基化、N 位糖基化&#xff0c;糖肽的基本结构多肽链与糖链通过共价键相连蛋白链上连接糖链的位点称为糖基化位点。由于糖肽糖链的生物合成没有模板…

重磅再推 | 基于OpenSearch向量检索版+大模型,搭建对话式搜索

面向企业开发者的PaaS方案 一周前&#xff0c;阿里云OpenSearch发布的LLM智能问答版&#xff0c;面向行业搜索场景&#xff0c;提供企业专属问答搜索服务。作为一站式免运维的SaaS服务&#xff0c;智能问答版基于内置的LLM大模型提供问答能力&#xff0c;为企业快速搭建问答搜…

Linux系统安装mysql8完整无脑步骤

1&#xff1a;卸载原有REPO源 查询已经存在的mysql及相关依赖包 rpm -qa | grep mysql此时你会看到一堆列表&#xff0c;使用 yum 命令依次卸载 yum remove mysql-xxx-xxx-xxx接下来删除 mysql 的残留目录及文件&#xff0c;先用下面的命令找出所有mysql相关的文件夹 find …

报表工具Stimulsoft Reports用户手册:如何激活控件

Stimulsoft Reports.Net是一个基于.NET框架的报表生成器&#xff0c;能够帮助你创建结构、功能丰富的报表。StimulReport.Net 的报表设计器不仅界面友好&#xff0c;而且使用便捷&#xff0c;能够让你轻松创建所有报表&#xff1b;该报表设计器在报表设计过程中以及报表运行的过…

WhoNet报不是有效dbf解决

由于现在Web已经部署到Linux上了&#xff0c;以前在Windows上导出dbf通过oledb执行sql生成dbf的路径已经不可用了&#xff0c;加上需要安装dataaccess驱动也麻烦&#xff0c;为此换了fastdbf生成dbf文件。 首先还算顺利&#xff0c;开始就碰到中文乱码问题&#xff0c;下载源码…

Qt学习之旅 - QTableWidget控件其他控件设置图标

文章目录 设置列数设置水平表头设置行数设置正文设置QTableWidget表格不可被选中、不可编辑设置表格中某个单元格不可被选中 防止越界int转QString其他控件Scroll Area按键 添加UI设置图标主窗口图标状态栏上显示图标使用QtCreator //QTableWidget控件 //设置列数 ui->table…

人工智能和传统行业的思考

人工智能和传统行业的思考 转载&#xff1a;原文链接 — https://xiaowenz.com/blog/2023/04/decouple-your-time/ 传统之传统 传统产业之所以被称为传统&#xff0c;除了大部分并非依靠计算机技术驱动之外&#xff0c;同时也因为这些产业往往更贴近社会的基础架构或生产要素…

常见中间件

中间件简介 中间件运行在系统软件和应用软件之间&#xff0c;以便于各部件之间的沟通。他充当的功能是&#xff1a;将应用程序运行环境与操作系统隔离&#xff0c;从而让开发者不必为更多系统问题忧虑&#xff0c;直接关注该应用程序在解决问题上的能力。 提供解析网站代码的一…

STM32ARM体系结构(嵌入式学习)

STM32&ARM体系结构 1. STM321.1 简介1.2 STM32的优势1.3 命名规范 2. ARM体系结构2.1 ARM体系结构面试题&#xff1a;谈谈你对ARM的认识&#xff1f;1.ARM公司2.ARM处理器3.ARM技术 目前主流处理器架构&#xff1f;精简指令集RISC和复杂指令集CISC的区别&#xff1f;精简指…

第二类曲线积分

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 第二类曲线积分一、向量场是什么&#xff1f;二、向量场可视化三、计算1. 计算方式一2. 计算方式二 第二类曲线积分 因为之前学习第二类曲线的时候&#xff0c;不是…

CarEye 视频平台解决方案

前言 随着4G&#xff0c;5G技术和互联网技术的普及&#xff0c;流媒体应用越来越广发应用到生活中。本文档主要介绍CarEye视频服务器的主要软件硬件构成&#xff0c;功能实现。 功能介绍 CarEye 媒体服务器主要实现以下基本功能&#xff1a; 遵照GB28181/GT1078协议实设备到…

SQL Server Roles 角色權限

SQL Server 提供服务器级角色以帮助你管理服务器上的权限。 这些角色是可组合其他主体的安全主体。 服务器级角色的权限作用域为服务器范围。 &#xff08;“角色”类似于 Windows 操作系统中的“组”。&#xff09; 下表显示了服务器级的固定角色及其权限。 服务器级的固定角…

NLP 学习笔记十-simple RNN+attention(注意力机制)

NLP 学习笔记十-simple RNNattention&#xff08;注意力机制&#xff09; 感兴趣的伙伴&#xff0c;看这个笔记&#xff0c;最好从头开始看哈&#xff0c;而且我的笔记&#xff0c;其实不面向零基础&#xff0c;最好有过一些实践经历的来看最好。 紧接上一回&#xff0c;我们谈…

为什么指针被誉为 C 语言灵魂?

是的&#xff0c;这一篇的文章主题是「指针与内存模型」 说到指针&#xff0c;就不可能脱离开内存&#xff0c;学会指针的人分为两种&#xff0c;一种是不了解内存模型&#xff0c;另外一种则是了解。 不了解的对指针的理解就停留在“指针就是变量的地址”这句话&#xff0c;…

【数据结构与算法篇】手撕排序算法之插入排序与希尔排序

​&#x1f47b;内容专栏&#xff1a;《数据结构与算法篇》 &#x1f428;本文概括&#xff1a; 讲述排序的概念、直接插入排序、希尔排序、插入排序和希尔排序的区别。 &#x1f43c;本文作者&#xff1a;花 碟 &#x1f438;发布时间&#xff1a;2023.6.13 一、排序的概念及其…

CSS差缺补漏之选择器

最近在复盘CSS基础知识&#xff0c;发现很多CSS选择器里面还是大有学问&#xff0c;需要详细总结一番&#xff0c;以备差缺补漏~ 作为CSS基础的一大类别&#xff0c;选择器又分为多种类别&#xff0c;本篇内容默认读者已了解并掌握基础选择器【通配符选择器】、【元素选择器】…

docker命令(查看容器状态stats、容器的导入导出、docker容器的详细信息inspect、docker cp命令的使用)

目录 查看docker容器状态&#xff1a; docker镜像的导入导出 第一种导入导出&#xff08;是docker本地的静态&#xff09; 第二种导出导入 (这种导出是正在运行的容器里的文件系统变成一个归档文件&#xff08;可以包含已经下载好的软件&#xff09;) docker容器的详细信息…

Java Stream流详解

本文目录 学习目标中间操作Filter(过滤)Map(转换)Sorted(排序)Distinct(去重)Limit(限制)Skip(跳过)Peek(展示) 终止操作forEach(循环)Collect(收集)Count(计数)Reduce(聚合)AnyMatch(任意匹配)AllMatch(全部匹配)NoneMatch(无匹配) 使用Stream流的优缺点&#xff1a;优点&…