R语言绘制动态网络图Network教程WGCNA

news2024/12/24 9:00:49

今天分享的笔记是使用NetworkD3对WGCNA的共表达网络进行可视化,创建交互式动态网络图,展示基因之间的相互关系,可以用于转录组或者其他调控网络展示。

加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治疗靶点。

alt

例如上图展示特异性模块内的基因共表达网络,点的大小和深浅代表该基因在网络中连通性的高低。转录因子用三角形表示, 其他基因用圆形表示。

如何绘制动态网络图?

首先,加载R包和数据,所用到的数据是WGCNA分析得到的输出网络文件,格式是Cytoscape的输入格式,本文的示例数据已上传,留言区回复邮箱,系统自动发送示例数据和全部代码。

library(networkD3)
library(tidyverse)
library(vroom)

df_node <- vroom::vroom("CytoscapeInput-nodes-black.txt")
df_edge <- vroom::vroom("CytoscapeInput-edges-black.txt")

> head(df_node)
# A tibble: 6 × 3
  nodeName  altName   `nodeAttr[nodesPresent, ]`
  <chr>     <chr>     <chr>                     
1 AT1G01010 AT1G01010 black                     
2 AT1G01090 AT1G01090 black                     
3 AT1G01180 AT1G01180 black                     
                  
> head(df_edge)
# A tibble: 6 × 6
  fromNode  toNode    weight direction  fromAltName toAltName
  <chr>     <chr>      <dbl> <chr>      <chr>       <chr>    
1 AT1G69920 AT1G71030  0.445 undirected AT1G69920   AT1G71030
2 AT1G15125 AT1G71030  0.440 undirected AT1G15125   AT1G71030
3 AT1G02920 AT1G71030  0.438 undirected AT1G02920   AT1G71030

df_node文件保存节点信息,df_edge保存边的信息,包括起始位置和结束为止,以及连线的权重大小。这里每个节点可以表示一个基因,节点之间的weight权重值用来表示两个基因之间的关联性。

数据的过滤与筛选

df_edge <- df_edge %>% arrange(-weight) %>% head(100)
# 删除自身和自身相关位点
df_edge <- df_edge[which(df_edge$fromNode != df_edge$toNode),]
networkData <- df_edge[1:2]
simpleNetwork(networkData,linkDistance = 100)

由于基因数量比较多,因此这里先按照权重值进行排序,然后选取前100行,这一步可以根据你的需要设置,也可以按照制定阈值过滤,然后绘制一张简单版本的网络图:

alt

格式转换与重新编码

alt

由于我们WGCNA输出的文件中节点都是通过基因ID来表示,但是绘图时无法直接识别节点ID,需要修改为数字0、1、2...因此,需要对节点进行重新修改。

# 转换格式
df_edge_net <- df_edge[,c(1,2,3)] %>% as.data.frame()
df_node_net <- df_node[,c(1,3)] %>% as.data.frame()

colnames(df_edge_net) <- c("source" ,"target" ,"value")
colnames(df_node_net) <- c("name","group")

# 合并第一列和第二列,并取并集
merged_elements <- union_all(df_edge_net$source,df_edge_net$target) %>% unique()

# 对合并后的元素进行编号
element_numbers <- seq_along(merged_elements)

# 创建一个新的数据框,包含合并的元素和对应的编号
result_df <- data.frame(merged_elements, element_numbers)
result_df$element_numbers <- result_df$element_numbers-1

# 使用映射表更新原始数据框的第一列和第二列
df_edge_net$source <- result_df$element_numbers[match(df_edge_net$source, result_df$merged_elements)]
df_edge_net$target <- result_df$element_numbers[match(df_edge_net$target, result_df$merged_elements)]

经过这一步处理后能够得到两个新的数据框,这就是绘制动态网络图的关键输入数据。在此基础上,我们还可以添加一些额外的信息,比如按照不同的分组将节点赋予不同的颜色,或者根据根据基因之间的正调控和负调控设置连接线的颜色。

# 生成模拟数据
df_edge_net$value <- c(runif(nrow(df_edge_net)/2,0,1),runif(nrow(df_edge_net)/2,0,5))
df_edge_net$color <- c(rep("red",50),rep("green",50))

value值表示节点之间连线的权重大小,可以用来展示两个基因之间的关联程度,该值越大线越粗,关联性越强。

color值可以用来设置连线的颜色,比如设置正调控为红色,负调控为绿色。

除了设置节点与节点之间边的关系,还能设置单个节点的参数,比如通过下面的代码设置节点的大小用来表示基因的表达量,表达量高的基因节点直径越大。还可以用过Type将节点进行分组,比如转录因子为A组,目标基因为B组等等。

df_node_net <- result_df
df_node_net$size <- runif(nrow(df_node_net),0,20)
df_node_net$type <- rep(c("A","B","C"),10000)[1:nrow(df_node_net)]
colnames(df_node_net) <- c("name""group""size","type")

绘制动态网络图

接下来通过调用forceNetwork绘制网络图,将刚刚的两个数据作为输入文件,设置如下参数即可获得结果图。

p <- forceNetwork(Links = df_edge_net, 
             Nodes = df_node_net, 
             Source = "source"
             Target = "target",
             linkColour=df_edge_net$color,
             arrows=TRUE,
             legend=TRUE,
             Value = "value",
             NodeID = "name",
             Group = "type"
             bounded=F,
             opacityNoHover = 0.5,
             linkDistance = 100,
             charge=-500,
             Nodesize='size',
             # radiusCalculation = "Math.sqrt(d.nodesize,2)*5",
             # linkWidth = JS("function(d) { return Math.sqrt(d.value)-4;}"),
             # linkDistance=JS("function(d){return 1/(d.value)*100 }"),
             opacity = 0.9,
             zoom = T,
             fontFamily = "Aril",
             fontSize = 12) 
p
alt

这张图是通过JS实现的,因此支持动态交互,比如将鼠标放在节点上会显示节点名称(基因ID),还可以拖动节点查看与之关联节点。

alt

如果想要将其保存下来,最好的方法是html格式,这样仍具有动态交互属性。

saveNetwork(network = p,file = 'Net.html')

今天分享的内容就到这里,感谢您的阅读,如需本文代码和数据,请把收件邮箱发在评论区,欢迎点赞转发分享。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1616063.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大语言模型(LLM)漏洞爆发,AI模型无一幸免

本文概述了人工智能初创公司Anthropic于2024年04月03日发表的一篇针对人工智能安全的论文&#xff0c;该公司在本论文中宣布的一种新的“越狱”技术&#xff0c;名为Many-shot Jailbreaking&#xff08;多轮越狱&#xff09;。文章详细描述了目前大语言模型&#xff08;LLM&…

AI大模型探索之路-实战篇2:基于CVP架构-企业级知识库实战落地

目录 前言 一、概述 二、本地知识库需求分析 1. 知识库场景分析 2. 知识库应用特点 3. 知识库核心功能 三、本地知识库架构设计 1. RAG架构分析 2. 大模型方案选型 3. 应用技术架构选型 4. 向量数据库选型 5. 模型选型 三、本地知识库RAG评估 四、本地知识库代码落地 1. 文件…

Godot3D学习笔记1——界面布局简介

创建完成项目之后可以看到如下界面&#xff1a; Godot引擎也是场景式编程&#xff0c;这里的一个场景相当于一个关卡。 这里我们点击左侧“3D场景”按钮创建一个3D场景&#xff0c;现在在中间的画面中会出现一个球。在左侧节点视图中选中“Node3D”&#xff0c;右键创建子节点…

day_8题解

利用最大公约数求最小公倍数 #include<iostream> using namespace std;int gcd(int a,int b) {return b?gcd(b,a%b):a; }int main() {long long a,b;cin>>a>>b;long long ansgcd(a,b);cout<<(a*b)/ans<<endl;return 0; }排序遍历&#xff0c;记…

国内开通chatgpt plus会员方法

ChatGPT镜像 今天在知乎看到一个问题&#xff1a;“平民不参与内测的话没有账号还有机会使用ChatGPT吗&#xff1f;” 从去年GPT大火到现在&#xff0c;关于GPT的消息铺天盖地&#xff0c;真要有心想要去用&#xff0c;途径很多&#xff0c;别的不说&#xff0c;国内GPT的镜像…

excel中怎么用乘法、加法来替代AND和OR函数

你可以使用乘法和加法来替代Excel中的AND和OR函数&#xff0c;虽然这样做可能会增加公式的复杂度&#xff0c;但在某些情况下是可行的。 1. 使用乘法替代AND函数&#xff1a;AND函数用于判断一系列条件是否同时成立&#xff0c;如果所有条件都为TRUE&#xff0c;则返回TRUE&…

高通发布电脑CPU,比英特尔Ultra9领先51%

要说2024年最热门的关键词&#xff0c;那肯定非 AI 莫属&#xff0c;当前 AI 已经开始深入各行各业&#xff0c;AI 电视、AI 手机、AI 车机、AI 家电&#xff0c;以及 AI PC ,这些都意味着 AI 将对各个行业带来的新风向和不小的冲击。 2024 年了&#xff0c;PC 处理器还能卷出什…

idea2019.3.5版本安装配置

安装 下载地址&#xff1a;https://www.jetbrains.com/idea/download/other.html 配置idea缓存文件位置 注意&#xff1a;为了避免后续的麻烦&#xff0c;此步骤必须为安装或者重装idea的第一步骤&#xff01;&#xff01;&#xff01; 注意&#xff1a;为了避免后续的麻烦&…

Android Studio开发工具学习之Git远程仓库拉取与推送

Git远程仓库操作 1.1 推送项目到远端服务器1.1.1 进入Gitee或Github、创建一个新的仓库1.1.2 将Android Studio中项目推送至Gitee 1.2 从远端服务器拉取项目1.2.1 AS工程页拉取新项目1.2.2 AS启动页拉取项目 1.1 推送项目到远端服务器 1.1.1 进入Gitee或Github、创建一个新的仓…

Redis 如何实现分布式锁

课程地址 单机 Redis naive 版 加锁&#xff1a; SETNX ${lockName} ${value} # set if not exist如果不存在则插入成功&#xff0c;返回 1&#xff0c;加锁成功&#xff1b;否则返回 0&#xff0c;加锁失败 解锁&#xff1a; DEL ${lockName}问题1 2 个线程 A、B&#…

实验 1--SQL Server2008数据库开发环境

文章目录 实验 1--SQL Server2008数据库开发环境2.4.1 实验目的2.4.2 实验准备2.4.3 实验内容1.利用 SSMS 访问系统自带的Report Server 数据库。2.熟悉了解 SMSS对象资源管理器树形菜单相关选择项的功能。(1)右键单击数据库Report Server&#xff0c;查看并使用相关功能;(2)选…

ubuntu系统安装配置gitlab+Jenkins+发布持续集成持续部署保姆级教程。

1、服务器环境 名称 系统 IP 备注 gitlab ubuntu20.04.2图形化 192.168.26.130 要求有6G的内存 Jenkins Ubuntu20.04.2图形化 …

物联网配网工具多元化助力腾飞——智能连接,畅享未来

随着物联网技术的迅猛发展&#xff0c;智能插座、蓝牙网关作为其中常见的智能物联设备&#xff0c;无论是功能还是外观都有很大的改进&#xff0c;在智能化越来越普遍的情况下&#xff0c;它们的应用场景也在不断拓宽。对于智能设备而言&#xff0c;配网方式的选择对于设备的成…

vscode ssh远程连接服务器,一直正在下载vscode服务器的解决办法

前言 为方便描述&#xff0c;在本教程中&#xff0c;发起远程连接的叫“主机”&#xff0c;被远程连接的叫“服务器”。 正文 如果主机是首次用vscode远程连接服务器&#xff0c;会在服务器上自动下载vscode服务器&#xff0c;但有时候因为网络问题&#xff0c;会卡在&#xff…

Python 网络与并发编程(一)

文章目录 并发编程介绍串行、并行与并发的区别进程、线程、协程的区别进程线程协程 并发编程解决方案同步和异步介绍 并发编程介绍 串行、并行与并发的区别 有任务A、B、C&#xff0c;一个CPU去执行他们&#xff0c;有几种方式 1、一个cpu按顺序执行ABC&#xff0c;这就是串行…

ThingsBoard教程(二十九):详细讲解在tb平台下 http协议下的客户端rpc,服务的rpc的使用

客户端rpc 先来说一下简单的客户端rpc, 客户端发起rpc请求,只需要使用post方法调用该接口即可以 http://host:port/api/v1/$ACCESS_TOKEN/rpc请求路径中间的参数 ACCESS_TOKEN 必须是设备的访问令牌。 请求携带的参数如下,二个参数method和params {"method": …

创建Maven项目的时候让选择maven模板

创建Maven项目的时候让选择maven模板 心得 工欲利其事 必先利其器。如果你想要干成一件事 那么必须先要精通对应的工具使用。之前我不太注重工具 我觉得只要代码写的好就可以了 但是当我们了解了产品经理的一些思想之后&#xff0c;我才明白一个好的产品是可以给用户提供多大…

Vue学习:webpack-dev-server和nginx问答

正向代理和反向代理的概念 正向代理和反向代理的概念如下&#xff1a; 正向代理。是一个位于客户端和原始服务器之间的服务器&#xff0c;为了从原始服务器取得内容&#xff0c;客户端向代理发送一个请求并指定目标&#xff08;原始服务器&#xff09;&#xff0c;然后代理向…

苹果电脑装虚拟机好用吗 苹果电脑装虚拟机要钱吗 Parallels对mac的损害 Parallels占用多大空间 PD19

在当今数字化的时代&#xff0c;人们对电脑系统跨设备互联的需求越来越高。作为拥有广泛用户群体的苹果电脑&#xff0c;许多用户会有在Mac系统中运行其他操作系统的需求。在这种情况下&#xff0c;安装虚拟机是一个较好的解决方案。那么接下来就给大家介绍苹果电脑装虚拟机好用…

对接支付宝支付

前言 这里讨论的主要是一个验签出错的问题,至于具体的对接流程并不复杂,直接找官网的文档就行了 问题表现 后台拉起支付后要返回一个form表单给前端,然后前端说报了这个错,于是进行一系列排查 猜测1 很明显的就会怀疑支付宝的公钥或者私钥出了问题才引起这个问题,但是对比了以…