在线计算lncRNA-mRNA共表达相关系数,并使用cytoscape绘制共表达网络图

news2024/11/20 15:21:35

长链非编码RNA(Long noncoding RNA)是一类长度大于200 nt,不编码蛋白质的RNALncRNA的功能多样,如图1所示,A:充当蛋白质和染色质的连接因子,引起染色质重构(chromatin remodeling);B:充当miRNA海绵;C:充当“scaffold”脚手架;D:与转录因子结合,引起转录激活;E:把转录因子拉走,引起转录抑制;FGH:与mRNA结合抑制翻译、调节剪切,及降解mRNA等。

                                                           图1. lncRNA功能

由于lncRNA发现较晚,功能研究不完善,因此,我们可以以mRNA为桥梁对lncRNA的功能进行推断和研究。通常将lncRNA的功能分成cis和trans两种(图2)Cis作用的原理是lncRNA的功能与其临近mRNA相关,可以以lncRNA基因组坐标上下游100 kb的mRNA作为lncRNA的靶基因进行研究。而trans作用的原理是lncRNA与其共表达的mRNA相关,可以根据表达量计算相关性以预测lncRNA的靶基因(一般要求样品数超过6个),从而研究lncRNA的功能。

                                                                图2. Cis vs trans

相关系数(correlation coefficient

相关系数用来衡量两个变量X和Y间的相关性。相关性包括:线性相关和非线性相关。

Pearson相关系数用来衡量两个变量X和Y之间的线性相关关系。常用r表示,取值范围为[-1,1]。其中负的表示负相关,正的表示正相关。值越大相关性越强。

而spearman秩相关系数用来衡量两个变量间的非线性相关关系。是一个非参数度量。常用rho(ρ)来表示。取值范围也是[-1,1]

常见的相关性标准为:不相关:0-0.1 ;低相关:0.1-0.3;中等相关:0.3-0.5;显著相关0.5-1.0。应参考具体使用场景进行判断。

虽然pearson相关系数最常用,然而它受数据分布的影响,对异常值敏感,需要数据服从近似正态分布才能使用。然而,我们遇到的数据是非常复杂的,往往并不符合线性相关,因此,越来越多的研究者使用spearman秩相关系数(Spearman’s rank correlation coefficient)计算两个变量间的相关性。注意:相关性不隐含因果关系。

在lncRNA-mRNA共表达相关系数计算中,pearson相关系数和spearman相关系数都有使用。例如在《Genome-wide analysis of lncRNAs, miRNAs, and mRNAs forming a prognostic scoring system in esophageal squamous cell carcinoma》文章中,作者写道“The correlation between prognostic lncRNA and mRNA expression profiles was analyzed by Spearman method, and the lncRNA-mRNAs pairs that the absolute value of correlation coefficients > =0.4 and p < 0.05 were selected to construct the co-expression network”,使用的是Spearman相关系数,rho阈值0.4,pvalue阈值0.05。而在《Genome-wide analysis of differentially expressed lncRNAs and mRNAs in primary gonadotrophin adenomas by RNA-seq》文章中,作者写道“The network is based on Pearson correlation coefficient (the absolute value of PCC ≥ 0.80, p-value < 0.001)”,使用的是pearson相关系数,r阈值0.8,pvalue阈值0.001

今天,我们来计算相关系数,并使用cytoscape软件绘制网络图。

1.打开相关系数计算页面

首先,使用浏览器(推荐chrome或者edge)打开lncRNA-mRNA pearson、spearman相关系数计算页面。左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。

http://www.bioinformatics.com.cn/basic_lncrna_mrna_pearson_spearman_coexpression_analysis_t013

                                                      图3.相关系数计算页面

2,示例数据

点击右侧“示例数据”链接下载excel格式的示例数据。

示例数据(仅供参考)分两部分,上半部分是lncRNA表达量,下半部分是mRNA表达量。其中行是基因,列是样品名。LncRNA和mRNA的样品名顺序必需保持一致。

                                                                  图4.输入数据

注意:需要参考示例数据,在excel中将自己的数据整理成示例数据的样式,每个cell都需要有数据,不能有空的单元格。

3,粘贴示例数据

拷贝示例数据中上半部分的lncRNA数据,粘贴到第一个输入框。拷贝示例数据中下半部分的mRNA数据,粘贴到第二个输入框。

                                                      图5. 将数据粘贴到输入框

注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。并且数据矩阵中不能有空的单元格,中文字符等。

4,修改参数,并提交

我们设置了数据是否转化、相关系数算法等参数。由于示例数据来自芯片,因此这里不转化。使用pearson相关系数进行计算。

                                                                     图6. 可选参数

5,提交分析

粘贴好输入数据,调整好参数后,点击提交按钮,3秒钟后,会在页面右侧出现结果。

                                                                   图7.结果说明及下载

结果以excel存储。

                                                       8. 相关系数结果

各列说明:

LncRNA:lncRNA名字

mRNA:mRNA名字

r:pearson相关系数

pvalue:p值

flag:+:正相关,-:负相关

6. 过滤结果

下载结果后,使用excel的筛选功能进行过滤,这里以p<0.05|r|>=0.4的lncRNA-mRNA对绘制共表达网络(带header共28行)。

                                                             图9. 相关系数过滤

                                                                图10. P值过滤

7,导入cytoscape

拷贝这28行数据,粘贴到一个txt文件中。然后打开cytoscape软件,导入这个txt文件。在弹出的窗口中选择source和target。

                                                                     图11.导入txt

                                图12. 选择source和target,其中lncRNA为source,mRNA为target

                                                                    图13. 默认网络图

8. 网络图美化

经过对颜色,节点形状,线型,布局等的简单美化后,获得最终的lncRNA-mRNA共表达网络图(图12)。由于每个人的审美不同,因此这里需要花费大量的时间进行美化,有些研究者还会使用AI等软件给网络图添加背景色等进行进一步优化。

                                                        图14. 简单美化后的网络图

微生信助力高分文章,用户66000+,引用860+

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/156735.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

内存函数细节及实现

1、memcpy内存拷贝 不仅可以拷贝&#xff0c;还可以拷贝整型、结构体等&#xff0c;因为直接拷贝了内存。 因为不知道要拷贝的类型是什么&#xff0c;所以都用void*来接收。num是拷贝的字节数 拷贝时可任意选择dest&#xff0c;src&#xff0c;以及字节数。返回void*类型的指…

01什么是FPGA?

FPGA 是一种硬件可重构的体系结构。它的英文全称是Field Programmable Gate Array&#xff0c;中文名是现场可编程门阵列。 FPGA就是一个可以通过编程来改变内部结构的芯片&#xff0c;FPGA常年来被用作专用芯片&#xff08;ASIC&#xff09;的小批量替代品&#xff0c; 同时也…

PMP考试流程是怎么样的?

别的问题我可能不太了解&#xff0c;但考试流程我绝对是非常清楚了&#xff01;话不多说&#xff0c;直接放流程给到大家&#xff0c;好歹通过考试了&#xff0c;基本的情况还是能给大家讲解一下的。希望能够给有需要的同学提供点帮助。 先把考试的流程看仔细了&#xff0c;之…

核心乐理---音程名称

定义 音程是连个音之间的距离&#xff0c;是音乐中的距离&#xff0c;可以便于我们描述音符间的距离&#xff0c;便于与他人进行沟通交流。 就好像是厘米&#xff0c;米这些这些物理中的长度单位一样 度 度是音程的单位。 从一个音的名字念到另一个音的名字&#xff0c;一共念…

瑞幸“复制”拼多多

&#xff08;图片来源于网络&#xff0c;侵删&#xff09; 来源 | 螳螂观察 文 | 叶小安 在电商界&#xff0c;拼多多杀出阿里京东围剿重围&#xff0c;奠定现今电商行业“猫狗拼”三分天下的格局&#xff0c;这是多少后辈们参考的范本。 在咖啡界&#xff0c;瑞幸凭借低价…

ESP32基于Arduino框架,SD卡+MAX98357模块+MP3播放器

ESP32基于Arduino框架&#xff0c;SD卡MAX98357模块MP3播放器&#x1f3ac;原创作者的制作教程讲解以及源码&#xff1a; 35 ESP32之简单的完整功能SD卡MP3播放器的制作讲解&#xff08;ESP32-audioI2S库介绍&#xff09;- 基于Arduino链接&#xff1a;https://pan.baidu.com/s…

黑产系列02-黑产画像

黑产无利不起早&#xff0c;在利益的驱动下黑产几乎是屡禁不止&#xff0c;作为风控从业人员我们需要全方位的了解黑产&#xff0c;了解我们的对手&#xff0c;才能知己知彼&#xff0c;接下来我将结合我多年风控经验以及查阅的相关的资源&#xff0c;全方位介绍下黑产以及他们…

matplot绘制动图

import matplotlib.pyplot as plt from matplotlib.animation import FuncAnimation import numpy as np plt.rcParams[axes.unicode_minus] False plt.rcParams[font.sans-serif] SimHei# 准备数据 x np.linspace(0,3*np.pi,100) y1 np.sin(x) y2 np.cos(x)#创建画布和子图 …

Python用yield from 实现异步协程爬虫

文章目录一、什么是yield二、yield于列表的区别三、yield from 实现协程一、什么是yield 如果还没有怎么用过的话&#xff0c;直接把yield看做成一种特殊的return&#xff08;PS&#xff1a;本质 generator&#xff08;生成器&#xff09;&#xff09; return是返回一个值然后…

Python网络编程中getservbyport和getservbyname函数的用法

在Python的网络编程中&#xff0c;getservbyport()函数和getservbyname()函数是socket模块中的两个函数&#xff0c;因此在使用这两个函数时&#xff0c;需要导入socket模块。1 getservbyname()函数getservbyname()函数的作用是通过指定服务的名称获取该服务对应的端口号。相关…

BI工具+方案,这是要将大数据分析包了的节奏啊

BI工具是一个为企业提供大数据智能可视化分析功能板块的平台。虽然它提供了包括智能钻取、内存行列计算、多维动态分析等多种智能数据分析功能板块&#xff0c;但工具毕竟是工具&#xff0c;要真正地为企业所用&#xff0c;还需要针对企业的业务发展情况、数据分析需求等制定数…

用ode45解一个带有积分的微分方程(integro-differential equations)

一、问题提出: 这个方程来源于mathworks的论坛 l 这种方程叫 integro-differential equations ,大致是带有 integral term的微分方程。积分肯定是定积分,这类方程有的是变上限的积分,上下限是x或者其他微分的函数。 按照惯例,先分析。积分区间是0-1,x是自变量,y是应…

2022年终总结——工作第五年

2022是本命年&#xff0c;对我来说今年勉强可以算得上是一切顺利吧。 前几年的年终总结 先验收下去年的期望吧 去年的期望还是挺多的嗷&#x1f643; 1、关于订婚和云南一周游 ✅ 今年大概2月底开始上海疫情开始变得很严重&#xff0c;然后就是漫长的三个月封控&#xff0c;…

1.1.3 java学习的环境准备

文章目录1 相关文件准备及下载1.1 JDK下载1.2 开发工具下载1.2.1 eclipse1.2.2 idea2 JDK安装及配置2.1 JDK配置方法一2.2 JDK配置方法二3 eclipse软件安装及配置4 JDK JRE JVM解释&#xff1a;5 关于手写代码1 相关文件准备及下载 1.1 JDK下载 Oracle公司为常见的计算机系统…

【论文速递】ECCV2022 - ConMatch:置信度引导的半监督学习

【论文速递】ECCV2022 - ConMatch&#xff1a;置信度引导的半监督学习 【论文原文】&#xff1a;ConMatch: Semi-Supervised Learning with Confidence-Guided Consistency Regularization 获取地址&#xff1a;https://arxiv.org/abs/2208.08631博主关键词&#xff1a; 半监…

P8630 [蓝桥杯 2015 国 B] 密文搜索

题目描述 福尔摩斯从 X 星收到一份资料&#xff0c;全部是小写字母组成。 他的助手提供了另一份资料&#xff1a;许多长度为 88 的密码列表。 福尔摩斯发现&#xff0c;这些密码是被打乱后隐藏在先前那份资料中的。 请你编写一个程序&#xff0c;从第一份资料中搜索可能隐藏密码…

八大排序算法(C语言实现)

文章目录&#xff1a;1.排序的概念2.常见八大排序算法3.插入排序3.1直接插入排序3.2希尔排序4.选择排序4.1直接选择排序4.2.堆排序5.交换排序5.1冒泡排序5.2快速排序5.2.1快排递归实现5.2.1.1Hoare法&#xff08;霍尔法&#xff09;5.2.1.2挖坑法5.2.1.3双指针法5.2.2快排迭代实…

最火的聊天回复神器

客服高效回复容易收获用户的好感&#xff0c;也更容易将客户转化成功&#xff0c;借助聊天回复神器&#xff0c;可以助力客服高效快捷地回复。 前言 经常网购的用户&#xff0c;一定会发现在联系客服咨询产品相关问题时&#xff0c;刚把问题发出去&#xff0c;马上就可以收到客…

three.js入门-一些基础理论|大帅老猿threejs特训

前言 参加了threejs直播课。 本篇文章为入门理论部分笔记。 可以学到什么&#xff1a; 一、软能力 1. 系统全流程理解web3D 应用/数字孪生/元宇宙&#xff0c;程序开发与3D美术资源制作 2. 建立与3D美术团队良好沟通协作能力 3. 良好把控3D画面效果和性能平衡 4. 培养程…

数据分析师:星图Stagraph 2.1 Crack

Stagraph 是一个用于数据导入 - 数据整理 - 数据可视化的复杂软件工具。面向数据工程师、数据分析师、数据科学家、统计学家和其他“数据专业人员”的专业软件。在简单易用的可视化界面中提供最新数据科学工具的强大功能。采集 by Ω578867473 降低 降低处理数据的复杂性。使用…