网站:http://www.sxdyc.com/visualsVolcano
一、火山图简介
火山图是散点图的一种,它将统计测试中的统计显著性量度(如p value)和变化幅度(logFC)相结合,能够快速直观地识别那些变化幅度较大且具有统计学意义的数据点(基因等)。在生物信息分析中,火山图是非常常见的一种数据展示形式。由于火山图可以非常清晰的展示出哪些基因在不同样本中是具有差异表达显著性的基因,因此在生物医学中,常应用于病例和对照组的转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。
二、使用须知(几个概念)
差异倍数(fold change):简单来说就是基因在一组样品中的表达值的均值除以其在另一组样品中的表达值的均值。所以火山图只适合展示两组样品之间的比较。
校正后的P值(adjusted P-value):做差异基因检测时,要对成千上万的基因分别做差异统计检验。统计学家认为做这么多次的检验,本身就会引入假阳性结果,需要做一个多重假设检验校正。用每一次统计检验获得的P-value都乘以总的统计检验的次数即获得adjusted P-value。
三、使用方法
打开网址(http://www.sxdyc.com/singleCollectionTool?href-diff),选择“火山图”
准备数据,需要三列数据,第一列为基因,第二列为差异倍数(logFC),第三列为校正后的P值(adj.P.Val),数据格式用为txt文本,以制表符分割
输入差异倍数阈值和p的阈值,选择颜色,从左到右表达下调,非差异,表达上调的颜色,点击提交。
这里需要注意的是如果想显示基因名,就可以单独做一个txt的文件,把需要显示的基因名文件传上去即可!
当然可以修改X轴的名字,y轴的名称,以及选择绘图的样式
输入分析队列名,点击提交,等待完成,查看结果
样式一:
样式二:
四、分析火山图
火山图本质上为一个散点图,每一个点都是一个基因。火山图只能用差异分析的结果做吗?其实不然,还有一部分用单变量cox分析的结果来做,将原来的logFC和p转化为,HR和p值即可。
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据