网站:http://www.sxdyc.com/diffTtestAnalyse
一、t-test简介
t检验,亦称student t检验(Student’s t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。适用条件 为:(1) 已知一个总体均数;(2) 可得到一个样本均数及该样本标准差;(3) 样本来自正态或近似正态总体。t检验可分为单总体检验和双总体检验,以及配对样本检验。
二、使用须知(几个概念)
1、单总体t检验(Single population t-test):单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。
2、双总体t检验(Double population t-test):双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验(各实验处理组之间毫无相关存在,即为独立样本),该检验用于检验两组非相关样本被试所获得的数据的差异性;一是配对样本t检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。
三、使用方法
1.打开网址(http://www.sxdyc.com/singleCollectionTool?href-diff),选择“tTest差异分析”
- 准备数据:一个全基因的表达谱矩阵,其中行为基因,列为样本
一个样本分组信息,包含两列,第一列为样本名,第二列为分组情况。
- 输入“比较的组名”和“被比较的组名”,点击提交
这里输入的是比较组为C1,被比较组为C2,代表该差异分析为C1vsC2
4.输入分析队列名,点击提交
5.等待完成,查看结果
结果需要注意的是:列名错位,A列其实是基因,B为logFC,C为PValue,D为FDR
四、分析tTest差异分析
- logFC中的FC即 fold change,表示两样品(组)间表达量的比值,对其取以2为底的对数之后即为logFC。
- adj.P.Val即False Discovery Rate,错误发现率,是通过对差异显著性p值(p-value)进行校正得到的。
注意:在自测数据中,由于样本较少,在选择差异分析时,t检验用的比较多
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据