1. 正态分布检验
2. 统计检验
正态分布且方差齐 | 非正态分布或方差不齐 | |||
para test | non-para test | |||
non-paired | paired | |||
2组 | t-test | Wilcoxon rank-sum test | Wilcoxon signed-rank test | |
3组及以上 | One way ANOVA | Kruskal-Wallis test |
t-test:
Paired t-test: 确定某个总体的成对测量值之间的差异是否为 0
Two-sample t-test (independent t-test): 确定两个不同组的总体均值是否相等
One-sample t-test: 确定总体均值是否等于特定的值
One way ANOVA:
Wilcoxon test:
Wilcoxon rank-sum test: 一般用来检测 2 个独立的数据集是否来自于相同分布的总体
“秩” 其实就是 “排名” 的意思,“秩和” 当然就是指 “将排名进行求和” 的操作。在秩和检验中,我们不要求被检验的 2 组数据包含相同个数的元素,换句话说,秩和检验更适用于非成对数据之间的差异性检测。
应用实例: 假设我们有 2 组数据 x1中有3个元素,x2中有4个元素,如下表:
x1 | 总排名rank | x2 | 总排名rank |
1 | 1 | 2 | 2.5 |
3 | 4 | 4 | 6 |
2 | 2.5 | 6 | 9 |
4 | 6 | 5 | 8 |
4 | 6 |
1. 将数据从小到大排名,并计算排名之和
x | 1 | 2 | 2 | 3 | 4 | 4 | 4 | 5 | 6 |
rank | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
注:当我们计算若干等值元素的排名时,会用这些元素排名的平均值作为它们在整个序列中的排名
rank(2) = (2 + 3) / 2 = 2.5
rank(4) = (5 + 6 + 7) / 3 = 5
排名之和:
R1 = 1 + 4 + 2.5 + 6 + 6 = 19.5
R2 = 2.5 + 6 + 9+ 8 = 25.5
2. 令n1和n2分别表示两组数据的个数,即n1 = 5, n2 = 4
令T表示小样本的排名和,即 T = R1 = 19.5
根据公式计算U1和U2:
由于U2更小,我们依此来查 Wilcoxon 双尾临界表,当alpha = 0.05,n1 = 5,n2 = 4时的临界值是
Wilcoxon signed-rank test:
Kruskal-Wallis test: