一、Mann-Whitney检验
在R语言中,Mann-Whitney U检验(也称为Wilcoxon秩和检验)用于比较两个独立样本的中位数是否存在显著差异。它是一种非参数检验,适用于数据不满足正态分布假设的情况。
1、独立样本
# 创建两个独立样本数据
group1 <- c(5, 6, 7, 8, 9)
group2 <- c(3, 4, 5, 6, 7, 8)
# 执行Mann-Whitney U检验
result <- wilcox.test(group1, group2)
result
W = 22:是Wilcoxon秩和检验的统计量W的值。这个值反映了两个样本在秩次上的相对位置。
p-value = 0.231:检验的p值。p值用于判断结果的显著性。p值为0.231,大于常用的显著性水平0.05,因此不能拒绝零假设。
alternative hypothesis:true location shift is not equal to 0:表明备择假设是两个样本的中位数(或位置参数)之间存在显著差异。由于p值大于0.05,我们没有足够的证据支持备择假设,即不能认为两个样本的中位数之间存在显著差异。
2、非独立样本
当两组数据室非独立样本,且不满足非独立样本t检验时,也可使用wilcox.test()函数,但需要令参数paired=TRUE,这样它将执行Wilcon秩和检验。
# 用安眠药对增加睡眠时长效果做例子
head(sleep)
wilcox.test(extra ~ group, data=sleep, paired=TRUE, alternative="less")
p-value = 0.004545:检验的p值。p值非常小,远小于常用的显著性水平0.05,表明观察到的数据差异在统计上是显著的。
alternative hypothesis: true location shift is less than 0:表明备择假设是两个配对样本的中位数差异(或位置参数的差异)小于0。这意味着假设在配对组中,第二个测量值通常小于第一个测量值。
二、Kruskal-Waillis检验
在R语言中,Kruskal-Wallis检验是一种非参数检验方法,用于比较三个或更多独立样本的中位数是否存在显著差异。这个检验是Mann-Whitney U检验在多组样本情况下的扩展,不假设数据服从正态分布。
# 设置随机种子以确保结果可重复
set.seed(123456)
# 创建三个分组变量,每组20个观测值
group <- factor(rep(c("A", "B", "C"), each = 20))
# 创建响应变量,每个组的均值不同
values <- c(rnorm(20, mean = 5), rnorm(20, mean = 6), rnorm(20, mean = 7))
# 执行Kruskal-Wallis检验
result <- kruskal.test(values ~ group)
result
df:自由度,通常是组数减1。
p-value:用于判断结果的显著性。如果p值小于显著性水平(如0.05),则拒绝零假设,认为至少有两个组的中位数存在显著差异。
alternative:备择假设的类型(通常是双侧的,即任何组之间的中位数差异都不为零)。