之前我们提到R×C列联表资料,列联表根据变量是否有序可以分为双向无序、单项有序、双向有序列联表,他们的统计方法是不同的
一、双向无序列联表
双向无序列联表是指行、列变量均为无序的列联表,比如不同污染地区的动物畸形率是否有差异?如下表:
对于这种数据,我们的统计目的是分析行列变量的独立性,可选用的方法有以下两种:
1、Pearson卡方检验:
基于卡方分布,H0为行、列变量相互独立, 使用条件:各个单元格理论值均大于5。详见【统计课堂】SPSS中级统计--S05-4卡方独立性检验之n×c表资料(双向无序))
2、Fisher精确概率:
基于超几何分布,当数据不满足Pearson卡方检验时使用。
SPSS中的实现:1.“数据加权”,2.“分析”-“描述性统计”-“交叉表”,3.参数设置:①“统计”-选择卡方;②点击“精确”-勾选“精确(E)”;
注意:在SPSS中,如果是整理成了列联表资料,需要用频数进行数据加权。
二、单项有序列联表
单项有序列联表常见的情况是结果变量有序,而原因变量无序;例如:研究三种药物治疗糖尿病效果,660例患者随机分成3组,药物A、B、C分别220例,治疗效果如下图:
这种数据我们选用的统计分析方法有:
1、Mann–Whitney U 检验:(用于分组为两组的情况)
基于卡方分布,H0为两组总体分布一致,SPSS中“分析->非参数检验->独立样本”中可实现。具体实现方法参见:【视频教学】SPSS中级统计--S03-5两个独立样本检验(Mann-Whitney U检验法)
2、Kruskal-Wallis H检验:(用于分组数大于2的情况),比如要比较3种或以上药物的疗效。实现方法与Mann–Whitney U 类似。具体实现方法参见:【视频教学】SPSS中级统计--S03-6K个独立样本检验Kruskal-Wallis H检验
注:如果是原因变量为有序变量的单向有序R×C表资料,可以将其视为双向无序的R×C表资料而选用一般的χ2检验。
三、双向有序
1.双向有序且属性不同
例如:某医院为研究某老年性疾病的严重程度与患者年龄之间的关系,调查数据如下表:
本例中行、列都是有序的,这是我们主要关心的:行列变量之间受否有相关性,如果有相关性,是线性相关还是曲线关系。可以选择的方法如下:
(1)Spearman等级相关:检验有无相关性,在SPSS中“分析->相关->双样本”中可实现。
(2)线性趋势卡方检验:检验有无线性关系,SPSS“分析->交叉表”卡方结果表格中的“线性和线性组合”就是。
补充:如果研究者希望考察原因变量与结果变量之间是否存在线性相关关系,此时需要选用处理定性资料的相关分析方法如Spearman秩相关分析方法等。如果两个有序变量之间的相关关系具有统计学意义,研究者希望进一步了解这两个有序变量之间的线性关系,此时宜选用线性趋势检验。如果研究者希望考察列联表中各行上的频数分布是否相同,此时宜选用一般的卡方检验。
2、行列有序且属性相同
①一致性检验:
在分析这类资料时,实验者的目的如果主要是研究两种处理方法检测结果之间是否具有一致性,因此常用的统计分析方法为一致性检验或Kappa检验。比如两名医生对200名患者疾病的判断是否一致:
甲医生 | 乙医生 | ||
低分化 | 中度分化 | 高度分化 | |
低分化 | 45 | 15 | 5 |
中度分化 | 15 | 45 | 15 |
高度分化 | 10 | 20 | 30 |
SPSS中的实现:1.“数据加权”,2.“分析”-“描述性统计”-“交叉表”,3.参数设置:“统计”-Kappa;
Kappa值的专业意义如下:Kappa≥0.75时,表明两者一致性较好;0.75>Kappa≥0.4时,表明一致性一般;Kappa<0.4时,表明两者一致性较差。
②差异性检验
以上案例我们分析的是两个以上的判断是否一致,我们采用Kappa一致性检验,如果我们分析两名医生的判断是否有差异时,我们需要采用McNemar配对卡方检验;之前t检验我们提到,配对t检验主要用于计量资料的比较;当效应指标为计数资料时,则需采用配对设计卡方检验(McNemar检验)。
SPSS中的实现:1.“数据加权”,2.“分析”-“描述性统计”-“交叉表”,3.参数设置:“统计”-“McNemar(M)”;
☆ END ☆
下期内容
卡方拟合性检验