Fisher卡方
卡方检验研究数据的独立性,在分析样本量较少(比如小于40),也或者期望频数出现小于5时,此时使用fisher卡方检验较为适合。SPSSAU医学研究模块中的卡方检验时,有提供2*2即4表格时提供fisher卡方检验p值,但当为R*C结构时,也或者为汇总表格数据时,可使用fisher卡方按钮单独进行计算。
fisher卡方理论依据为超几何分布,其利用排列的数学原理进行计算,在样本量较大计算量非常大,并且fisher卡方基本上均是针对小样本量数据进行计算,因而SPSSAU在总样本量大于200时依旧不提供fisher卡方检验值。
特别提示:
- SPSSAU系统中共有3处(包括通用方法->交叉卡方,医学研究->卡方检验,医学研究->fisher卡方)提供pearson卡方检验值;
- SPSSAU系统中共有2处(医学研究->卡方检验,此处仅提供2*2时fisher卡方检验值,医学研究->fisher卡方)提供fisher卡方检验。
1 背景
当前有一项HBV感染医学研究,并被试分为预防组和非预防组,共两组,并且记录阳性和阴性的数据,汇总如下表,似问两组数据HBV感染率有无差别?数据如下:
2 理论
Fisher卡方检验利用超几何分布原理进行计算,共不同与pearson卡方检验会提供卡方值和p值两项。Fisher卡方检验时仅提供p值。SPSSAU在医学研究模块->卡方检验方法中提供2*2时卡方检验,如果是汇总表格格式,也或者R*C结构时,可使用fisher卡方按钮完成计算。
3 操作
本案例操作如下,A1单元格一定要空着,并且放入的数据不包括合计数据,如下图:
4 SPSSAU输出结果
SPSSAU共输出3个表格,如下说明:
5文字分析
上表格展示出fisher卡方、pearson卡方和连续校正卡方统计量,从上表可知:fisher卡方时仅提供p值,而且从pearson卡方和连续校正卡方对应的p值来看,3个值均呈现出一致性结论即:预防组与非预防组时HPV感染情况无明显差异。
特别提示:
通常情况下:如果总样本量>40且期望频数值全部均大于5时,一般使用pearshon卡方值,如果总样本量大于40,但出现期望频数小于5的单元格时,可优先使用连续校正卡方,也或者使用fisher卡方值,如果总样本量小于40,也或者出现期望频数小于1的单元格时,此时建议使用fisher卡方检验。具体以文献为准即可,可能不同文献的标准不完全一致。
上表格展示各单元格的期望频数,上表格可以看到,非预防组阳性的期望频数为3.0<5,并且总样本量为33,因而本案例数据使用fisher卡方检验量较为适合。
上表格展示实际频数,并且可通过下拉选择切换展示效果,按频数或者按百分比展示。
6 剖析
涉及以下几个关键点,分别如下:
- 如果希望进行卡方多重比较等,需要使用SPSSAU医学研究模块里面的卡方检验功能;
- 如果总样本量大于200时,此时SPSSAU不提供fisher卡方检验量,但依旧提供perason统计量和连续校统计量。