目录
- 学习目的
- 软件版本
- 原始文档
- 两组率卡方检验和Fisher确切法
- 适用条件简述
- 一、实战案例
- 读数据:
- 二、统计策略
- 三、SPSS操作
- 四、结果解读
- 第一,分组统计描述结果
- 第二,卡方检验。
- 五、规范报告
- 1、规范表格
- 2、规范文字
学习目的
SPSS第十五讲 | 两组率卡方检验和Fisher确切法怎么做?
软件版本
IBM SPSS Statistics 26。
原始文档
《小白爱上SPSS》课程
#统计原理
两组率卡方检验和Fisher确切法
适用条件简述
前面讲解的T检验,F检验和秩和检验的统计方法中,结局变量(因变量)均为连续型变量。当我们把研究数据分成两组,结局变量为二分类型数据,也就说两个变量都为二分类变量,此时可采用哪种方法呢?答案是卡方检验或Fisher确切法。
由于二分类变量往往是用概率来描述,这种数据实际上就是探讨两组率有无显著性差异,类似下面表格,探讨有无热身两组的运动损伤率有无显著性差异。
该研究核心数据有2行2列(橙色背景部分),因此称之为2*2行列表或者交叉表资料。此外,由于橙色背景的结果在表格中占据4个单元格,这样的交叉表资料被称之为四格表资料。
两个率的差异如何分析呢?
基本统计学方法有三类:z检验、卡方检验(Χ2检验,Chi-square)和Fisher确切概率法。
最常见的就是Χ2和Fisher确切概率法。
卡方检验是统计学奠基人Kar-Pearson在一百年前提出的,其基本理论是比较理论值(期望值)和实际值的吻合程度来探讨不同样本是否来源于同一个总体。
Fisher确切概率法是另外一位统计学奠基人Fisher提出,主要基于二项分布和二项分布函数,计算极端事件发生概率是否属于小概率事件的一种方法。
在SPSS软件输出结果中,主要查看卡方检验、矫正卡方检验和Fisher确切概率法。
至于查看哪个结果,一般采用以下原则:
[1]如果整个研究样本量n≥40,四个单元格(a,b,c,d)的理论值T,又称期望值(expectation)都大于或等于 5,则可采用卡方检验进行比较。
n≥40,且T ≥ 5,采用卡方检验
[2]如果整个研究样本量n≥40 ,四个单元格(a,b,c,d)的理论值T(期望值,expectation)至少有一个在1-5之间,普通的卡方检验的结果不太可靠,需要对卡方检验方法进行改进,采用校正卡方检验进行比较。
n≥40,且至少一个1≤T <5,采用校正卡方检验
[3]如果整个研究样本量n<40,或者四个单元格(a,b,c,d)的理论值T(期望值,expectation)至少小于1,则无论卡方或者校正卡方都不可靠,须采用Fisher确切概率法。
n<40或至少1个T <1 ,采用Fisher确切概率法
一、实战案例
最近大侠们练武经常运动损伤,小白探讨运动前热身(是/否)与运动损伤(是/否)之间的关系,共收集到365名大侠数据。
他应采用哪种统计分析方法?
读数据:
GET
FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十五讲:两组率的卡方检验和Fisher确切法.sav'.
二、统计策略
统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心五问。
Q1:本案例研究目的是什么?
A:比较两组概率差异。比较有无热身(分成2组)的运动损伤概率之间的差异。
Q2:比较的组数是多少呢?
A:两组数据。
Q3:本案例属于什么研究设计?
A:调查性研究,实际上也可用于实验性研究。
Q4:有几个变量?
A:有两个变量。
自变量为(有、无)热身
结局变量为(是、否)损伤。
Q5:变量类型是什么?
A:一个分组(分类)变量,分为有热身和没热身;
另一个为二分类结局变量,分成有损伤和无损伤。
概括而言,如果数据满足以下条件,则采用两组率卡方检验。
三、SPSS操作
Step1:依次点击“分析——描述统计 ——交叉表”。
Step2:在弹出“交叉表”对话框中,分别选择分组变量(热身)和结局变量(损伤)到“行”和“列”中。
说明:一般而言,我们会把分组变量放入“行”,结局变量放入“列”。事实上,哪个变量放入行和列,没严格要求,自己能看懂,理解数据就OK了。
Step3:单击右侧的“精确”按钮,点击“精确”按钮。设置完后,点击“继续”。
Step4:单击右侧的“统计”按钮,勾选“卡方”。设置完后,点击“继续”。
Step5:单击右侧的“单元格”,勾选“实测”和勾选计算百分比中的“行”。设置完后,点击“继续”。
Step6:完成上述参数设置后,在主对话框中单击“确定”按钮运行。
命令行:
CROSSTABS
/TABLES=热身 BY 损伤
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT ROW
/COUNT ROUND CELL
/METHOD=EXACT TIMER(5).
四、结果解读
卡方检验的结果有多个表格,在此讲解两个重点表格。
第一,分组统计描述结果
分别是有、没热身组各自的损伤情况,包括发生数以及相应的百分比。
第二,卡方检验。
检验结果:
要关注以下两点:
(1)表格最后一行的有效个案数是否≥40。本案例n=369。
(2)表格下方注释a的理论(期望)频数。本案例T最小值=24.42,T均值≥ 5,故选择直接查看第一行,即皮尔逊卡方。
结果显示:Χ2=13.774,渐进显著性p<0.001。
五、规范报告
规范报告有多种方式,本公众号只提供一种方式供参考。
1、规范表格
表 运动前有无热身的运动损伤率比较
2、规范文字
卡方检验结果显示,无热身组损伤率(76.1%)显著高于有热身组的损伤率(55.3%),
Χ2=13.774,p<0.001。
小白学习完了一节卡方检验课程,向主任汇报了自己实验成果。
主任看后说:“小白,你目前的实验数据只有两个自变量,如果遇到那种多组的该怎么办呀?”
小白说:“知道呀,两个自变量用两组率卡方检验,那多组的话就是多组率卡方检验啦!”
“那你会多组率卡方检验吗?”
小白赶紧查查了下一讲内容:多组率比较的卡方检验。