卡方检验的基本原理详解

news2024/12/27 1:30:14

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 一、卡方检验基本原理
    • 1. 1 χ2统计量计算公式
    • 1.2 理论频数如何计算?
    • 1.3 χ2值的结果如何理解?
    • 1.4 χ2检验的自由度如何理解?
    • 1.5 χ2检验的步骤
    • 1.6 四格表专用公式
    • 1.7 为什么在样本量较小或理论频数较小时,不能使用χ2检验?
  • 二、配对χ2检验
    • 2.1 什么是配对?
    • 2.2 配对χ2的统计量
    • 2.2 配对χ2检验的步骤
  • 三、行*列资料的χ2检验
    • 3.1 行*列资料的χ2检验统计量
    • 3.2 行*列资料的χ2检验步骤
    • 3.3 行*列资料的χ2检验的应用
    • 3.4 R*C表χ2检验的注意事项
    • 3.5 R*C表资料的检验方法选择
  • 四、多样本率间的多重比较
  • 五、CMH χ2统计量(Cochran-Mantel-Haenszel χ2检验)
    • 5.1 CMH χ2统计量的分类
  • 五、拟合优度检验


一、卡方检验基本原理

比较试验组和对照组的疗效(有效率),将200例患者1:1随机分配为两组,结果如下:
在这里插入图片描述
abcd的四个数组成了四格表(fourfold table),也称列联表(contingency table)。
比较试验组和对照组的有效率是否有差异?即试验组85.29%的有效率与对照组66.33%之间是否有统计学差异?(目的)
两样本率的比较,用chi-square检验两样本总体率是否有差异。(方法)

1. 1 χ2统计量计算公式

在这里插入图片描述

1.2 理论频数如何计算?

基于原假设H0:π1=π2确定。即试验组和对照组的有效率相等。
总体的有效率:(a+c)/(a+b+c+d) 152/200=76%
a理论频数:(a+b)76% 10276%=77.52
c理论频数:(c+d)76% 9876%=74.48
理论频数计算公式:
在这里插入图片描述
在这里插入图片描述

1.3 χ2值的结果如何理解?

在这里插入图片描述

1.4 χ2检验的自由度如何理解?

χ2检验的自由度v取决于自由取值的格子数,不是样本量。四格表只有两行两列,v=1。当周边合计固定的情况下,4个数只有一个可以自由取值。计算出一个理论频数后,其他3个可以通过周边合计计算出来。

1.5 χ2检验的步骤

Step1:建立假设
H0:π1=π2 即试验组与对照组有效率相等
H1:π1≠π2 即试验组与对照组有效率不相等
α=0.05

Step2:计算理论频数,统计量
χ2= 9.8582
Step3:根据自由度查χ2检验界值表,在α水平下,得出结论
p=0.0017 p<0.05
拒绝H0,接受H1,试验组和对照组有效率不相等。

1.6 四格表专用公式

在这里插入图片描述
在这里插入图片描述
公式的使用方法
(1) n≥40,且所有的T≥5(理论频数)时,用χ2基本公式或四格表专用公式。P≈α,采用Fisher确切概率法。
(2) n≥40,且所有的1≤T≤5时,用校正公式,或用Fisher确切概率法。
(3) n<40,或T<1时,用Fisher确切概率法。

1.7 为什么在样本量较小或理论频数较小时,不能使用χ2检验?

χ2分布是一个连续的分布,只有一个参数,自由度。
计数资料的实际频数是分类资料,是不连续的,计算的χ2值是离散型分布。当样本量很小的时候,计算出的概率偏小。因此需要校正。
在这里插入图片描述

二、配对χ2检验

2.1 什么是配对?

对样本中各观察单位(每个患者)分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果。处理包括:两种检验方法、培养方法、诊断方法等。
a:A方法和B方法均检验为阳性的例数
b:A方法阳性,B方法阴性的例数
c:A方法阴性,B方法阳性的例数
d:A方法和B方法均检验为阴性的例数
a和d为两种方法一致的情况,c和b为两种方法不一致的情况。
两种方法无差别时,b=c。
在这里插入图片描述

2.2 配对χ2的统计量

在这里插入图片描述

说明:当n很大且a和d的数值很大(两方法抑制率较高),b和c的数值相对较小,即便检验结果有统计学意义,其实际意义往往不大,该方法不适用。因为该方法仅考虑了两方法不一致的情况(b、c),未考虑样本含量n和两方法一致的情况(a、d)。

2.2 配对χ2检验的步骤

Step1:建立假设
H0:B=C 即两种方法检测结果相同
H1:B≠C 即两种方法检测结果不相同
α=0.05

Step2:计算理论频数,统计量
因b+c<40,所以采用校正公式。
χ2=(|12-2|-1)^2/(12+2) = 5.79
Step3:根据自由度查χ2检验界值表,在α水平下,得出结论
p<0.05,拒绝H0,接受H1,试验组和对照组有效率不相等。

三、行*列资料的χ2检验

3.1 行*列资料的χ2检验统计量

在这里插入图片描述

3.2 行*列资料的χ2检验步骤

Step1:建立假设
H0:π1=π2 =π3 即3种方法的有效率相等
H1:π1≠π2≠π3 即3种方法的有效率不全相等
α=0.05

Step2:计算统计量
χ2= 21.04 v=(3-1)*(2-1)=2
Step3:根据自由度查χ2检验界值表,在α水平下,得出结论
p<0.05
拒绝H0,接受H1,3种治疗方法有差别。

3.3 行*列资料的χ2检验的应用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.4 R*C表χ2检验的注意事项

(1) 行列表中理论频数太小(T<1,1≤T≤5的格子数超过1/5),解决方法:
1、 增加样本量,扩大理论频数;
2、 根据专业知识合并或删除
3、 双向无序R*C表的Fisher确切概率法。

(2) 多样本率的比较,拒绝H0,仅认为各总体率之间总的来说是有差异的,不能说明任一两个样本之间存在差异。

(3) 有序分类资料不宜用χ2检验,因为行列表的χ2检验与分类变量的顺序无关,行列的频数互换,所得的χ2值是不变的,但对于有序分类变量这是不妥的。根据分类类型和研究目的选择恰当的检验方法(秩和检验)。

3.5 R*C表资料的检验方法选择

(1) 双向无序:多样本率、构成比的比较,两分类变量之间的关联性(独立性)检验。

(2) 单向有序(看指标变量是否是有序的)
1、 R有序,C无序:分组变量(年龄)有序,指标变量(疾病种类)无序,研究分析不同年龄组各疾病的构成情况,采用χ2检验。
2、 R无序,C有序:分组变量(治疗方法)无序,指标变量(严重程度)有序,比较不同治疗方法的疗效,采用秩和检验。

(3) 双向有序(属性相同):四格表配对资料的扩展,两种方法同时对一批样本的测定结果。研究目的是分析两种检测方法的一致性,采用一致性检验或Kappa检验。

(4) 双向有序(属性不同)
1、 分析目的与分组的序列无关,将其视为单项有序R*C资料。不同年龄组患者之间疗效是否有差异。采用秩和检验。
2、 分析两个有序分类变量之间是否存在相关关系,采用等级相关分析。
3、 分析两个有序分类变量之间是否存在线性变化趋势,采用线性趋势检验。

四、多样本率间的多重比较

多样本率的比较的R*C表χ2检验,拒绝H0,接受H1时,只能认为总体率有差别,不能认为任一两两有差异。进一步推断具体哪两个有差异,不能直接进行两两χ2检验,会增加I类错误。采用χ2分割法,Scheffe’可信区间法,SNK法。

χ2分割法基本原理
重新规定检验水准,目的是控制I类错误,保证α不变。
α^'=α/比较次数
(1)多个实验组两两比较
比较次数=(k(k-1))/2+1 k=组别数
(2)多个实验组与同一个对照组比较
比较次数=2(k-1) k=组别数
在这里插入图片描述

五、CMH χ2统计量(Cochran-Mantel-Haenszel χ2检验)

高维列联表的分析,控制了某一个或几个混杂因素(分层变量)之后,检验二维R*C表中行变量X与列变量Y之间是否存在统计学关联。
H0:任一层的行变量与列变量均不相关
H1:至少存在一层行变量与列变量均相关
当各层行变量与列变量相关的方向不一致时,CMH统计量的检验效能较低。

5.1 CMH χ2统计量的分类

(1) 相关统计量
X、Y均为有序变量,自由度为1。

(2) 方差分析统计量(行平均得分统计量)
Y为有序变量,自由度为R-1。
H0:所有层的各行Y变量平均得分均相等
H1:至少又一层各行Y变量平均得分均不相等
一维R*C列联表=各行Y变量平均得分的方差分析
秩和检验:Kruskal-Wallis检验。

(3) 一般关联统计量
X、Y均为无序分类资料,目的是检验是否有关联性。
分层变量校正的Pearson χ2统计量。自由度(R-1)*(C-1)。
CMH χ2统计量(以四格表为例)
第h层的四格表
在这里插入图片描述
在这里插入图片描述

五、拟合优度检验

推断频率分布是否符合某一理论分布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/170822.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Arduino开发串口控制ESP8266 RGB LED

根据板卡原理RGB三色LED对应引脚&#xff1a;int LEDR12、int LEDG14、int LEDB13;设置串口波特率为115200Serial.begin(115200);源代码如下所示&#xff1a;/*名称&#xff1a;串口控制RGB亮灭实验功能&#xff1a;通过串口输入R、G、B三个字母来点亮对应的LED灯&#xff0c;关…

Java集合进阶——Map

一、Java Map集合详解 Map集合概述和特点 概述&#xff1a; 将键映射到值的对象 一个映射不能包含重复的键 每个键最多只能映射到一个值 Map接口和Collection接口的不同 Map是双列的,Collection是单列的 Map的键唯一,Collection的子体系Set是唯一的 Map集合的数据结构针对键有…

放假第三天

假期 # 生活 # 水文 咱们继续假期第三天的日常更文&#xff0c;没看上篇的铁子们我把地址贴在下面。 点我 虽然是假期&#xff0c;但我规划已久的睡懒觉流程却是一直执行不下去。这不今天早上八点我就起床了&#xff0c;当然起的早不是为了“卷”&#xff0c;而是吃早餐。说出…

Python操作 JWT(python-jose包)、哈希(passlib包)、用户验证完整流程

一、JWT简介 JWT是什么&#xff1f; JWT 即JSON 网络令牌&#xff08;JSON Web Tokens&#xff09;。 JWT(JSON Web Token) 是一种用于在身份提供者和服务提供者之间传递身份验证和授权数据的开放标准。JWT是一个JSON对象&#xff0c;其中包含了被签名的声明。这些声明可以是…

电脑开机出现绿屏错误无法启动怎么办?

电脑开机出现绿屏错误无法启动怎么办&#xff1f;有用户电脑开机的时候&#xff0c;突然出现了屏幕变成绿色的情况&#xff0c;而且上面有很多的错误代码。然后卡在页面上一直无法进入到桌面&#xff0c;重启电脑后依然无效。那么如何去解决这个问题呢&#xff1f;来看看具体的…

Java---Spring---SpringCache

SpringCache入门学习SpringCache介绍SpringCatch常用注解SpringCatch使用1.导入maven坐标2.配置application.yml3.在启动类上加入EnableCaching注解&#xff0c;开启缓存注解功能4.在controller的方法上加入Cacheable,CacheEvict等注解&#xff0c;进行缓存操作缓存穿透定义解决…

【Nginx】入门看这一篇就够啦,nginx 简介、安装、工作原理、工作方式、详解配置文件

目录 1、nginx 简介 2、nginx的工作原理 3、nginx 工作方式 4、nginx 安装 命令行安装 卸载命令 从源码构建 查看版本 测试启动 5、详解nginx配置文件 第一部分&#xff1a;全局块 第二部分&#xff1a;events块 第三部分&#xff1a;http 6、hosts 文件简介 1、…

解析Activity启动-窗口篇

解析Activity启动-窗口篇 在 解析Activity启动 前两篇文章中&#xff0c;我们分别专注于 堆栈 和 生命周期角度大致的过了一遍启动流程&#xff0c;而本篇会着重窗口的创建和显示流程&#xff0c;继续梳理Activity的启动流程 顺着前两篇文章的分析流程&#xff0c;我们知道和 …

DBCO高分子PEG_DBCO-PEG-Lipoic COOH_二苯并环辛炔-聚乙二醇-硫辛酸

DBCO-PEG-Lipoic acid“点击化学"一般由叠氮化物&#xff08;azide&#xff09;和炔烃&#xff08;alkyne&#xff09;作用形共价键&#xff0c;具有高效稳定&#xff0c;高特异性等优点。反应不受PH影响&#xff0c;能在常温条件下的水中进行,甚至能在活细胞中进行。DBCO…

第十三届蓝桥杯省赛 JAVA A组 - 矩形拼接

✍个人博客&#xff1a;https://blog.csdn.net/Newin2020?spm1011.2415.3001.5343 &#x1f4da;专栏地址&#xff1a;蓝桥杯题解集合 &#x1f4dd;原题地址&#xff1a;付账问题 &#x1f4e3;专栏定位&#xff1a;为想参加蓝桥别的小伙伴整理常考算法题解&#xff0c;祝大家…

Python学习中的六个技巧小结

1. 引言 “Beautiful is better than ugly.” 上述为著名的The Zen of Python的第一句话&#xff0c;也是有追求的python开发人员的信条之一。 所以我们的问题来了&#xff1a; 如何编写漂亮的Python代码? 本文重点通过九个示例向大家展示Python中的六个小技巧&#xff0c;以帮…

java后端-servlet超详细入门

java后端介绍今天我正式开始了一个新话题&#xff0c;那就是 Web。目前我主要会介绍后端。作为后端的老大哥 java&#xff0c;也有很多后端框架&#xff0c;比如大家耳熟能详的 spring 等。今天来带大家入门 servlet&#xff0c;不管是学生&#xff0c;刚毕业或是已经工作自学编…

【倍增】魔力小球

今天最后一篇&#xff0c;该睡了&#xff0c;怕猝死QwQ学校OJ上的一道模板题&#xff0c;去年不会做&#xff0c;今年还是不会做嘻嘻&#xff0c;还好最后调出来了&#xff0c;错的原因竟然是题目有歧义这个小球i的i是他喵的小球编号&#xff0c;不是id&#xff01;出题人是懂出…

Win11的两个实用技巧系列之电脑system占用高的解决办法

Win11 system占用cpu过高是什么原因? Win11电脑system占用高的解决办法Win11 system占用cpu过高是什么原因&#xff1f;Win11系统遇到system占用cpu很高&#xff0c;该怎么解决呢&#xff1f;下面我们就来看看Win11电脑system占用高的解决办法System占用cpu过高导致电脑卡顿&a…

2023年中职网络安全技能竞赛网页渗透(注入版)

竞赛任务书内容 (一)拓扑图 网页渗透 任务环境说明: 服务器场景:Server2121 服务器场景操作系统:未知(封闭靶机) 用户名:未知 密码:未知 1.访问服务器网站目录1,根据页面信息完成条件,将获取到的flag提交; 2.访问服务器网站目录2,根据页面信息完成条件,将获…

学生写字台灯用什么牌子的好?高品质学生台灯品牌推荐

学生写字台灯&#xff0c;很明显就是为学生而设计的&#xff0c;针对学生长时间学习&#xff0c;用眼强度大的特点&#xff0c;这种学生台灯在设计上对灯光的亮度、样式、护眼技术都是很有讲究的&#xff0c;为的就是保护学生眼睛&#xff0c;在一定程度上缓解眼部疲劳的作用。…

进程概念理解

既然要了解计算机的进程&#xff0c;那么就需要先了解一下计算机的底层结构 目录 冯洛伊曼体系结构 操作系统 系统调用接口 进程 PCB task_struct 内容 操作系统如何组织进程 冯洛伊曼体系结构 想了解计算机的底层结构&#xff0c;那么必定绕不开冯洛伊曼体系结构&…

19/365 java 多线程

1. 基础概念 程序&#xff1a;指令集和数据的集合。&#xff08;静态&#xff09; 进程&#xff1a;对程序的一次执行。&#xff08;动态&#xff09; 对同一个程序&#xff0c;执行两次&#xff0c;那就是两个进程。 进程是系统资源分配的基本单位 线程&#xff1a;一个进程…

gma 1.1.2 (2023.01.14) 更新日志(重大更新:开始支持空间绘图)

重大更新&#xff1a;从本版本开始&#xff0c; gma 逐步 支持空间绘图功能&#xff08;依赖 matplotlib&#xff09;&#xff01; 获取 gma 1.1.2 1、百度网盘&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1eT2rJRiUDJuJkWeLJNL-cw?pwdb07n 提取码&#xff1a;b…

基于SIMULINK的动力电池CAN通信仿真教程

在真实的整车开发过程中&#xff0c;整车厂一般会先设计出整车网络架构&#xff0c;并依据此架构及ECU之间的功能交互设计网络总线数据库&#xff08;Database&#xff09;, 作为重要的技术文档&#xff0c;可以根据需 要全部或部分地公开给各个ECU供应商。也存在一些特殊情况&…