卡方检验简介

news2024/10/8 22:47:01

Chi square test(卡方检验)是用于评价两类变量之间是否存在相关性的统计检验方法。

医疗研究会产生大量不同类型的数据,最容易识别的是定量的数据。例如,直腿抬高 (SLR) 的受试者能够将腿抬高大于 0 度,这让我们可以计算两组的平均 SLR,并进行 t 检验。但并不是所有的数据都有这种定量特性。

例如,我们可能对两种治疗后患者的主观改善感兴趣(只使用“是”或“否”回答),而不是测量个体的 SLR。我们能够计算每组的平均改善程度,并做 t 检验吗?答案是否。处理这类数据最为常用的分析方法是 Chi Square 相关性检验。下面是最简单的一个例子。

在这里插入图片描述

坐骨神经痛的患者被分成两组,分别使用推拿(SMT)和电牵引(IMT)的方法进行了治疗,治疗的分组情况和病人反馈如下:

在这里插入图片描述

在这个例子中,我们的观测值是分类的而非定量的,所以我们应当关注比例而非均值。

在这里插入图片描述

注意: p 1 + p 2 = q 1 + q 2 = 1 p_1+p_2=q_1+q_2=1 p1+p2=q1+q2=1.

我们感兴趣的统计假设总是无事发生(0 假设)。拓展到这个例子就是, p 1 = q 1 p_1=q_1 p1=q1 p 2 = q 2 p_2=q_2 p2=q2;即分组 2 中个体的分布不受分组 1 的影响。

为了测试这个假设,我们需要比较假设是真的情况下,期望值和我们实际观测值的差异。

在本例中,我们有 140 个患者认为自己改善了,相对于 390 个总患者来说,改善率为 36%。所以,如果治疗和改善之间没有联系(0 假设),那么对于每一个治疗分组,都应该有 36% 的改善率。

于是有:

在这里插入图片描述

注:括号中为 0 假设下的期望值。

获得了期望值之后,需要比较这些值和我们实际观测值之间的差距。
χ 2 = ∑ i ( O b s e r v e d i − E x p e c t e d i ) 2 E x p e c t e d i \chi^2=\sum_i \frac{(\mathrm{Observed}_i - \mathrm{Expected}_i)^2 }{\mathrm{Expected}_i} χ2=iExpectedi(ObservediExpectedi)2

计算表格如下:

在这里插入图片描述

此时, χ 2 = 32.53 \chi^2=32.53 χ2=32.53

根据 χ 2 \chi^2 χ2 的计算公式我们知道,当零假设成立时, χ 2 \chi^2 χ2 的值会比较小,反之亦然。

接下来的问题是,当 χ 2 \chi^2 χ2 多大时,我们会拒绝 0 假设?

χ 2 \chi^2 χ2 值来自于 Chi Square distribution,这个分布由一个参数决定,即自由度。自由度取决于我们分析的表的大小,可用接下来的公式进行计算。

在这里插入图片描述

我们检测的 p-value(任何 2×2 table 的卡方检验),是计算出的卡方值到坐标最右侧曲线下的面积。

查表可知,当卡方值在 6.64 时,p-value 已经小于 0.01。由于我们的值是 32.53,其 p-value 自然小于 0.01。因此,我们拒绝了 0 假设并得出结论:患者接受两种治疗方式的受益是不一样的。

在很多实验中,改善会分多个 levels。例如,让我们对使用热包的脊椎按摩 (Trt 1) 和使用冷包的脊椎按摩 (Trt 2) 治疗急性腰痛进行比较试验。我们使用了 5 个分类来描述改善的状况:

在这里插入图片描述

零假设是,两种治疗方式没有差异。

下面计算零假设下的期望值以及最终的卡方值。
在这里插入图片描述

此时,自由度为: ( 2 − 1 ) × ( 5 − 1 ) = 4 (2-1)\times(5-1)=4 (21)×(51)=4

自由度为 4 的 Chi Square distribution 如下
在这里插入图片描述

卡方为 7.43 时,p-value 是 0.1148。如果我们的显著性水平定为 0.05,则我们无法拒绝零假设。此时,结论是两种治疗手段没有显著的区别。

要进一步解释这一点,请考虑表 8,其中的数据已转换为行百分比:

在这里插入图片描述

严格地讲,这些概率分布的比例并不相同。然而考虑到数据中的随机错误,我们没有足够的证据来说明观察到的差异表明了真正的潜在差异。

最后,在使用 χ 2 \chi^2 χ2 检验时,需要遵循一些关键假设,包括了:

每个个体在表中只出现一次;
每个个体的结果独立于其他所有个体的结果;
期望值表中应该有 80% 的期望值大于 5。

参考文献

Ugoni A, Walker BF. The Chi square test: an introduction. COMSIG Rev. 1995 Nov 1;4(3):61-4. PMID: 17989754; PMCID: PMC2050386.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/14704.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[附源码]Python计算机毕业设计JAVA疫情社区管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

大黄酸偶联鸡卵白蛋白 rhein-OVA,BFNB/MEB/MEA/BFNH-OVA

产品名称:大黄酸偶联鸡卵白蛋白 英文名称: rhein-OVA 用途:科研 状态:固体/粉末/溶液 产品规格:1g/5g/10g 保存:冷藏 储藏条件:-20℃ 储存时间:1年 大黄酸是一种有机化合物&#xf…

华为机试 - 堆栈中的剩余数字

目录 题目描述 输入描述 输出描述 用例 题目解析 算法源码 题目描述 向一个空栈中依次存入正整数&#xff0c;假设入栈元素 n(1<n<2^31-1)按顺序依次为 nx…n4、 n3、n2、 n1, 每当元素入栈时&#xff0c;如果 n1n2…ny(y 的范围[2,x]&#xff0c; 1<x<1000…

Windows平台上安装MySql 5.6 /8.0等的各种问题解决办法汇总

又是几个月过去了,我依然没有更新博客,深深的内疚缠绕着我,我对不起关注我的各位朋友们,从现在开始,我又回来了,正确能频繁的给大家带来新的知识点或小技巧。 📢欢迎点赞 :👍 收藏 ⭐留言 📝 如有错误敬请指正,赐人玫瑰,手留余香!📢本文作者:由webmote 原创…

一本书读懂大数据 读书笔记(1)

集。谷歌的MapReduce和GoogleFileSystem(GFS)发布了之后&#xff0c;大数据的定义中除了 涵盖大量数据之外&#xff0c;还包括数据处理的速度。 网络搜索索引&#xff0c;批量处理和分析大量数据集&#xff0c;数据处理的速度 研究机构Gartner曾给大数据&#xff08;Big data…

照片一键换天空怎么弄?不妨试试这三个照片一键换天空方法

小伙伴们有没有遇到过这样的情况&#xff0c;好不容易遇到假期&#xff0c;约了朋友一起外出游玩&#xff0c;想要拍一些好看的照片&#xff0c;奈何天空阴沉沉的&#xff0c;导致拍出的照片不太理想&#xff0c;又不想放弃这个难得的假期&#xff0c;有没有什么方法可以换照片…

数据包取证分析笔记

地址扫描 地址扫描探测是指利用ARP、ICMP请求目标网段&#xff0c;如果目标网段没有过滤规则&#xff0c;则可以通过回应消息获取目标网段中存活机器的IP地址和MAC地址&#xff0c;进而掌握拓扑结构。 端口扫描 全连接扫描 TCP扫描 全连接扫描调用操作系统提供的connect()函…

Sentinel源码剖析之常用限流算法原理实现

1、限流算法简介 限流顾名思义&#xff0c;就是对请求或并发数进行限制&#xff1b;通过对一个时间窗口内的请求量进行限制来保障系统的正常运行。如果我们的服务资源有限、处理能力有限&#xff0c;就需要对调用我们服务的上游请求进行限制&#xff0c;以防止自身服务由于资源…

Profinet现场总线耦合器模拟量扩展IO

1.1概述 该系列 I/O 模块是分布式 I/O 系统中的必备组件&#xff0c;需要与合适的耦合器&#xff08;例如 BL200 系 列&#xff09;组合才能将现场设备或过程连接起来&#xff0c;实现对现场数据采集、监视和控制。 该系统需要使用电源模块提供 24VDC 系统电压和 24VDC 现场…

递归经典例题 --- 汉诺塔(图文详解)

目录 一、介绍 二、游戏规则 三、玩法简介 四、算法分析 五、代码解析 六、源码 七、递归过程详解 一、介绍 汉诺塔&#xff08;Tower of Hanoi&#xff09;&#xff0c;又称河内塔&#xff0c;是一个源于印度古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱…

为什么面试官狂问八股文?我已经被三家公司问到哑口无言……

秋招刚过去&#xff0c;整体的感受是&#xff1a;面试难度和拿 offer 的难度比往年难多了&#xff0c;而且互联网还有较大的裁员风险&#xff0c;网上各种消息不断&#xff0c;有时候真是焦虑到不行。 大家还是要早做准备&#xff0c;多面试积累经验&#xff0c;有些人总想准备…

蓝牙技术|蓝牙标准将迈向 6GHz 频段,蓝牙技术迈向新台阶

蓝牙特别兴趣小组&#xff08;SIG&#xff09;今天宣布了新的规范开发项目&#xff0c;以定义蓝牙低功耗&#xff08;LE&#xff09;在额外的非授权中频段的操作&#xff0c;包括 6GHz 的频段。蓝牙技术是世界上部署最广泛的无线标准&#xff0c;每年有超过 50 亿件产品出货。其…

实验五可编程并行接口8255

目录一、实验目的二、实验内容三、实验报告四、运行结果一、实验目的 通过实验&#xff0c;掌握8255工作方式的设定及并行口输入输出的方法。 二、实验内容 电路连接&#xff1a; C口&#xff08;PC0~PC7&#xff09;⟺⟺逻辑电平开关&#xff08;K0~K7&#xff09; PC0⟺K0…

HTML5响应式网页设计——核心技能考核示例(用于2022年11月H5考核)

目录 基础Base.css引入(5分) Base.css编码 项目关键词注释&#xff1a;(5分) 网页框架&#xff1a;(30分) 框架编码&#xff1a; 文字填充&#xff1a;(20分) 文字编码&#xff1a; banner部分(10分) banner编码&#xff1a; 列表部分(20分) 列表编码&#xff1a; …

单商户商城系统功能拆解31—营销中心—幸运抽奖

单商户商城系统&#xff0c;也称为B2C自营电商模式单店商城系统。可以快速帮助个人、机构和企业搭建自己的私域交易线上商城。 单商户商城系统完美契合私域流量变现闭环交易使用。通常拥有丰富的营销玩法&#xff0c;例如拼团&#xff0c;秒杀&#xff0c;砍价&#xff0c;包邮…

替换NAS,这5个理由就够了

全球数据量爆炸性增长&#xff0c;企业对于大容量、易扩展、低成本的存储设备产生了强烈的需求&#xff0c;起初很多企业选择NAS&#xff0c;但随着企业使用场景多样性&#xff0c;对于存储设备上不再局限于存储&#xff0c;更强调安全和协作能力。 NAS相当于私有云部署的个人…

SAP AIF BTI750

第一章 AIF&#xff08;Application Interface Framework&#xff09;简介 AIF是什么&#xff1f;做什么用的&#xff1f; 功能简介 这样图很清楚的说明了AIF是什么&#xff0c;它是一个技术框架&#xff0c;它可以实施接口并且监控接口&#xff0c;以及解决消息处理期间出…

Java 垃圾收集器

堆内存示意图 垃圾收集算法 1.标记-清除算法 算法分为标记和清除两个阶段。标记出所有需要回收的对象&#xff0c;在标记完成后&#xff0c;统一回收。 缺点&#xff1a; 执行效率不稳定&#xff0c;若堆中有大量对象要被回收&#xff0c;这是必须进行大量标记和清除动作&a…

Push-Relabel算法相关阅读

Push-Relabel算法相关阅读1.Push-Relabel算法思想2.Push-Relabel算法原理示意图3.Push-Relabel算法具体实例4. 网络流各类算法简单总结与比较5. Push-Relabel 预流推进算法6. Push-Relabel算法(最大流)1.Push-Relabel算法思想 对于一个网络流图: 该算法直观可以这样理解&#…

java乱码问题一次性解决

在我们编码生活中&#xff0c;最常见的就是乱码&#xff0c;我也是遇到好几次&#xff0c;现在我整理一下所有乱码的解决方式&#xff0c;可治99%乱码问题 设置文件编码属性 修改当前 Web 项目 Tomcat Server 的虚拟机输出选项 -Dfile.encodingUTF-8 IntelliJ IDEA 中自定义…