SPSS统计教程:卡方检验

news2024/9/21 10:52:48

本文简要的介绍了卡方分布、卡方概率密度函数和卡方检验,并通过SPSS实现了一个卡方检验例子,不仅对结果进行了解释,而且还给出了卡方、自由度和渐近显著性的计算过程。本文用到的数据"2.2.sav"链接为: https://url39.ctfile.com/f/2501739-875711187-f3dbb8?p=2096 (访问密码: 2096)

一.卡方分布
卡方分布是一种概率分布,若 k k k个随机变量 Z 1 、 . . . . . . 、 Z k Z_1、......、Z_k Z1......Zk是相互独立且符合标准正态分布的随机变量(数学期望为0、方差为1),那么随机变量 Z Z Z的平方和 X = ∑ i = 1 k Z i 2 X = \sum\limits_{i = 1}^k {Z_i^2} X=i=1kZi2被称为服从自由度为 k k k的卡方分布,记作: X ∼ χ 2 ( k ) X \sim {\chi ^2}\left( k \right) Xχ2(k)

二.卡方概率密度函数
卡方分布的概率密度函数为:
f x ( x ) = 1 2 k 2 Γ ( k 2 ) x k 2 − 1 e − x 2 {f_x}\left( x \right) = \frac{1}{{{2^{\frac{k}{2}}}\Gamma \left( {\frac{k}{2}} \right)}}{x^{\frac{k}{2} - 1}}{e^{\frac{{ - x}}{2}}} fx(x)=22kΓ(2k)1x2k1e2x
其中, x ≥ 0 x \ge 0 x0,当 x ≤ 0 x \le 0 x0 f x ( x ) = 0 {f_x}\left( x \right) = 0 fx(x)=0 Γ \Gamma Γ表示Gamma函数。
不同自由度情况下的卡方分布概率密度曲线图:

随着自由度 k k k的增加,曲线逐渐趋于对称。当自由度 k k k趋近于无穷时,卡方分布趋近正态分布。

三.卡方检验
卡方检验是非参数检验,以卡方分布为理论依据的假设检验方法,基本原理是通过样本的频数分布来推断总体是否服从某种理论分布。卡方检验的原假设为:样本所属总体的分布与理论分布之间不存在显著差异。卡方检验的检验统计量方程为:
χ 2 = ∑ i = 1 k ( M o i − M e i ) 2 M e i {\chi ^2} = \sum\limits_{i = 1}^k {\frac{{{{\left( {{M_{oi}} - {M_{ei}}} \right)}^2}}}{{{M_{ei}}}}} χ2=i=1kMei(MoiMei)2
χ 2 \chi ^2 χ2统计量在大样本条件下逐渐服从自由度为 k − 1 k-1 k1的卡方分布, M o i M_{oi} Moi表示观测频数, M e i M_{ei} Mei表示理论频数。 χ 2 {\chi ^2} χ2统计量越小,表示观测频数与理论频数越接近。如果小于由显著性水平和自由度确定的临界值,那么认为样本所属的总体分布与理论分布无显著差异。

四.卡方检验例子
实验目的:想知道不同年龄组的样本个数是否存在显著差异。如果 p > 0.05 p>0.05 p>0.05,那么接受原假设,即不同年龄组的样本个数并不存在显著不同。
变量视图如下所示:

数据视图如下所示:

分析->非参数检验->旧对话框->卡方:

卡方检验结果如下所示:

重点说明下卡方、自由度和渐近显著性是如何计算的:
1.卡方计算
( 45 − 50 ) 2 50 + ( 51 − 50 ) 2 50 + ( 52 − 50 ) 2 50 + ( 52 − 50 ) 2 50 = 25 + 1 + 4 + 4 50 = 34 50 = 0.68 \frac{{{{\left( {45 - 50} \right)}^2}}}{{50}} + \frac{{{{\left( {51 - 50} \right)}^2}}}{{50}} + \frac{{{{\left( {52 - 50} \right)}^2}}}{{50}} + \frac{{{{\left( {52 - 50} \right)}^2}}}{{50}} = \frac{{25 + 1 + 4 + 4}}{{50}} = \frac{{34}}{{50}} = 0.68 50(4550)2+50(5150)2+50(5250)2+50(5250)2=5025+1+4+4=5034=0.68
2.自由度计算
k − 1 k-1 k1 k k k表示分类变量数。
3.渐近显著性计算
渐近显著性就是 p p p值, p = 1 − F ( 卡方值 , 自由度 ) p=1-F(卡方值,自由度) p=1F(卡方值,自由度)。使用Python代码计算:

from scipy.stats import chi2
# 第1个参数表示卡方值,第2个参数表示自由度
p = 1 - chi2.cdf(0.68, 3)
print(p) # 0.8778977619609463

在平时看的医学论文中,比较常见的场景是根据卡方检验来计算患者组和对照组的性别是否具有显著性差异:

参考文献:
[1]卡方分布:https://zh.wikipedia.org/zh-hans/卡方分布
[2]《SPSS统计分析入门与应用精解》
[3]卡方检验:https://www.ibm.com/docs/zh/spss-statistics/28.0.0?topic=tests-chi-square-test
[4]数据2.2.sav: https://url39.ctfile.com/f/2501739-875711187-f3dbb8?p=2096 (访问密码: 2096)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/675540.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

菲涅尔圆孔衍射matlab完整程序分享

根据惠更斯 - 菲涅耳原理,光的衍射是光束内部的次波之间的相干叠加,衍射光波场的光振动符合菲涅耳积分公式。但直接运用菲涅耳积分公式计算衍射光场是很困难的。对于夫琅和费衍射(远场衍射),在光源和接收屏距离衍射屏均为无穷远的…

实战:k8s证书续签-2023.6.19(测试成功)

实战:k8s证书续签-2023.6.19(测试成功) 目录 推荐文章 https://www.yuque.com/xyy-onlyone/aevhhf?# 《玩转Typora》 1、前言 k8s集群核心的证书有2套,还有1套非核心的(即使出问题也问题不大)。 ⚠️ 如果是kubeadm搭建的k8s集群,其有效期为…

chatgpt赋能python:Python烧录单片机:快速的开发工具

Python烧录单片机:快速的开发工具 简介 Python是一种高级的编程语言,被广泛应用于各种领域,包括机器学习、数据分析和物联网等领域。Python的易用性和简洁性已经成为其成功的关键因素之一。Python也能在烧录单片机时提供极大的方便性和灵活…

chatgpt赋能python:用Python自动爬取链接的内容——提升SEO效果的利器

用Python自动爬取链接的内容——提升SEO效果的利器 在当今数字化时代,SEO(搜索引擎优化)对于任何一个网站来说都至关重要。一种有用的SEO策略就是频繁地更新网站内容,吸引更多的访问者和搜索引擎爬虫。而最快捷的方法就是自动爬取…

chatgpt赋能python:Python爬虫解密:如何快速抓取网站数据

Python爬虫解密:如何快速抓取网站数据 在当今信息时代,人们越来越依赖互联网获取信息。不同的网站提供了大量数据,但是手动去抓取这些数据十分困难,效率也很低。Python爬虫技术是解决这一问题的有效工具之一,它可以帮…

使用npm安装pnpm包管理器

使用npm安装pnpm包管理器 一、安装 使用 npm install pnpm -g 命令安装pnpm npm install pnpm -g安装完成之后,使用pnpm -v命令查询是否成功安装,出现版本号即可 二、设置源 1.先查看源是否为淘宝的源 pnpm config get registry 2.设置源命令 pn…

TS:pip安装python库报ssl错误-2023.6.17(已解决)

2023.6.17-TS-pip安装python库报ssl错误(已解决) 目录 文章目录 2023.6.17-TS-pip安装python库报ssl错误(已解决)目录报错现象报错环境测试过程换其他源还是报错(失败)百度:替换为豆瓣源并加--trusted-host参数(成功) 参考文章关于我最后 报错…

一文理解多线程机制和多线程的优缺点

一文理解多线程机制 前言:多线程的优缺点。一、什么是多线程1.1、多线程的概念和基本原理1.2、多线程与单线程的区别 二、多线程的应用场景三、C 中的多线程3.1、C11 新增加的 thread 库3.2、C 线程同步机制(mutex、condition_variable) 四.、…

【Openvino01】Ubuntu安装inter的openvino2022.1以及遇到的各种错误解决

交代一下今天的文章背景: 于最近要使用inter的一款名为Intel Movidius™ Myriad™ X 的加速卡去实现对算法模型的加速推理能力,由于是就得第一步安装openvino,然后再使用卡去验证openvino是否安装ok,卡是否真的存在推理加速的能力…

python pytorch教程-带你从入门到实战(代码全部可运行)

python pytorch教程-带你从入门到实战(代码全部可运行) 其实这个教程以前博主写过一次,不过,这回再写一次,打算内容写的多一点,由浅入深,然后加入一些实践案例。 下面是我们的内容目录&#x…

2022(一等奖)D1073基于Himawari-8卫星遥感的黑龙江省地表水时空格局研究

作品介绍 1 项目简介 为探究黑龙江省地表水空间格局变化,本项目以黑龙江省为例,基于高时相Himawari-8号卫星数据,通过影像预处理、特征指数选择、自动阈值分类、集成学习和随机森林分类等步骤,融合IDL二次开发与GIS空间分析&…

chatgpt赋能python:Python求绝对值的三种方法

Python 求绝对值的三种方法 Python是一门面向对象、解释型、动态类型的高级编程语言,它被广泛应用于各种领域,特别是科学计算、数据分析、机器学习等领域。在Python中,求绝对值是一个常见的数学操作。本文将介绍Python求绝对值的三种方法&am…

Redis原理 - Redis网络模型

原文首更地址,阅读效果更佳! Redis原理 - Redis网络模型 | CoderMast编程桅杆https://www.codermast.com/database/redis/redis-netword-model.html 思考 Redis 到底是单线程还是多线程? 如果仅仅针对 Redis 的核心业务部分(命…

Vicuna-13B云服务器部署

Vicuna概述 Vicuna由一群主要来自加州大学伯克利分校的研究人员推出,仍然是熟悉的配方、熟悉的味道。Vicuna同样是基于Meta开源的LLaMA大模型微调而来,它的训练数据是来自ShareGPT上的7万多条数据(ShareGPT一个分享ChatGPT对话的谷歌插件&am…

Geocomputation (3)Spatial data operations

Geocomputation (3)Spatial data operations 来源:https://github.com/geocompx/geocompy 1.准备 #| echo: false import pandas as pd import matplotlib.pyplot as plt pd.set_option("display.max_rows", 4) pd.set_option(&…

文件搜索引擎的搭建Elasticsearch+Fscrawler+SearchUI+Git+Nginx

文章目录 前言如何搭建文档搜索引擎服务器架构环境准备一、搭建Elasticsearch二、搭建Fscrawler三、搭建SearchUI服务四、定时拉取Git文件五、搭建Nginx文件下载服务器 前言 搭建一套文档搜索引擎。有时候,我们有一批文档,需要在这批文档中查找想要的内…

【从零开始学习JAVA | 第十篇】StringBuild介绍

前言: 本文会对StringBuild类进行详细的介绍,他相比较于String,在进行字符串拼接的时候大大提高了效率,是一个 很实用的工具。 StringBulider: StringBuilder是Java中的一个类,用于在一次创建和初始化后&a…

Java中反射机制,枚举,Lambda的使用

目录 一、反射机制 1、含义 2、作用 3、※反射相关的几个类 3.1、Class类(Class对象是反射的基石) 3.2、Class类中相关的方法 3.2.1 (※重要)常用获得类相关的方法 3.2.2 (※重要)常用获得类中属性、变量Field相关的方法 3.2.3 获得类中注解相…

详细设计报告

聊天系统设计与实现详细设计报告 1.编写目的 详细设计的主要任务是概要设计方案做完善和细化,本阶段主要对聊天应用系统进行过程化的描述,详细确定每一个功能模块的实现方式、执行流程,为程序员编码提供依据。设计用户界面。 2.总体方案确认 (1)系统总体结构确认 该项目管理…

Redis原理 - 通信协议RESP

原文首更地址,阅读效果更佳! Redis原理 - 通信协议RESP | CoderMast编程桅杆https://www.codermast.com/database/redis/redis-communication-protocol.html RESP协议 Redis 是一个 CS 架构的软件,通信一般分两步(不包括pipeli…