使用 Python 进行卡方测试

news2024/11/20 3:27:38

使用 Python 进行卡方测试

Python 中卡方特征测试的简单解释

奥坎·耶尼根

迈向开发

奥坎·耶尼根

·

跟随

发表于

迈向开发

·
4 分钟阅读
·
2月 2022, <>

18

1

土耳其超级联赛的三大足球俱乐部

一、说明

        卡方检验用于检验为分类变量创建的模型。也就是说,这是我们在统计学中经常遇到的另一个经典假设检验。该测试是事实与期望的统计版本。我们有一个理论,一个对事件的期望,我们也有观察,现在我们想比较它们。

二、卡方一般概念

        我们可以通过两种方式应用卡方检验:

  1. 拟合优度检验:我们有一个分类变量。我们想检查我们的样本对整个总体的反映程度。
  2. 独立性测试:我们有两个分类变量。我们想检查这两者之间是否存在关系。

        公式!

        卡方值是观测值和预期值之差的平方和除以期望值。c 是自由度。

2.1 合身性

假设我们欺骗了100名在伊斯坦布尔塔克西姆广场散步的人,承诺购买啤酒,并问他们支持哪支球队。根据瑞士科学家的研究,我们已经知道支持加拉塔萨雷的人的比例是45%。费内巴切占35%,贝西克塔斯占20%。这是我们的期望。另一方面,当我们查看在塔克西姆喝啤酒后收集的样本时,我们的观察结果分别如下:54、38 和 8。

Data table

        我们的零假设是瑞士科学家是对的。另一种假设是他们错了。我们选择显著性水平为 5%。我们的自由度是2(如果我们有两个俱乐部的支持者数量,我们也可以获得第三个俱乐部的数量)。还有 c = k-1 = 3–1 = 2。

        现在让我们使用等式:

        度数为 9 的卡方值为 27.0,置信水平为 05.5 的卡方值为 991.0。卡方表链接在这里。Excel 公式为 “ = CHISQ。INV(95.2,<>)”。

        如果我们的值大于临界值,我们可以拒绝零假设,是的,在这种情况下,我们拒绝零并接受替代方案,这意味着瑞士人错了!

#python code for the above example
observed = [54,38,8]
expectation = [45,35,20]
x = sum([(o-e)**2./e for o,e in zip(observed,expectation)])
#chi square = 9.257
#import chi2 from scipy to get the critical value
from scipy.stats import chi2
alpha = 0.05
df = 2
cr=chi2.ppf(q=1-alpha,df=df)
#critical value is 5.991

2.2 独立性测试

        这是一回事,但还有一个变量。因此,让我们在上面的示例中再添加一个。我们注意到酒吧里的 100 个热爱足球的朋友正在喝 2 种啤酒;比尔森和拉格。我们想知道足球队和啤酒类型的选择之间是否存在关系。我们再次收集样本。

        啤酒

        添加另一个变量后的观测数据表

        为了计算期望值,我们将使用联合概率,即:P(联合)=边际概率*边际概率。例如,我们可以计算出喜欢喝比尔森啤酒的加拉塔萨雷球迷的期望值如下;

        E = (54 * 43) / 100 = 23.2。因此,让我们计算所有预期值:

        计算出的期望数据

        因此,我们的零假设 Ho 是支持的团队与啤酒偏好无关。替代假设 Ha 是支持的团队不独立于啤酒偏好。我们的自由度是 df = (r-1)(c-1) = (3–1)(2–1) = 2。我们再次使用相同的方程来计算卡方值:

        计算值 22.74 再次大于临界值,因此我们拒绝原假设并接受替代假设。我们可以说这两个变量都是依赖的。

三、结论

        卡方检验用于检查分类变量。在选择机器学习特征时,我们可以使用卡方。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1105451.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java】实现图片验证码2.0【详细代码】

实际开发过程中经常遇到要实现图片验证码来防止外部使用脚本刷接口&#xff0c;所以说图片验证码是很有必要的一个小功能。 下面这个之前发布的&#xff0c;现在发现生成的图片验证码是可以被自动化工具进行识别的&#xff0c;具有一定的安全性问题。 1.0版本验证码&#xff…

汽车零部件企业信邦控股之项目管理实践案例

信邦控股有限公司&#xff08;信邦控股&#xff09;为香港交易所主版上市公司&#xff0c;是惠州建邦精密塑胶有限公司的控股公司。信邦控股集团是国际化一站式表面处理专家&#xff0c;主要产品包括汽车内饰件、外饰件和双层挠性覆铜板&#xff0c;总部设于中国惠州。 信邦控股…

2023年中国熔盐储能装机量、新增装机量及行业投资规模分析[图]

熔盐储能是一种可以传递能量、长时间&#xff08;6-8h&#xff09;、大容量储能的技术路径&#xff0c;作为传热介质可以实现太阳能到热能的转换&#xff0c;作为储能介质可以实现将热能和电能的双向转换&#xff0c;可以很好的适应和解决以上两大矛盾。因此&#xff0c;熔盐储…

【面试题笔记】C++继承和多态常见高频经典面试题

1.继承相关习题 1.1 什么是菱形继承&#xff1f;菱形继承的问题是什么&#xff1f; 菱形继承&#xff1a;菱形继承是多继承的一种特殊情况。两个中间类继承父类&#xff0c;而派生类继承了两个中间类&#xff0c;从而在继承关系上呈现出一种菱形。如下图所示&#xff1a; **…

jinkens编译不通过排查

gerrit上看编译不通过 打开 点开fulllog 然后 搜索 failed 关键字 或者error 都没有就看具体信息 就能找到原因了 此外碰到一个难以解决的问题 就是master分支本地编译没问题 push以后一直报错引用不到某个变量 最后发现是打开fulllog 发现其实报错的是其他的工程&…

openvino系列教程之人脸检测 mobilenetv2

OpenVINO&#xff08;开放式视觉推理和神经网络优化&#xff09;是英特尔推出的一款用于加速计算机视觉应用开发的软件。它基于英特尔的深度学习技术&#xff0c;提供了一套完整的工具链&#xff0c;包括模型优化器、运行时库等&#xff0c;帮助开发者快速实现高性能的计算机视…

火爆,接口测试+接口自动化测试整理总结,你不知道的都在这了...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 1、接口自动化测试…

软件外包开发文档

编写软件开发文档是项目开发过程中的关键步骤&#xff0c;它有助于组织、记录和分享项目的信息和进展。以下是编写软件开发文档的一般步骤和建议&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 1.文档…

vue2 集成 Onlyoffice

缘起于进行了一次在线 Office 解决方案的调研&#xff0c;对比了 Office365、可道云、WPS Office、PageOffice 等厂商&#xff0c;最终敲定了使用 Onlyoffice&#xff0c;故整理了一份 Onlyoffice 从零开始系列教程&#xff0c;这是第一篇。 一、Onlyoffice 是什么&#xff1f…

虹科 | 解决方案 | 机械免拆压力测试方案

对于发动机的气门卡滞或气门开闭时刻错误、活塞环磨损、喷油嘴泄漏/堵塞等故障&#xff0c;往往需要解体发动机或拆卸部件才能发现&#xff1b;而对于某些轻微的故障&#xff0c;即使解体了发动机后也经常难于肉眼判别 虹科Pico提供的WPS500压力测试方案&#xff0c;可以动态测…

架构师日记-聊聊开发必掌握的那些实践技能 | 京东云技术团队

一 引言 尽管软件开发一直致力于追求高效、可读性强、易于维护的特性&#xff0c;但这些特性却像是一个不可能三角&#xff0c;相互交织&#xff0c;此消彼长。就像底层语言&#xff08;如汇编和C语言&#xff09;能够保持高效的运行性能&#xff0c;但在可读性和维护性方面却…

会议OA小程序【首页布局】

目录 一. Flex布局介绍 1.1 什么是Flex布局 1.2 基本概念 1.3 Flex属性 二. 会议OA首页轮播图的实现 配置 Mock工具 swiper 效果展示 三. 会议OA首页会议信息布局 index.js index.wxml index.wxss 首页整体效果展示 一. Flex布局介绍 布局的传统解决方案&#x…

LeetCode之买卖股票的最佳时机系列共6道题

文章目录 0 引言1 121. 买卖股票的最佳时机1. 1 暴力法1.2 一次遍历1.3 动态规划 2 122. 买卖股票的最佳时机 II2.1 一次遍历2.2 动态规划 3 123. 买卖股票的最佳时机 III3.1 动态规划 4 188. 买卖股票的最佳时机 IV4.1 动态规划 5 309. 买卖股票的最佳时机含冷冻期5.1 动态规划…

每日温度00

题目链接 每日温度 题目描述 注意点 answer[i] 是指对于第 i 天&#xff0c;下一个更高温度出现在几天后如果气温在这之后都不会升高&#xff0c;请在该位置用 0 来代替1 < temperatures.length < 100000 解答思路 使用单调栈解决本题&#xff0c;思路为&#xff1a…

IEEE754 FP16

一. 实数的表达方法 1.定点数表示法 <整数部分>.<小数部分> 例. 666.66 2.浮点数表示法 科学计数法&#xff1a;有效数字基数&#xff08;base&#xff09;指数&#xff08;exponent&#xff09;正负符号位 规范化表示&#xff1a;d.ddd*β^e&#xff08;0&…

智能井盖的用处有哪些?好用在什么地方?

智能井盖是一种基于物联网技术的井盖系统&#xff0c;通过集成传感器、通信设备和数据处理功能&#xff0c;实现对井盖的实时监测、远程管理和智能化控制。WITBEE万宾的智能井盖传感器EN100-C2&#xff0c;只要在城市需要的井盖上面安装即可使用&#xff0c;一体式结构&#xf…

Python pip 替换国内镜像源

pip它还有一个非常好的特点&#xff0c;当你安装一个库的时候&#xff0c;它会自动帮你安装所有这个库的依赖库。完全一键式操作。非常方便。但是由于pipy网站是国外网站&#xff0c;很容易会被墙&#xff0c;导致经常下载速度非常慢&#xff0c;经常超时。 解决办法&#xff…

BSA研究方案——如何从容不迫的进行性状定位

&#xff08;一&#xff09;BSA基本概念 BSA即集群分离分析法&#xff0c;是Bulked-Segregant Analysis的首字母缩写。具体是利用差异目标性状的两个亲本构建家系&#xff0c;在子代分离群体中选取目标性状个体构建DNA混合池&#xff0c;采用高通量测序技术对混池DNA进行建库测…

在VScode中启动的前端项目关于 Local 和 Network 两个地址的区别

首先这两个地址在你的电脑上都是可以访问的 具体区别&#xff1a; localhost 是供当前电脑访问的地址&#xff0c;仅供你自己访问&#xff0c;其他人通过localhost 是访问不到你跑的项目的。你把 localhost 换成IP地址 127.0.0.1 也是相同的效果&#xff0c;因为 127.0.0.1 也…

uniapp vue3.0+TS 上传单张或多张图片,并且能删除和预览。

一、uniapp vue3.0TS 上传单张或多张图片&#xff0c;并且能删除和预览。 效果&#xff1a;人菜话不多 先上效果&#xff1a; 二、代码 1.HTML 上传图片相关代码 代码如下&#xff1a; <template><view class"images_box"><view class"img…