统计学第5天

news2024/9/21 0:33:36

要观察性别和在线上买不买生鲜食品有没有关系,在现实生活中,女性通常去菜市场买菜的比较多,那么在线下是不是也是这样呢?

\chi^2卡方统计量

如果研究的是两个类别变量,每个变量有多个类别,通常将两个变量多个类别的频数用交叉表的形式表示出来。其中一个变量放在行(row)的位置,称为行变量,其类别数(行数)用R表示,另一个变量放在列(column)的位置,称为列变量,其类别数(列数)用C表示。

这种由两个或着两个以上类别变量交叉分类的频数分布表称为列联表。一个由R行和C列组成的列联表称为R*C列联表。

对列联表中的两个类别变量进行分析,通常判断两个变量是否独立。该检验的假设是:

两个变量独立(无关),如果原假设被拒绝,则表明两个变量不独立,或者说两个变量不相关。

定义

1、用于检验列联表中变量之间拟合优度和独立性

2、检验统计量为:x^2= \sum \frac{(f_o-f_e)^2}{f_e} \sim x^2(C-1)【fo实际频数,fe期望频数】

或者x^2= \sum_{i=1}^{r}\sum_{j=1}^{c}\frac{(f_{ij}-e_{ij})^2}{e_{ij}} \sim x^2((R-1)(C-1)) ,f_{ij}表示列联表中第i行第j列类别中的实际频数,e_{ij}表示列联表中第i行第j列类别中的期望频数。

3、x^2统计量可以看作是检验统计量与真实值与期望值的近似程度。两者越接近,即f_o-f_e的绝对值越小,计算出的x^2值就越小;反之,f_o-f_e的绝对值越大,计算出的x^2值就越大。

性质

1、x^2\geq 0,因为它是对平方结果的汇总;

2、分布与自由度的关系

 由上图可以看出,自由度越小,分布就越往左边倾斜,随着自由度的增加,x^2分布的偏斜程度趋于缓解,逐渐显露出对称性。随着自由度的继续增大,x^2分布将趋近于对称的正态分布。

拟合优度检验

1、x^2检验是利用x^2分布对与分类数据的频数进行分析的统计学方法;

2、通过对x^2的计算结果与x^2分布中的临界值进行比较,做出是否拒绝原假设的统计决策;

3、x^2检验的应用主要表现在两个方面:拟合优度检验和独立性检验。

        (1)拟合优度检验是用x^2统计量进行统计显著性检验的重要内容;

        (2)检验的步骤

                a依据总体分布状况,计算出分类变量各类别的期望频数;

                b与分布的观察频数进行对比;

                c判断期望频数与观察频数是否有显著差异,得出结论。

例1:1912年4月15,豪华巨轮泰坦尼克号与冰川相撞沉没。当时船上共有2208人,其中男性1738人,女性470人,海难发生后,幸存者共718人,其中男性374人,女性344人,以\alpha =0.05的显著性水平检验存活情况与性别是否有关。

解答:在本例中需要判断观察频数与期望频数是否一致。

H_0:观察频数与期望频数一致;

H_1:观察频数与期望频数不一致。

计算过程如下表:(718/2208*1738)

自由度的计算公式为df=R-1,R为分类变量类型的个数。

在本例中,分类变量是性别,有男、女两个类别,故R=2,自由度df=2-1=1。

经查\chi^2分布表,\chi^2_{0.05}(1)= 3.841,括号中的数字表示自由度。

因为\chi^2远大于\chi^2_{0.1},故拒绝H0,接收H1,说明存活状况与性别显著相关

独立性检验

拟合优度检验是对一个分类变量的检验,有时我们会遇到两个分类变量的问题,看这两个分类变量之间是否存在联系。例如原料有不同的等级,原料又产自不同的地区。原料等级和原料生产地就是两个分类变量。我们关心这两者是否有关联,是不是某些地区生产的原料有更好的质量。对这两个分类变量的分析,称为独立性检验。

例2:一份原料来自三个不同的地区,原料质量被分为三个不同的等级。从这批原料中随机抽取500件进行检验,结果如表表示,要求检验各个地区和原料等级之间是否存在依赖关系(\alpha=0.05)

 解答:

H0:地区和原料等级之间是独立的(不存在依赖关系)

H1:地区和原料等级之间不独立(存在依赖关系)

分析的关键是获取期望值

在第一行,甲地区的合计为140,用140/500作为甲地区原料比例的估计值。在第一列,一级原料的合计为162,用160/500作为一级原料比例的估计值。如果地区和原料等级之间是独立的,则可以用下面的公式估计第一个单元(甲地区,一级)中的期望比例。

令: A=样本单位来自甲地区的事件

        B=样本单位属于一级原料的事件

根据独立性的概率乘法公式,有

P(第一个单元)=P(A)P(B)=(140/500)(162/500)=0.09072
0.09072是第一个单元中的期望比例,相应的频数期望为:0.09072 X 500 = 45.36

一般地,可以采用下式计算任意一个单元中频数的期望值:

f_e=\frac{RT}{n}\times \frac{CT}{n} \times n = \frac{RT\times CT}{n}

式中,fe为给定单元格的频数期望值;RT为给定单元格所在行的合计;CT为给定单元格所在列的合计;n为观察值的总个数(样本量)。

根据上式可以得到如下表所示的计算结果。

 x^2的自由度为(R-1)(C-1)= 4

\alpha = 0.05,查表可知x^2_{0.05}(4)=9.488

由于,x^2>x^2_{0.05}(4)故拒绝H0,接收H1,即地区和原料等级之间存在依赖关系,原料的质量受地区的影响。

例3:荔枝数码公司针对即将推出的手机制定一项推广方案,从所属的四个平台旗舰店中共随机抽取420名职工,了解他们对推广方案的态度(见下表),以\alpha=0.1的显著性水平检验员工态度是否受所在平台的影响。

 解答:若员工对推广方案的态度不受所在子公司的影响,四个平台对赞成推广方案的比例是一致的。设\pi_i为第i个分公司赞成推广方案的百分比,可设定原假设和备择假设分别为:

H_0:\pi_1=\pi_2=\pi_3=\pi_4

H_1:\pi_1,\pi_2,\pi_3,\pi_4不全相等

统计量x^2 = \sum_{j=1}^{c}\frac{(f_o-f_e)^2}{f_e}=1.10163

x^2的自由度=(R-1)(C-1)=3

\alpha=0.1,查表知道=:x^2_{0.1}(3)=6.25

由于x^2>x^2_{0.1}(3),故做出决策:在α=0.1的水平上不能拒绝H0.

结论:分公司不同与改革方案赞成比例之间不存在依赖关系,即可以认为四个分公司岁改革方案的赞成比例是一致的。

x^2x方分布表

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2098406.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ant design vue+vue3+ts+xlsx实现表格导出问excel文件(带自定义表头)~

1、首先默认你已安装ant design vue、xlsx 库、及file-saver。 2、导入: import * as XLSX from xlsx; import { saveAs } from file-saver; 注:这里的xlsx导入不能这么写,否则会报错,原因是版本不一致,语法向上兼容…

【多线程】线程间通信 之虚假唤醒和中断

两个线程,可以操作初始值为0的一个变量,实现一个线程对该变量1,一个线程对该变量-1,实现交替,来10轮,变量初始值为0,以实现此问题作为引入,简化我们的理解 文章目录 一、两个线程syn…

EasyExcel实现复杂Excel的导入

最近项目中遇到一个复杂的Excel的导入,并且数据量较大。因为数据不规则,所以只能使用POI进行自定义读取,但是发现数据量大之后,读取数据非常耗时。后面换成EasyExcel,性能起飞。 1. Excel样板 如上图,需要…

leetcode 12. 整数转罗马数字

解题思路 1.首先,将值与对应字符用字典来表示,然后将符号对应的值按有序顺序存储至列表中sums 2.将要转换的整数转换成列表形式,遍历列表,每次遍历: 将值取出来算出对应所在位置的实际值 如 32 对应列表 [3,2] 则 3实…

【二叉搜索树】K型与KV型二叉搜索树简单实现

关于我: 睡觉待开机:个人主页 个人专栏: 《优选算法》《C语言》《CPP》 生活的理想,就是为了理想的生活! 作者留言 PDF版免费提供:倘若有需要,想拿我写的博客进行学习和交流,可以私信我将免费提供PDF版。…

中国电子学会Python3级等级考试202403客观题解析1

一、单项选择题 1、在 Python 中,hex(2023)的功能是?( ) A 将十进制数 2023 转化为十六进制数 B 将十进制数 2023 转化为八进制数 C 将十六进制数 2023 转化为十进制数 D 将八进制数 2023 转化为十进制数 答案:A…

linux如何查看内存条是ddr几代

在 Linux 系统中,可以通过以下几种方法查看内存条的类型和代数(如 DDR3、DDR4 等): 1. 使用 dmidecode 命令 dmidecode 是一个工具,它可以从系统的 DMI 表(也称为 SMBIOS 表)中提取硬件信息&a…

半导体制造业“电”亮未来,APView500护航电能质量新篇章

在科技日新月异的今天,半导体制造业作为信息技术的心脏,其生产效率与稳定性直接关乎国家科技实力与产业升级。然而,这一高精尖领域却长期面临电能质量问题的严峻挑战,尤其是谐波污染与电压暂降/中断两大难题,如同潜伏的…

springboot中上传图片到阿里云的oss云存储

上篇演示了如何将图片上传到本地,但是在实际项目中,这样是很占服务器存储空间的。所以,我们一般的解决方案是使用oss云存储。这里就结合阿里云的oss来实现下这个业务功能。 安装依赖 参考官网即可,https://help.aliyun.com/zh/oss/developer…

SOEX从去中心化的链上社交关系到创收策略

是时候摆脱传统的在线社区,真正进入 Web3 了,利用区块链的力量,并理解社交互动的意义远不止分享内容或复制交易。代币化将赋能参与提升到一个全新的水平,并带来一系列新的机会。 社交网络可以发挥强大的作用,尤其是从…

Carmaker Hil部署

本文主要简单介绍carmaker HIl的部署(Windows环境) carmaker HIL的上位机与Xpack 4的下位机通过一个以太网口进行连接,然后打开上位机的网络连接配置,并关闭防火墙: 打开carmaker HIL的配置,对网络连接进…

这一届“出道”的数字人,已经拿捧上了“铁饭碗”

文 | 智能相对论 作者 | 陈泊丞 好消息!你心心念念的事业单位发录取公告了! 坏消息!他们没录你,录了个数字人。 图片来源网络 随着数字人技术的突破,越来越多的传统企业和机构开始用上了“数字员工”。 甚至很多中…

RFID光触发标签在文件柜管理中的创新应用

在当今信息化时代,文件管理对于企业和机构的重要性不言而喻。传统的文件柜管理方式存在诸多问题,如查找文件困难、管理效率低下、安全性难以保障等。而 RFID 光触发标签技术的出现,为文件柜管理带来了全新的解决方案。 一、传统文件柜管理的…

【C++ Primer Plus习题】9.1

问题: 解答: main.cpp #include <iostream> #include <string> #include "golf.h" using namespace std;#define SIZE 5int main() {golf ann;setgolf(ann, "AnnBirdfree", 24);golf andy;setgolf(andy);showgolf(ann);showgolf(andy);return…

如何组织一场考试答题?

&#x1f469;&#xff1a;我想组织一场考试答题&#xff0c;考完后可以导出所有考生的成绩&#xff0c;我还需要查出哪些人是没有参加考试的&#xff0c;这个能实现吗&#xff1f; &#x1f64b;&#xff1a;支持的 下面将以【如何组织一场考试答题】为主流程展开介绍 &#x…

第L2周:机器学习-线性回归

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 目标&#xff1a; 学习简单线性回归模型和多元线性回归模型通过代码实现&#xff1a;通过鸢尾花花瓣长度预测花瓣宽度 具体实现&#xff1a; &#xff08;一&…

走进酿酒车间:探寻白酒酿造的每一步

在古老的华夏大地上&#xff0c;有一种传统而不同的技艺——白酒酿造。它不仅承载了中华民族千年的文化积淀&#xff0c;更蕴含了无数酿酒师的匠心与智慧。今天&#xff0c;让我们一同走进豪迈白酒&#xff08;HOMANLISM&#xff09;的酿酒车间&#xff0c;探寻那神秘而又精彩的…

20240903 每日AI必读资讯

Claude 3.5 Sonnet对免费用户关闭&#xff1f; - 免费用户无法使用Claude 3.5 Sonnet模型&#xff0c;只能使用功能简单的Claude 3 Haiku模型。 - Claude 3.5 Sonnet在性能、理解能力、运行速度和视觉处理方面都有显著提升&#xff0c;成为行业新标杆。 - 关闭可能影响用户使…

解决jupyter notebook启动需要密码的问题

解决方法 在运行界面输入 jupyter notebook list 之后运行界面会输出token值&#xff0c;将对应地址后的token复制到密码栏中即可

Java题集(由入门到精通)01

此系列文章收录大量Java经典代码题&#xff08;也可以算是leetcode刷题指南&#xff09;&#xff0c;希望可以与大家一起努力学好Java。3、2、1&#xff0c;请看&#xff01; 目录 1.根据输入的运算符&#xff08;、-、*、/&#xff09;进行计算 2.随机生成一个整数&#xf…