【小白学机器学习11】假设检验之2:Z检验(U检验,正态检验)

news2024/11/16 0:35:52

目录

1 什么是Z检验

1.1 Z检验的别名 Z-test /U-test / 正态检验

1.2 维基百科定义

1.2 百度百科定义

1.3 定义提炼关键点

1.4 Z检验量 : Z=(X-θ)/s = (X-u)/s

2 Z检验量的构造

2.1 Z检验量 : Z=(X_-u)/s

2.2 Z检验变量的构造

2.4 Z检验量的核心参数

2.4.1 原始公式

2.4.2 正式公式

2.4.3 核心参数

3 Z分布

3.1 Z分布的定义

3.2 Z分布与正态分布的比较

4  Z检验适用范围/ 情况

4.1 Z分布的适用范围/ 情况

4.2 Z检验的适用情况

4.3  具体适用范围/情况,比较的对象

4.3.1 单样本Z检验

4.3.2 两样本z检验

5 检验原理 

5.1 检验原理

5.1.0 建立h0建设和显著度α ,这个模型

5.1.1 先计算Z检验值

5.1.2 显著度α =置信度 =概率 =曲线下外侧面积

5.1.3 看要求得双侧还是单侧检验?

5.1.4 得到Z值后,联合显著度α, 查表得 查表Z值,然后比较

5.1.5 比较P值和α,然后判断

5.2 检验原理说明:自百度百科

6 Z检验得实际操作查表等

6.1 Z检验的边界值查表原理

6.2 计算Z检验:手动查表

6.2.1 先确定显著度水平 α

6.2.2 已知Z值和 α后,查表获得p值,然后进行比较

6.2.3 比较p和显著度水平 α

6.2.4 查表

7 例题

7.1 先确定检验方式:双样本Z检验

7.2 题目已知样本均值和方差

7.3 计算Z值

7.4 查表获得P值

7.4.1 第1个Z值查表p

7.4.2 第2个Z值查表p

8 参考文章等


1 什么是Z检验

  • 也叫U检验,正态检验
  • 目的是:比较样本的平均值的差异,也可以叫 均值齐性检验
  • 前提假设,不同的样本都符合正态分布,标准正态分布?

1.1 Z检验的别名 Z-test /U-test / 正态检验

  • U检验 ,U-test
  • 正态检验

1.2 维基百科定义

  • Z检验,也称“U检验”,是为了检验在零假设情况下测试数据能否可以接近正态分布的一种统计测试。
  • 根据中心极限定理,在大样本条件下许多测验可以被贴合为正态分布。
  • 在不同的显著性水平上,Z检验有着同一个临界值,因此它比临界值标准不同的学生t检验更简单易用。当实际标准差未知,而样本容量较小(小于等于30)时,学生t检验更加适用。
  • 如果发现一个统计T接近于正态分配,Z检验的第二步为在零假设情况下估计T的期望值θ ,随后获得T的标准差s。
  • 在计算标准分数Z=(T-θ)/s后,单侧或双侧的p值可以用标准累积分布函数Φ来计算,分别为Φ(−Z)(左侧) Φ(Z)(右侧)和 2Φ(−|Z|) (双侧)。

1.2 百度百科定义

  • Z检验(Z Test)又叫U检验。
  • 由于实际问题中大多数随机变量服从或近似服从正态分布,U作为检验统计量与X的均值是等价的,且计算U的分位数或查相应的分布表比较方便。
  • 通过比较由样本观测值得到的U的观测值,可以判断数学期望的显著性,我们把这种利用服从标准正态分布统计量的检验方法称为U检验(U-test)

1.3 定义提炼关键点

  • 这是一种利用服从标准正态分布统计量的检验方法
  • 要检测的变量符合正态分布 n~(u,δ) ,并不要求符合 标准正态分布 n~(0,1) , 因为很多样本都符合正态分布,所以适应性很广
  • 在不同的显著性水平上,Z检验有着同一个临界值,因此它比临界值标准不同的学生t检验更简单易用。
  • 当实际标准差未知,而样本容量较小(小于等于30)时,学生t检验更加适用。样本数量较大时,Z检验和T检验都可以,但是Z检验更简单好用。

1.4 Z检验量 : Z=(X-θ)/s = (X-u)/s

  • U/Z与X的均值是等价的
  • U/Z的分位数或查相应的分布表比较方便
  • 如果X符合正态分布,那么Z检验量= 标准分数Z=(X-θ)/s = (X-u)/s
  • 其中 u/θ 是均值,而s是样本的标准差std

2 Z检验量的构造

2.1 Z检验量 : Z=(X_-u)/s

  • 简单公式:Z=(X_-θ)/s = (X_-u)/s
    • U/Z与X的均值是等价的
    • U/Z的分位数或查相应的分布表比较方便
    • 如果X符合正态分布,那么Z检验量= 标准分数Z=(X-θ)/s = (X-u)/s
    • 其中 u/θ 是均值,而s是样本的标准差std

2.2 Z检验变量的构造

  • 此处公式里都不是Xi 而是 X_=average(X)
  • 因为Xi 符合正态分布  Xi ~N(u,δ)
  • 所以很显然,average(X) 也符合正态分布,average(X) ~N(u,δ/✔n)。 因为average(X)的均值还是u,而average(X)的波动肯定比Xi要小得多,所以方差肯定是降低了=δ/✔n
  • Z检验量相当于构造了一个标准正态分布变量 Z=(X_-u) / (δ/✔n)~N(0,1)

下面是各种百科写的构造过程

Z检验量的构造  和 检验原理

2.4 Z检验量的核心参数

2.4.1 原始公式

  • Z=average(x)-u/δ
  • 有点像 标准化正态分布的公式,Zi=xi-u/δ ,但是这里用的不是xi而是均值average(x)
  • 但是要特意写成Z=average(x)-u/(δ/✔n) 原因? 
    • 就是✔n 是公式变换的结果,因为x ~ N(u,δ)  ,average(x) ~ N(u,δ/✔n)
    • 是只取了总体数里的n个样本,核心变量是 average(x),整个方法都是评价和比较的均值!!!,核心就是均值之间的差异

2.4.2 正式公式

  • Z检验要求大样本的原因,因为总体方差往往不可知,so需要一个大样本的样本方差)
  • 但是总体方差变不好获得,那总体均值就那么好得?
  • Z检验的公式
  • Z=(X_-u) / (δ/✔n)~N(0,1)
  • Z=(X1_-X2_) / ✔(s1/n1+s2/n2)

2.4.3 核心参数

  • 平均值 :      总体均值u  ,样本均值δ
  • 样本标准差:   s =std  或者双样本检测时  s1 和s2
  • 样本数量:     n,或者双样本检测时 2个 n1 和n2

3 Z分布

3.1 Z分布的定义

  • Z分布,全称费歇耳(Fisher)Z分布,亦称费歇耳方差比分布。
  • 从图形上看,特别像正态分布
  • 但是它是离散的,不是连续的

3.2 Z分布与正态分布的比较

  • Z分布是统计学中常用的一种离散概率分布,通常用于计算样本数据与总体均值之间的差异。它是通过将样本数据的均值与总体均值之差除以标准差来得到的。
  • 而正态分布是一种连续概率分布,具有钟形曲线形状,广泛用于自然现象和实验数据的概率分布。

4  Z检验适用范围/ 情况

Z检验是否合适先要看Z分布是否适用当下情况

4.1 Z分布的适用范围/ 情况

  • Z分布的准确性取决于样本数据的数量和总体分布的正态性。在样本数量较少或总体分布非正态时,Z分布的准确性会受到影响。
  • Z分布的计算方法只适用于均值为整数且标准差为小数的情形。如果均值或标准差不是整数,或者样本数量较少,则需要使用其他计算方法。

4.2 Z检验的适用情况

  • n>30大样本情况,适合Z检验和T检验
  • 否则只适合T检验

4.3  具体适用范围/情况,比较的对象

4.3.1 单样本Z检验

  • 单样本Z检验:比较一组样本和某数值(比如理想中的总体平均值)的平均值的差异
  • 原假设h0: average(x)=m

4.3.2 两样本z检验

  • 两样本/双样本z检验,比较一组样本和另外一组样本数据的平均值的差异
  • 原假设h0: average(x1)= average(x2)

5 检验原理 

5.1 检验原理

5.1.0 建立h0建设和显著度α ,这个模型

  • 对比均值/差值对比:
  • 置信水平:95% 即对原假设H0有95%的把握
  • 假设检验,H0和h1

5.1.1 先计算Z检验值

  • Z检验的公式
  • Z=(X_-u) / (δ/✔n)~N(0,1)
  • Z=(X1_-X2_) / ✔(s1/n1+s2/n2)

5.1.2 显著度α =置信度 =概率 =曲线下外侧面积

  • 显著度α 
  • 置信度
  • 概率
  • 曲线下外侧面积

5.1.3 看要求得双侧还是单侧检验?

  • 单侧检验,右侧/左侧
  • 双侧检验
  • 如果是双边检验,就比较查表的 Z(α/2)
  • 如果是单边检验,就比较查表的 Z(α)

5.1.4 得到Z值后,联合显著度α, 查表得 查表Z值,然后比较

  • 就是根据 显著度α, 
  • 比较 Z计算<> Z(α/2) ,如果Z计算> Z(α/2) ,那就意味着Z太大,概率p<α ,从而拒绝原假设h0

5.1.5 比较P值和α,然后判断

  • 置信水平:95% 即对原假设H0有95%的把握
  • 假设检验,H0和h1
  • 比较 Z计算<> Z(α/2) ,如果Z计算> Z(α/2) ,那就意味着Z太大,概率p<α ,从而拒绝原假设h0

5.2 检验原理说明:自百度百科

6 Z检验得实际操作查表等

6.1 Z检验的边界值查表原理

  • 可见Z分布是一个离散图形,类正态分布
  • 当Z值很大得时候,对应的p就会很小,也就是曲线下面右边的面积会越小,也就是发生的概率越小就越要拒绝原假设h0

6.2 计算Z检验:手动查表

6.2.1 先确定显著度水平 α

  • 如果是双边检验,是查Z( α/2)
  • 如果是单边检验,是查Z( α)

6.2.2 已知Z值和 α后,查表获得p值,然后进行比较

  • Z值表
  • 横坐标是显著度 α
  • 纵坐标是Z值
  • 交叉处即是P

6.2.3 比较p和显著度水平 α

  • 如果p<α,则拒绝原假设
  • 算出来得Z值越大,查表得p值越小,越要拒绝,两者相等的原假设

6.2.4 查表

  • 在此负Z得分表的平均值左侧找到值 。z的表项表示z的钟形曲线下方的区域。z表中的负分数对应于小于平均值的值。
  • 在此z表中的平均值右边找到值。z的表项表示z的钟形曲线下方的区域。Z表中的正分数对应于大于平均值的值。

7 例题

7.1 先确定检验方式:双样本Z检验

  • 样本1:50个
  • 样本2:50个

7.2 题目已知样本均值和方差

见表

7.3 计算Z值

参考EXCEL公式

7.4 查表获得P值

  • 第1个,因为 |Z|=0.658<1.96,所以前测两组差异不显著
  • 第2个,因为 |Z|=2.16>1.96,所以后测两组差异显著

7.4.1 第1个Z值查表p

  • z=0.658 查表 先z=0.66
  • 纵列查0.6
  • 横列找0.06
  • 查得p=0.7454 ,因为显著度是0.05,且是双边检验, 0.7454<95%,因此不是小概率事件,而接受原假设h0

7.4.2 第2个Z值查表p

  • 2.16 查表的
  • z=2.16 查表
  • 纵列查2.1
  • 横列找0.06
  • 查得p=0.9846 ,因为显著度是0.05,且是双边检验, 0.9846>95%,因此是小概率事件,而拒绝原假设h0

8 参考文章等

SPSSPRO官方文章

统计学假设检验——均值Z检验详解,入门必看! - 知乎1、简介z 检验一般用于比较样本平均值差异性。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。 对比平均值的差异性,包括一组数据与某数值的差异性或两组数据的平均值差异性,…icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/635888184

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1575227.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

性能优化-如何爽玩多线程来开发

前言 多线程大家肯定都不陌生&#xff0c;理论滚瓜烂熟&#xff0c;八股天花乱坠&#xff0c;但是大家有多少在代码中实践过呢&#xff1f;很多人在实际开发中可能就用用Async&#xff0c;new Thread()。线程池也很少有人会自己去建&#xff0c;默认的随便用用。在工作中大家对…

数据库表设计18条黄金规则

前言 对于后端开发同学来说&#xff0c;访问数据库&#xff0c;是代码中必不可少的一个环节。 系统中收集到用户的核心数据&#xff0c;为了安全性&#xff0c;我们一般会存储到数据库&#xff0c;比如&#xff1a;mysql&#xff0c;oracle等。 后端开发的日常工作&#xff…

基于ARM内核的智能手环(day8)

心率模块 输入模拟量 MPU6050 IIC 接线引脚&#xff1a; 因为这两个模块官方都提供了详细的资料和源码&#xff0c;这里不再过多赘述 项目结果展示 待机页面 有开场动画 所有页面无操作20s自动返回待机页面 主页 展示时间和温度到达预定时间蜂鸣器响起&#xff0c;按键后关…

损失函数L1Loss、L2loss区别

损失函数 L1Loss 平均绝对误差&#xff08;Mean Absolute Error&#xff0c;MAE&#xff09; 预测值和真实值之差的绝对值 L2Loss 均方误差&#xff08;Mean Square Error&#xff0c;MSE&#xff09; 是预测值和真实值之差的平方 Smooth L1 Loss/Huber Loss 平滑版本的…

wordpress全站开发指南-面向开发者及深度用户(全中文实操)--php数组与基本循环

php数组与基本循环 <?php$myName"xixi";$namesarray(xixi1,xixi2,xixi3); ?> <p> Hi ,my name is <?php echo $myName; ?> </p> <p> Hi,my name is <?php echo $names[0] ?> </p> <p> Hi,my name is <?…

全国月度平均风速空间分布数据/月度降雨量分布/月均气温分布

引言 风速是指空气相对于地球某一固定地点的运动速率。一般来讲&#xff0c;风速越大&#xff0c;风力等级越高&#xff0c;风的破坏性越大。平均风速&#xff0c;一定时段内&#xff0c;数次观测的风速的平均值。一般表达方式为[m/s]。 正文 我国位于欧亚大陆东部、太平洋西岸…

哪些医疗器械申请FDA,需要准备网络安全文件?需要提交的文件都是什么样的?

一、什么类型的医疗器械需要递交网络安全文件&#xff1f; FD&C法案第524B条(c) 条将“网络设备”定义为&#xff1a; 1&#xff09;经申请人验证、安装或授权的软件或设备&#xff1b; 2&#xff09;具备连接互联网的能力&#xff1b; 3&#xff09;包含经申请人验证、…

YOLO算法改进Backbone系列之:PVT

摘要&#xff1a;尽管基于CNNs的backbone在多种视觉任务中取得重大进展&#xff0c;但本文提出了一个用于密集预测任务的、无CNN的的简单backbone——Pyramid Vision Transformer&#xff08;PVT&#xff09;。相比于ViT专门用于图像分类的设计&#xff0c;PVT将金字塔结构引入…

每日OJ题_两个数组dp①_力扣1143. 最长公共子序列

目录 力扣1143. 最长公共子序列 解析代码 力扣1143. 最长公共子序列 1143. 最长公共子序列 难度 中等 给定两个字符串 text1 和 text2&#xff0c;返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 &#xff0c;返回 0 。 一个字符串的 子序列 是指这样…

BPMN建模示例

背景 对BPMN已经有了初步的了解&#xff0c;并且已经理解了BPMNJS这种流程引擎的工具&#xff0c;那么接下来我们已具体的案例来感性认知BPMN的能力&#xff0c;为接下来BPMN的学习做个铺垫。 是的&#xff0c;我们需要一个通俗易懂的例子&#xff0c;于是乎&#xff0c;我在…

阿里云服务器的主要用途是什么?

阿里云服务器可以干嘛&#xff1f;能干啥你还不知道么&#xff01;简单来讲可用来搭建网站、个人博客、企业官网、论坛、电子商务、AI、LLM大语言模型、测试环境等&#xff0c;阿里云百科aliyunbaike.com整理阿里云服务器的用途&#xff1a; 阿里云服务器活动 aliyunbaike.com…

文心一言指令词宝典之咨询分析篇

作者&#xff1a;哈哥撩编程&#xff08;视频号、抖音、公众号同名&#xff09; 新星计划全栈领域优秀创作者博客专家全国博客之星第四名超级个体COC上海社区主理人特约讲师谷歌亚马逊演讲嘉宾科技博主极星会首批签约作者 &#x1f3c6; 推荐专栏&#xff1a; &#x1f3c5;…

PDPS教程:镜像对象功能介绍与使用方法

目录 概述 命令说明 创建目标资源 镜像对象操作 模型保存 概述 PDPS中也有与机械设计软件相类似的模型镜像功能&#xff0c;在Process Simulate中这个功能叫做“镜像对象”&#xff0c;使用镜像对象命令可以创建与已有模型关于指定平面镜像对称的复制体&#xff08;模型实…

Day16_IDEAJavaWeb项目下在WEB-INF添加jar包导致Tomcat无法启动的问题解决记录

0 起因 自己用的是Tomcat 9.0.69&#xff0c;老师用的是Tomcat 9.0.87。本以为都是9.0.x&#xff0c;差别不会很大&#xff0c;但是老师演示的时候他没导入mysql包查询数据库的servlet就不能运行&#xff0c;而我的却可以&#xff0c;于是问了GPT&#xff0c;得到以下答复。 …

docker部署小霸王游戏

下载镜像 docker pull registry.cn-beijing.aliyuncs.com/wuxingge123/jsnes:1.0.0docker-compose部署 vim docker-compose.yml version: 3 services:jsnes:container_name: jsnesimage: registry.cn-beijing.aliyuncs.com/wuxingge123/jsnes:1.0.0ports:- 8082:80restart: …

ssm026校园美食交流系统+vue

校园美食交流系统 摘 要 1 前 言 3 第1章 概述 4 1.1 研究背景 4 1.2 研究目的 4 1.3 研究内容 4 第二章 开发技术介绍 5 2.1Java技术 6 2.2 Mysql数据库 6 2.3 B/S结构 7 2.4 SSM框架 8 第三章 系统分析 9 3.1 可行性分析 9 3.1.1 技术可行性 9 3.1.2 经济可行…

用Python做一个4399游戏脚本原来这么简单 !(内含完整思路)

说明 简述&#xff1a;本文将以4399小游戏《宠物连连看经典版2》作为测试案例&#xff0c;通过识别小图标&#xff0c;模拟鼠标点击&#xff0c;快速完成配对。对于有兴趣学习游戏脚本的同学有一定的帮助。 运行环境&#xff1a;Win10/Python3.5。 主要模块&#xff1a;win3…

【亲测有效】微信公众号设置菜单栏显示,未开启自定义菜单,微信公众平台自定义菜单接口开发

微信公众平台自定义菜单接口开发 问题:运营人员在设置微信公众号设置菜单栏显示,未开启自定义菜单解决方案(微信公众平台自定义菜单接口开发):自定义菜单-创建接口请求链接完整代码第一步:在WeChat类里添加代码情况一:没有WeChat类情况,如果已有请看情况二情况二:已有…

(2024,CLIP 文本嵌入,属性解耦与控制,编辑迁移,SDXL)通过识别语义方向在 T2I 模型中进连续目标特定的属性控制

Continuous, Subject-Specific Attribute Control in T2I Models by Identifying Semantic Directions 公和众和号&#xff1a;EDPJ&#xff08;进 Q 交流群&#xff1a;922230617 或加 VX&#xff1a;CV_EDPJ 进 V 交流群&#xff09; 目录 0. 摘要 2. 相关工作 3. 方法 …

LLM-base版本和chat版本的比较

突然想到了这个问题&#xff0c;网上搜集了一些资料&#xff0c;自己也总结一下 首先放一张llama2论文当中的图&#xff0c;可以很直观的看到区别 面试回答版 问题&#xff1a; 大语言模型base版和chat版的区别是什么&#xff1f; 回答&#xff1a; base版本更适合文本补全…