概率论的学习和整理21:用EXCEL来做假设检验(未完成草稿)

news2024/11/26 16:52:41

目录

1 EXCEL可以用来做假设检验

1.1 如何打开 数据分析 和 规划求解

1.2  EXCEL里关于正态分布的准备知识

2 基本的假设检验

2.1 最基本的假设检验,单边的Z检验

2.1 双样本F检验

2.1.1 例题

2.1.2 进行F检验之前需要满足一些假设条件

2.1.3 计算步骤

2.1.4 如何查表:下面这个图是 显著度a=0.05的F值表

 2.1.5 如何分析F检查的结果

2.2

2.5 方差分析(one-way ANOVA)


1 EXCEL可以用来做假设检验

  • EXCEL里可以做假设检验的
  • 但是需要打开加载项,数据分析才可以

1.1 如何打开 数据分析 和 规划求解

  • 开始-----选项-----加载项

  • 加载项里选择 数据分析 & 规划求解

1.2  EXCEL里关于正态分布的准备知识

  • 正态分布,
  • 正态分布曲线图,横轴是x,纵轴是概率p
  • 而normsinv是正态分布的反函数,可以根据概率求出 自变量的值
  • 函数 normsinv()
  • 函数 norm.s.inv()
  • 函数 norm.s.dist()
  • 作用是在EXCEL里配合使用  normsinv(rand()) 或 normsinv(rand()) 生成一些本身就符合正态分布的数据。
  • 如果有其他分布的反函数,理论上也可以生成符合其他分布的数据。

2 基本的假设检验

2.1 最基本的假设检验,单边的Z检验

2.2 双样本F检验

  • 最常用的应该就是用来于比较两个或多个组间的平均值是否有显著差异。
  • 原假设:一般就是认为符合,没差异等天真假设
  • F检验的原假设是所有组之间的差异是出于偶然。换句话说,原假设认为各组之间的平均值没有显著差异。
  • F检验的原理是,如果两个或多个组间的平均值或其他统计量之间存在显著差异,则组间方差(inter-group variance)会较大,而组内方差(intra-group variance)较小。
  • 因此F值=组间方差 / Σj 组内方差,如果F值越大,证明组间方差>>组内方差
  • P值 = 概率(F值 ≥ 实际F值 | 原假设) ,也就是p越小,证明 原假设--相信方差相同/期望相同的概率很小,不是观测造成,而是其他原因造成的。

​参考下面的文档

F检验结果应该怎么看? - 知乎F检验是一种统计检验,可用来比较两个或多个组间的平均值是否有显著差异。它是由Ronald Fisher发明的,因…https://www.zhihu.com/question/453744187/answer/2805042211

2.2.1 例题

2.2.2 进行F检验之前需要满足一些假设条件

  • 样本是随机取样的,也就是说,每个组中的观测值是独立的。
  • 样本是来自正态分布的总体。
  • 每个组的样本容量应该相等

2.2.3 计算步骤

  • 需要计算出三组数据的平均值,
  • 平均值等于所有数加起来的和除以数据个数。
  • 然后计算出组内方差和组间方差。    

α (alpha)是显著度           

组内方差(intra-group variance)              

  • 使用样本方差公式,组内方差等于每个数据与其所在组的平均值的差的平方和除以(组内数据个数-1)。
  1. 因为每种数据的样本容量要相同,i相同
  2. u1,u2  ... ... 是每组平均数
  3. 平均数就是最简单得算术平均数,u1=(x1+x2+....+xi)/i
  4. 如第1组组内方差,δ^2=((u1-x1)^2+(u1-x2)^2+....++(u1-xi)^2)/(i-1)
  5. 如第2组组内方差,δ^2=((u2-x1)^2+(u2-x2)^2+....++(u2-xi)^2)/(i-1)

组间方差(inter-group variance)

  • 使用样本方差公式,组间方差等于每个数据与其所在组的平均值的差的平方和除以(组的数量个数-1)。
  1. U是多组数据之和=全部数据 的平均值
  2. 假设有 j 组数组
  3. 组间方差,δ^2=((U-u1)^2+(U-u2)^2+....++(U-uj)^2)/(j-1)

F值

  • F= 组间方差除以组内方差的和。
  • F= 组间方差 / Σj 组内方差
  • 然后查表,k1组间自由度等于组数减1,k2组内自由度等于每组个数减去组数。
  • 下面的例子里,k1=2-1,k2=30-2=28
  • 如果F值打羽查表得到的F值,说明差异显著,否则说明差异不显著。

P值的计算公式如下:

  • P值 = 概率(F值 ≥ 实际F值 | 原假设)
  • 其中,原假设是所有组之间的差异是出于偶然。通过计算,P值可以得到一个概率值,表示在原假设下,观察到如此极端的结果(即F值大于或等于实际观察到的F值)的概率。
  • 通常情况下,P值小于0.05被认为是有统计学显著性的,即我们有95%的信心认为样本数据中差异的存在不是偶然造成的,而是由于实验因素或其他因素导致的。

2.2.4 如何查表:下面这个图是 显著度a=0.05的F值表 : F0.05(1,28) =4.2

  • k1,组间自由度 =j-1 =2-1   =1
  • k2,组内自由度 =i-j  =30-2 =28
  • 查表得出F值是4.2
  • 也就是 F0.05(1,28) =4.2

第一章 绪论

 ​​​​​

 2.2.5 指标意义

  • 在F检验中,p值是指在进行方差分析时,对于给定的数据集,假设所有组之间的差异是出于偶然,计算得到这个假设的的概率。
  • 具体来说,p值越小,就说明数据集的差异越显著,越有理由拒绝原假设(即所有组之间的差异是出于偶然),而接受备择假设(即存在显著差异)。换句话说,当p值小于0.05时,我们有95%的信心认为样本数据中差异的存在不是偶然造成的,而是由于实验因素或其他因素导致的。
  • 需要注意的是,p值小于0.05只表明差异是显著的存在的,但并不能说明这种差异是否有实际意义或重要性。因此,在进行统计推断时,除了p值外,还需要考虑其他因素,例如效应量的大小和样本大小等,以更全面地评估数据的结果。
  • F值表示整个拟合方程的显著性,F越大,表示方程越显著,拟合程度也就越好。
  • 另外在统计解释时一般不看F值,只需要看P值就可以了,但是在写论文时还是要将F值写出来,并把P值放在后面用括号括起来

 2.2.6 如何分析F检查的结果

 结果如下

  • 因为这是F-检验的双样本方差分析
  • p=0.48> 0.05 显著度,说明两者方差无明显差异,即方差齐性
  • 接着 选用 分析工具 中 的 t 检验 : 双 样本等方差假设

 

2.3 反向验证结果

因为数据是我用 normsinv() 生造出来的,所以一定是符合正态分布的,所以我打算用这些数据来反向验证F检验的合理性,可靠性。

 

2.3.1  生造2个有偏移量的正态数据

  • 两列数据
  • 第1列是标准正态数据
  • 第2列是标准正态数据+0.5
  • p=0.004<0.05 ,说明方差是显著有差异的

 

2.3.2 生造正态分布和其他分布的数据对比

2.2

2.5 方差分析(one-way ANOVA)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/780542.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

qs库的使用

前言 qs是一个流行的查询参数序列化和解析库。可以将一个普通的object序列化成一个查询字符串&#xff0c;或者反过来可以将一个查询字符串解析成一个object&#xff0c;而且支持复杂的嵌套。在工作中&#xff0c;最经常使用qs的地方就是请求参数格式转换的时候&#xff0c;但是…

QT通过TCP协议发送结构体数据

文章目录 前言1. memcpy方式1.1 发送整个结构体1.2 发送部分数据 2. QDataStream2.1 符号<<2.2 wrieteRawData 总结 前言 做上位机的时候下发数据&#xff0c;数据是一个结构体&#xff0c;这里就阐述一下怎么通过TCP协议发送结构体。 我自己写的时候主要通过两种方式&a…

K8S初级入门系列之五-Pod的高级特性

一、前言 前一篇我们了解了Pod的基本概念和操作&#xff0c;本篇我们继续研究Pod的一些高级特性&#xff0c;包括Pod的生命周期&#xff0c;pod探针&#xff0c;pod的调度等。 二、生命周期 1、Pod的生命周期 Pod的生命周期示意图如下&#xff1a; 挂起(Pending)&#xff0c…

webpack配置externals汇总

webpack5.88.1 vue2.7.14 vue-router3.6.5 element-ui2.15.13 ant-design-vue1.7.8 externals用于提取第三方依赖包&#xff0c;使用cdn资源的方式将第三方依赖包引入项目&#xff0c;可以大大减少项目打包体积 配置externals对象有技巧&#xff1a; key 就是 import aaa from …

No3: 学习过程中故障成长积累

文章目录 故障积累1、编码错误导致 故障积累1、编码错误导致

JDK8,JDK11,JDK17,JDK21及中间版本主要更新特性

一、版本roadmap图 官方地址&#xff1a; https://www.oracle.com/java/technologies/java-se-support-roadmap.html 从上图可以很清晰得可以看出&#xff0c;JDK7,JDK8,JDK11,JDK17,JDK21是长期维护的版本。从目前来看&#xff0c;JDK8到2023年已经有将近10年的历史了&#…

C++笔记之使用STL的function实现回调机制

C笔记之使用STL的function实现回调机制 code review! 文章目录 C笔记之使用STL的function实现回调机制1.使用普通函数2.使用匿名函数&#xff08;Lambda表达式&#xff09;3.使用函数对象&#xff08;functor&#xff09;4.运行输出 1.使用普通函数 代码 #include <funct…

【C++杂货铺】运算符重载

目录 前言一、运算符重载二、赋值运算符重载三、完善日期类3.1 重载关系运算符3.2 重载、3.3 重载-、-3.4 重载、--3.5 重载<<、>> 四、const成员五、取地址及const取地址操作符重载 前言 本文将以日期类为基础&#xff0c;去探寻运算符重载的特性与使用方法&…

小程序如何删除/修改/上下架分类

删除、修改或上下架小程序中的分类可以帮助商家更好地管理和调整分类展示。下面将介绍如何在小程序中删除、修改或上下架分类的操作步骤。 在小程序管理员后台->分类管理&#xff0c;可以看到处于上架和下架状态的分类。 删除&#xff1a;点击分类上的删除按钮&#xff0c;…

vscode使用g++编译.c文件或.cpp文件

vscode是一个跨平台、轻量级、插件非常丰厚的IDE&#xff0c;这里介绍在vscode里使用g来编译.cpp文件。g也叫GCC, 在Window中&#xff0c;是使用MinGW方式实现g的&#xff0c;它分为32位和64位2个版本&#xff0c;其中&#xff0c;MinGW-64是64位的&#xff0c;MinGW-32是32位的…

qt MainWindow设置layout失效

错误的做法&#xff1a;直接把layout设置到MainWindow上 MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), ui(new Ui::MainWindow) {ui->setupUi(this);QVBoxLayout *mainLayout new QVBoxLayout();QPushButton *btn1 new QPushButton("aa", t…

VRIO模型

VRIO模型 由美国学者Jay B.Barney 1991年在《企业资源和持续竞争优势》中提出的&#xff0c;是一个战略规划工具&#xff0c;一般用于评估和分析企业的内部资源&#xff0c;并利用这些资源获得持续的竞争力。 模型介绍 该模型指出了有四个因素对持久的竞争优势产生了影响&…

【技术面试】Java八股文业余选手-上篇(持续更新)

文章目录 1. Java 基础【√】1.1 数据结构&#xff1a;集合 Set Map List Array Tree【√】1.2 基础算法&#xff1a;排序算法、二分算法、银行家算法、最短路径算法、最少使用算法、一致性哈希算法【√】1.3 Thread【】1.4 代理、反射、流操作、Netty【√】1.5 JVM 原理【√】…

前端学习——Vue (Day2)

指令补充 指令修饰符 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevi…

PHP登陆/php登录--【强撸项目】

强撸项目系列总目录在000集 PHP要怎么学–【思维导图知识范围】 文章目录 本系列校训本项目使用技术 上效果图phpStudy 设置导数据库 项目目录如图&#xff1a;页面代码后台代码 这么丑的界面能忍&#xff1f;配套资源作业&#xff1a; 本系列校训 用免费公开视频&#xff0…

day01_springboot综合案例

springboot项目 课程目标 1. 【掌握】SSM整合 2. 【掌握】使用SSM完成查询 3. 【理解】AdminLTE 4. 【理解】理解SSM综合案例表的结构springboot环境搭建 搭建工程 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http…

docker数据网络管理

数据管理 管理 Docker 容器中数据主要有两种方式&#xff1a;数据卷&#xff08;Data Volumes&#xff09;和数据卷容器&#xff08;DataVolumes Containers&#xff09;。 1&#xff0e;数据卷 数据卷是一个供容器使用的特殊目录&#xff0c;位于容器中。可将宿主机的目录挂…

20230723红米Redmi Note8Pro掉在水里的处理步骤

20230723红米Redmi Note8Pro掉在水里的处理步骤 2023/7/23 18:18 百度搜搜&#xff1a;小米手机进水 破音怎么处理 Redmi Note8Pro 6400万全场景四摄 液冷游戏芯 4500mAh长续航 NFC 18W快充 红外遥控 https://www.zhiliancy.com/a/q5podmr12.html 首页 / 热文 / 内容 小米喇叭…

CI流水线中Jenkins应用实践丨IDCF

作者&#xff1a;达日汗&#xff0c;中国农业银行研发中心&#xff0c;系统支持部 CI &#xff08;Continuous Integration&#xff09;在维基百科中的定义是&#xff1a;经常将几个小改动合并到一个主分支中&#xff0c;强调开发人员提交了新代码之后&#xff0c;立刻进行构建…

大数据学习05-Kafka分布式集群部署

系统环境&#xff1a;centos7 软件版本&#xff1a;jdk1.8、zookeeper3.4.8、hadoop2.8.5 本次实验使用版本 kafka_2.12-3.0.0 一、安装 Kafka官网 将安装包上传至linux服务器上 解压 tar -zxvf kafka_2.12-3.0.0.tgz -C /home/local/移动目录至kafka mv kafka_2.12-3.0…