统计是一门艺术(参数假设检验)

news2024/10/5 14:41:05

1.参数假设检验

在总体分布已知的情况下,对分布中未知参数的检验。

(1)相关基本概念

零假设/原假设与对立假设/备择假设:

任务:根据样本作出是否接受H0

复合假设与简单假设:

否定域/拒绝域与接受域:

假设原假设成立,即a=a0,那么其与样本均值应该差的不太多,如果差的太多,那么就与原先的共有与样本均值应该差的不太多的常识矛盾,那么应该拒绝这个假设(是一种概率意义上的反证法)

对于H0:a=a0 H1:a>a0

如何确定其拒绝域:

即为\bar{X}-a_{0}>d

D=\left \{ (x_{1},...,x_{n})=x,x\in D \right \}D=\left \{ (x_{1},...,x_{n}),T(x_{1},...,x_{n})\in S \right \}

从n维判断变换到了一维判断,当判断区间为一个时,称为单侧检验,当判断区间为两个时,称为双侧检验。

检验函数和检验统计量:

检验函数也即为示性函数,\varphi (X) = I_{D}=I_{T(X)\in S}

在上述例子中即为,\varphi (X) =I_{\left | \bar{X}-a_{0} \right |>d}

在有时,并不是单纯的取0/1,由于样本的随机性,在拒绝域和接受域之间的一小部分值会有较大的争议,此时即为随机化检验

两类错误和功效函数:

由于样本的随机性,总会犯错误

第一类错误:P(落在拒绝域|H_{0}为真)  =\alpha    弃真错误

第二类错误:P(落在接受域|H_{1}为真)/P(落在接受域|H_{0}为假)   取伪错误

例:

在某一具体场合下,两种错误只会犯一个

我们希望两个错误都尽可能小 ,但事实上是做不到的。

为了将两个错误统一起来,引入功效函数:

对于两个概率的理解:

对于功效函数曲线的理解:

当未知参数落在拒绝域时,此时可能犯第一类错误,且概率等于\beta_{\varphi }(\theta ),应使其值尽可能低,当未知参数落在接受域时,且概率等于1-\beta_{\varphi }(\theta )此时可能犯第二类错误,应使其值尽可能大。

例:

功效函数就是拒绝域的概率
黄色区域为第二类错误的概率,非黄色区域为第一类错误的概率

检验的水平就是第一类错误发生的概率,即为p=0.2时的取值

例:

例:

未知参数的值需要讨论

例:

未知参数是自变量

基于我们希望两个错误都尽可能小 ,但事实上是做不到的现实,提出:

Neyman-Pearson原则

类比于区间估计:在保证选取的区间能够套住未知参数的前提下保证区间的长度尽可能短

保护原假设:

一些说明:

(1)检验函数:拒绝域时取值为1,接受域时取值为0

(2)功效函数:检验函数的期望,即为拒绝域的概率,此时未知参数属于全体未知参数空间

(3)功效曲线:由此有关于未知参数的功效曲线,理想的形状是在接受域时尽可能大,在拒绝域时尽可能小

2.求解假设检验问题的一般步骤

对于(1)H0与H1的选择:(很重要,具有实际意义)

a.把久经考验的事实放在H0(保护原假设)

b.把你希望得到的结论放在H1,希望通过拒绝H0得到你的结论(由于是保护原假设,那么否定原假设需要充足的证据,也就是说接受H1有充足的证据)

c.等号放在H0

否定原假设比较靠谱因为一般会有95%或90%的把握,因而否定原假设需要更多的证据,而由于保护原假设的存在,当没有充足证据拒绝原假设时就认为接受原假设。

例:

对于(2)检验统计量的建立:

a.有枢轴变量转换成的统计量(即先找未知参数的比较好的点估计,然后构造枢轴量,然后将未知参数赋予已知值)

b.似然比统计量

例:

3.正态总体的假设检验

——基于枢轴变量转化的统计量

包括两个流程:

a.假设检验流程(概率意义上的反证法)

b.假设检验方法的评价(Neyman-Pearson原则)

对于a:

假设H0为真,那么就可以使用H0的条件,由此构造统计量(将枢轴变量中的未知参数已知化),判断样本统计值是否落在拒绝域上(由于\alpha的值通常很小,小概率事件不会发生),做出判断。

对于b:

具体步骤为由I类错误条件得到d值,由II类错误判断是否最小

下面的具体例子:

对于a过程分别为:

(1)单个正态总体的均值检验

 和区间估计一模一样

对于第一个是\bar{X} \in \mu_{0} \pm d

d=\left\{\begin{matrix} \frac{\sigma }{\sqrt{n}}U_{\alpha /2} & ,\sigma^{2}known\\ \frac{S }{\sqrt{n}}t_{n-1}(\alpha /2) & ,\sigma^{2}unknown \\ \frac{S }{\sqrt{n}}U_{\alpha /2} & ,\sigma^{2}unknown,but n>30\\ \end{matrix}\right.

计算\bar{X}的值,判断是否在区间中

对于后两个是:

\mu_{0}\pm d,其中d根据情况不同

对于置信限:只需要将\alpha /2改为\alpha即可,

即为:

上限:\mu_{0} + d

下限:\mu_{0}-d

d=\left\{\begin{matrix} \frac{\sigma }{\sqrt{n}}U_{\alpha} & ,\sigma^{2}known\\ \frac{S }{\sqrt{n}}t_{n-1}(\alpha) & ,\sigma^{2}unknown \\ \frac{S }{\sqrt{n}}U_{\alpha} & ,\sigma^{2}unknown,but n>30\\ \end{matrix}\right.此时总体不必正态。

双正态总体是同样的。

对于b过程:

第一个:

对于第二个:

显著性水平的全覆盖

(2)双正态总体的均值差检验

 (1)均值差\mu _{1}-\mu_{2}的区间估计

\bar{X}-\bar{Y} \in (\mu_{1}-\mu_{2})\pm d

d=\left\{\begin{matrix} \sqrt{\frac{\sigma_{1}^{2}}{m}+\frac{\sigma_{2}^{2}}{n}}U_{\alpha /2} & ,\sigma_{1}^{2}known,\sigma_{2}^{2}known\\ \sqrt{\frac{1}{m}+\frac{1}{n}}S_{W}t_{m+n-2}(\alpha /2) & ,\sigma_{1}^{2}=\sigma_{2}^{2}=\sigma^{2}=unknown \\ \sqrt{\frac{S_{1}^{2}}{m}+\frac{S_{2}^{2}}{n}}U_{\alpha /2} & ,\sigma_{1}^{2}unknown,\sigma_{2}^{2}unknown,but n>30,m>30\\ \end{matrix}\right.

最后一种情况总体不必正态。

成组检验和成对检验:

成组检验指随机选取两组均值比较

成对检验:令Z_{i}=x_{i}-y_{i},x与y之间只有某项指标不同,其余条件相同

例:

例:

合理选择成对/成组,对于结论有重要的意义

(3)单正态总体的方差检验

(4)双正态总体的方差比检验

(5)大样本检验

例:

possion分布——>中心极限定理

不知道分布——>Behrens-Fisher方法

例:

先检验方差再在检验的基础上判断是否有差异

补充:Behrens-Fisher方法:

大样本方法就是将方差换成样本方差

小样本方法:

例:

例:

大样本:

例:

例:

4.似然比检验

定义:

步骤:

单调函数:

\lambda(X)=aT(X),将T(X)看作一个整体

例1:

一类错误/ 显著性水平:

关于单调性的解释:注意是统计量,此时的T(X)=\left | T \right |

例2:

例3:

说明:

例4:均匀分布

例5:指数分布

例:

说明在整个定义域内是单调不减的

大样本:(Wilks定理)

5.一致最优检验(UMPT)

定义:

即若为功效函数为凸函数,则在一个点取得最大值,即若当对立假设为一个点时,此时第二类错误最小,而当对立假设不为一个点时,就不是对于所有点取得最小,当与对立假设参数无关时可以。

这个定义的关键是对于对立参数空间的所有参数都要成立

由此,Neyman-Pearson引理:

例1:

也就是说既然与对立假设参数无关,那么我取任意一个都可以,他们的全体就可以组成一个不等式。

例2:

例3:

例:

6.由NP引理求一致最优检验(UMPT)

将H0和H1都变成复合检验:

证明基本思想:

对于对立假设,功效函数与对立假设参数无关

对于原假设,证明功效函数是关于假设参数的一个增函数,由此可以实现显著水平的全覆盖

例1:

例2:

例:

例:两个正态总体

例:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1880149.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python:谈谈常规滤波器(带通、低通、高通、带阻)的用法

一、滤波器的作用 滤波器在信号处理中用于移除或减少信号中的噪声,同时保持信号的某些特性。滤波器通常用于音频、视频和图像处理等领域。滤波器根据其 designed for different purposes and can be divided into several types, such as lowpass filters, highpass…

【Unity设计模式】✨使用 MVC 和 MVP 编程模式

前言 最近在学习Unity游戏设计模式,看到两本比较适合入门的书,一本是unity官方的 《Level up your programming with game programming patterns》 ,另一本是 《游戏编程模式》 这两本书介绍了大部分会使用到的设计模式,因此很值得学习 本…

Linux rpm与yum

一、rpm包管理 rpm用于互联网下载包的打包及安装工具,它包含在某些Linux分发版中。它生成具有.RPM扩展名的文件。RPM是RedHat Package Manager (RedHat软件包管理工具)的缩写,类似windows的setup.exe,这一文件格式名称虽然打上了R…

Python pip install模块时C++编译环境问题

pip install模块时C编译环境问题 在接触和使用python后,常常会通过pip install命令安装第三方模块,大多数模块可以直接安装,但许多新同学仍会遇见某些模块需要实时编译后才能安装,如报错信息大概是缺乏C编译环境,本文则…

Golang-GMP

GMP调度 golang-GMP语雀笔记整理 GMP调度设计目的,为何设计GMP?GMP的底层实现几个核心数据结构GMP调度流程 设计目的,为何设计GMP? 无论是多进程、多线程目的都是为了并发提高cpu的利用率,但多进程、多线程都存在局限性。比如多进程通过时…

Python变量的命名规则与赋值方式

第二章:Python 基础语法 第一节:变量的命名规则与赋值方式 2.1.1 引言 在编程中,变量是存储数据的基本单元。变量的命名和赋值是编程语言中表达和操作数据的基础。了解和遵循变量命名规则对于编写清晰、可维护的代码至关重要。 2.1.2 变量…

嵌入式Linux系统编程 — 5.2 Linux系统时间与日期

目录 1 了解Linux系统时间 1.1 几种常用的时间 1.2 如何查看几种常用的时间 1.3 Linux 系统中的时间 2 time、gettimeofday获取时间 2.1 time函数 2.2 ​​​​​​​gettimeofday函数: 2.3 示例程序 3 时间转换函数 3.1 ctime与ctime_r函数 3.2 localti…

小白学python(第四天)顺序与分支篇

这几天因为个人原因,python篇会更新比较慢,还望大家谅解,那么废话不多说,我们现在就进入正题 顺序篇 这个没啥好说的,就是自上而下,依次执行 分支篇 条件(if)语句语法格式&#…

Listary(Windows 文件搜索工具)专业版值得购买吗?

说到经典的国货软件,有一款 Win 软件是一定绕不过去的。它就是知名的本地文件搜索工具 Listary! 便捷的文件搜索窗口;快捷操作的体验;与系统更匹配的外观设计;更智能的排序和更可靠的索引。 便捷的文件搜索窗口 紧凑…

百亿级存储架构: ElasticSearch+HBase 海量存储架构与实现

百亿级存储架构: ElasticSearchHBase 海量存储架构与实现 尼恩:百亿级数据存储架构起源 在40岁老架构师 尼恩的读者交流群(50)中,经常性的指导小伙伴们改造简历。 经过尼恩的改造之后,很多小伙伴拿到了一线互联网企业如得物、阿…

AI大模型API:驱动人工智能创新的核心引擎

在当今快速发展的人工智能领域,AI大模型API成为了开发者必备的利器。这些API为开发者提供了强大的人工智能模型和算法,使他们能够轻松地构建智能化应用和解决方案。作为开发者,我们可以借助AI大模型API实现自然语言处理、图像识别、声音合成等…

windows电脑使用netsh添加端口转发、设置端口转发和删除端口转发

目录 1. 添加端口转发 2. 查看是否添加成功 3. 设置端口转发 4. 删除端口转发 除查看命令外,其他命令需要以管理员方式运行。 1. 添加端口转发 命令: netsh interface portproxy add v4tov4 listenaddress你的外部IP listenport你的外部端口 conne…

Winform使用Flurl调用WebApi的基本用法

微信公众号“CSharp编程大全"的文章《.NET超简单轻量级的HTTP请求组件Flurl》介绍了便捷构建URL及创建HTTP请求的.NET模块Flurl。与HttpClient相比,Flurl封装的更简捷易用,代码量更少。本文学习并测试基于Fluri调用WebApi的基本用法。   基于Fluri调用WebApi…

DIY智能音箱:基于STM32的低成本解决方案 (附详细教程)

摘要: 本文详细介绍了基于STM32的智能音箱的设计与实现过程,包括硬件设计、软件架构、语音识别、音乐播放等关键技术。通过图文并茂的方式,结合Mermaid流程图和代码示例,帮助读者深入理解智能音箱的工作原理,并提供实际操作指导。…

51单片机第11步_在C语言中插入汇编语言

本章重点介绍如何在C语言中插入汇编语言。要不是有记录,真不知道怎么搞。 /* 你在 Project Workspace窗口中,将光标移到DELAY.c处,点下鼠标右键,选择"Options for file DELAY.c", 点击右边的"Generate Assembler SRC File"和“Assemble SRC …

recogito-js:用于文本注释/图像注释的前端插件

创建批注: 继续批注: 右侧批注列表: 1、功能与应用: 文本注释:recogito-js可以将注释功能添加到网页上,或者作为构建完全自定义注释应用程序的工具箱。图像注释:除了文本注释外,它还…

ros笔记01--初次体验ros2

ros笔记01--初次体验ros2 介绍安装ros2测试验证ros2说明 介绍 机器人操作系统(ROS)是一组用于构建机器人应用程序的软件库和工具。从驱动程序和最先进的算法到强大的开发者工具,ROS拥有我们下一个机器人项目所需的开源工具。 当前ros已经应用到各类机器人项目开发中…

python sklearn机械学习模型-回归

🌈所属专栏:【机械学习】✨作者主页: Mr.Zwq✔️个人简介:一个正在努力学技术的Python领域创作者,擅长爬虫,逆向,全栈方向,专注基础和实战分享,欢迎咨询! 您…

可编程定时计数器8253/8254 - 8253入门

时钟-给设备打拍子 概述 在计算机系统中,为了使所有设备之间的通信井然有序,各通信设备间必须有统一的节奏,不能各干各的,这个节奏就被称为定时或时钟 时钟并不是计算机处理速度的衡量,而是一种使设备间相互配合而避…

从需求是如何最终抽象成最基本的传参入参

第一层:出参和入参 用通俗的话讲,就是给客户提供服务的一种方式,需要包含入参和出参 。入口参数就是程序执行时会调用的参数,出口参数就是程序执行完会返回的参数。入参的值是被调函数需要, 出参的值是主调函数需要的…