[闲聊统计]之参数估计是什么?(下)

news2024/11/23 3:57:02

  我们在前面说了一下参数估计中的点估计,接下来,我们来讲一下区间估计。

区间估计——在点估计的基础上,给出总体参数估计的一个估计区间,该区间由样本统计量加减估计误差而得到。

  • 置信水平——如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数(confidence coefficient)。常用的置信水平有90%、95%和99%。


  如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。
  也就是说,我现在有100个总体,现在随机抽取20个作为样本,那么这样的样本就会有很多个。假设有100个样本,那么就对应100个置信区间,在这100个置信区间里面,有95个区间包含总体参数的真值,就说明这是置信水平为95%的置信区间。**所以说,置信水平是所构造的区间中包含真值的比例,而不是所构造的某个区间包含真值的概率。**一个特定区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。例如,区间为【60,70】,那么80就没在这个区间内,不存在“80以90%的概率在【60,70】内”的这样的说法。


  如上图所示,我们依据不同的样本构造了20个置信区间。在这些区间中,有些包含了总体参数真值 μ \mu μ,有些就没有包含。
  实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。我们希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。

若我们按照99%的置信水平构造置信区间,也就是说,所构造的区间中包含真值的比例为99%,说明包含真值的区间很多,那我们随机抽取一个,就会觉得抽中包含真值的区间的概率很大。

对于区间估计而言,我们只考虑 μ \mu μ σ 2 σ^2 σ2区间估计,例如两个正态总体就是考虑 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 σ 1 2 / σ 2 2 σ_1^2/σ_2^2 σ12/σ22的区间估计,这是因为我们只知道 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 σ 1 2 / σ 2 2 σ_1^2/σ_2^2 σ12/σ22分布函数(分布函数说白了就是规律分布,没有规律就无法进行预测),而我们没办法知道 μ 1 / μ 2 \mu_1/\mu_2 μ1/μ2 σ 1 2 − σ 2 2 σ_1^2-σ_2^2 σ12σ22分布函数,所以就不能对这两个进行参数估计。

1.一个总体参数的区间估计

1.1 总体均值的区间估计

1.1.1 正态总体,方差已知,或非正态总体,大样本

  当总体服从正态分布且 σ 2 σ^2 σ2已知时,或者总体不是正态分布但为大样本时,样本均值 x ‾ \overline{x} x的抽样分布均为正态分布,其数学期望为总体均值 μ μ μ,方差为 σ 2 / n σ^2/n σ2/n。而样本均值经过标准化以后的随机变量服从标准正态分布,即


  总体均值 μ μ μ 1 − α 1-α 1α置信水平下的置信区间为

  • 如果总体服从正态分布但 σ 2 σ^2 σ2未知,或总体并不服从正态分布,只要是在大样本条件下,上式中的总体方差 σ 2 σ^2 σ2就可以用样本方差 s 2 s^2 s2代替,这时总体均值 μ μ μ 1 − α 1-α 1α置信水平下的置信区间可以写为:
1.1.2 正态总体,方差未知,小样本

  如果总体方差 σ 2 σ^2 σ2未知,而且是在小样本情况下,则需要用样本方差 s 2 s^2 s2代替 σ 2 σ^2 σ2,这时,样本均值经过标准化以后的随机变量服从自由度为 ( n − 1 ) (n-1) (n1) t t t分布,即


  根据 t t t分布建立的总体均值 μ μ μ 1 − α 1-α 1α置信水平下的置信区间为:

1.1.3 一个总体均值的区间估计小结

总而言之,如果总体参数已知,那么我们就用总体参数的真实值,毕竟是要估计总体参数。若未知,则用样本来代替。常用的是样本均值代替总体均值,样本方差代替总体方差。

1.2 总体比例的区间估计

  当样本量足够大时,比例 p p p的抽样分布可用正态分布近似。 p p p的数学期望为 E ( p ) = π E(p)=π E(p)=π;p的方差为 σ p 2 = π ( 1 − π ) n \sigma_{\mathfrak{p}}^2=\frac{\pi\left(1-\pi\right)}{\mathfrak{n}} σp2=nπ(1π)。样本比例经标准化后的随机变量服从标准正态分布,即


  在样本比例 p p p的基础上加减估计误差 Z α / 2 σ p Z_{\alpha/2}\sigma_{p} Zα/2σp,即得总体比例 π π π 1 − α 1−α 1α置信水平下的置信区间为:


  用样本比例 p p p来代替 π π π时,总体比例的置信区间可表示为:

1.3 总体方差的区间估计

  建立总体方差 σ 2 σ^2 σ2的置信区间,也就是要找到一个 χ 2 χ2 χ2值,使其满足


  由于 ( n − 1 ) s 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)s^2}{\sigma^2}\sim\chi^2(n-1) σ2(n1)s2χ2(n1),可用它来代替 χ 2 χ2 χ2,于是有


  根据上式可推导出总体方差 σ 2 σ^2 σ2 1 − α 1−α 1α置信水平下的置信区间为:

2.两个总体参数的区间估计

1.1 两个总体均值之差的区间估计-独立大样本

独立样本(independent sample)——如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立

  如果两个总体都为正态分布,或两个总体不服从正态分布但两个样本都为大样本 ( n 1 ≥ 30 和 n 2 ≥ 30 ) (n_1≥30和n_2≥30) (n130n230),根据抽样分布的知识可知,两个样本均值之差KaTeX parse error: Expected 'EOF', got '̅' at position 3: x ̲̅_1-x ̅_2的抽样分布服从期望值为 ( μ 1 − μ 2 ) (μ_1−μ_2) (μ1μ2)、方差为 ( σ 1 2 / n 1 + σ 2 2 / n 2 ) (σ_1^2/n_1+σ_2^2/n_2) (σ12/n1+σ22/n2)的正态分布,两个样本均值之差经标准化后服从标准正态分布,即

  当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22都已知时,两个总体均值之差 μ 1 − μ 2 μ_1−μ_2 μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:


  当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知时,可用两个样本方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22来代替,这时,两个总体均值之差 μ 1 − μ 2 μ_1−μ_2 μ1μ2 1 − α 1-α 1α置信水平下的置信区间为:

1.2 两个总体均值之差的区间估计-独立小样本

  • 方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知但相等
      当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知但相等时,即 σ 1 2 = σ 2 2 σ_1^2=σ_2^2 σ12=σ22,需要用两个样本的方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22来估计,这时,需要将两个样本的数据组合在一起,以给出总体方差的合并估计量 s p 2 s_p^2 sp2,计算公式为:

      这时,两个样本均值之差经标准化后服从自由度为 ( n 1 + n 2 − 2 ) (n1+n2−2) (n1+n22) t t t分布,即


  因此,两个总体均值之差 μ 1 − μ 2 μ_1−μ_2 μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:

  • 方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知且不相等
      当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知但相等时,即 σ 1 2 = σ 2 2 σ_1^2=σ_2^2 σ12=σ22,需要用两个样本的方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22来估计,这时,需要将两个样本的数据组合在一起,以给出总体方差的合并估计量 s p 2 s_p^2 sp2,计算公式为:
      两个样本均值之差经标准化后近似服从自由度为 v v v t t t分布,自由度 v v v的计算公式为:


  两个总体均值之差在 1 − α 1−α 1α置信水平下的置信区间为:

1.3 两个总体均值之差的区间估计——匹配样本

匹配样本,就是两个样本有关系,不独立。例如:A班期中和期末成绩,这就是一个匹配样本,存在一一对应的关系;而A班期中和B班期中则就是独立样本。

  在大样本情况下,两个总体均值之差 μ d = μ 1 − μ 2 μ_d=μ_1−μ_2 μd=μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:

  式中, d d d表示两个匹配样本对应数据的差值;KaTeX parse error: Expected 'EOF', got '̅' at position 3: d ̲̅表示各差值的均值; σ d σ_d σd表示各差值的标准差。当总体的 σ d σ_d σd未知时,可用样本差值的标准差 s d s_d sd来代替。
  在小样本情况下,假定两个总体各观察值的配对差服从正态分布。两个总体均值之差 μ d = μ 1 − μ 2 μ_d=μ_1−μ_2 μd=μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:

1.3 两个总体比例之差的区间估计

  由样本比例的抽样分布可知,从两个二项总体中抽出两个独立的样本,则两个样本比例之差的抽样分布服从正态分布。同样,两个样本的比例之差经标准化后服从标准正态分布,即


  两个总体比例 π 1 π_1 π1 π 2 π_2 π2未知时,可用样本比例 p 1 p_1 p1 p 2 p_2 p2来代替,根据正态分布
建立的两个总体比例之差 π 1 − π 2 π_1−π_2 π1π2 1 − α 1−α 1α置信水平下的置信区间为:

1.3 两个总体方差比的区间估计

  建立两个总体方差比的置信区间,也就是要找到一个 F F F值,使其满足


  由于 s 1 2 s 2 2 ⋅ σ 2 2 σ 1 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{s_1^2}{s_2^2}\cdot\frac{\sigma_2^2}{\sigma_1^2}\sim F(n_1-1,n_2-1) s22s12σ12σ22F(n11,n21),故可用它来代替 F F F,于是有


  由此可以推导出两个总体方差比 σ 1 2 / σ 2 2 σ_1^2/σ_2^2 σ12/σ22 1 − α 1−α 1α置信水平下的置信区间为:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1583618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年河北省职业院校技能大赛高职组“信息安全管理与评估”赛项样题

培训、环境、资料、考证 公众号:Geek极安云科 网络安全群:775454947 网络系统管理群:223627079 网络建设与运维群:870959784 极安云科专注于技能提升,赋能 2024年广东省高校的技能提升,受赋能的客户院校均…

谈谈什么是 Redis

🔥博客主页:fly in the sky - CSDN博客 🚀欢迎各位:点赞👍收藏⭐️留言✍️🚀 🎆慢品人间烟火色,闲观万事岁月长🎆 📖希望我写的博客对你有所帮助,如有不足,请指正&#…

深入了解Redis——持久化

一,Redis持久化 Redis持久化即将内存中的数据持久化到磁盘中,在下一次重启后还能进行使用,Redis持久化分为RDB和AOF两种,我们接下来分别介绍RDB和AOF的内部原理和区别 RDB Redis运行时会将当前的内存快照存入至磁盘中&#xff…

Java八股-3

面向对象基础 面向对象与面向过程的区别 面向过程把解决问题的过程拆解成一个个方法,通过一个个方法的执行来解决问题。 面向对象会先抽象出对象,再用对象执行方法的方式来解决问题。 面向对象开发的程序一般更易维护、易复用、易扩展。 创建一个对…

linux内核驱动-在内核代码里添加设备结点

linux中,一切皆文件 我们在用户层用一些系统函数(如:fopen等等)时,会进入内核,内核会在字符注册了的设备号链表中查找。如果找到就运行我们写的设备文件的(驱动)函数 我们在前面已经…

1.2.4 采用Java配置类管理Bean

本实战将演示如何使用Java配置类管理Bean,实现基于注解的IoC容器的配置。 创建新包 在net.huawei.spring根包里创建day04子包。 创建杀龙任务类 在day04子包里创建SlayDragonQuest类。在该类上不添加Component注解。 创建勇敢骑士类 在day04子包里创建BraveKnight…

07 Php学习:运算符

PHP 算术运算符 在 PHP 中,算术运算符用于执行基本的数学运算,包括加法、减法、乘法、除法、取余数,负数运算、取反和并置运算。以下是这些运算符的详细解释和示例: 加法运算符 :用于将两个数值相加。 $a 5; $b 3;…

【复现】用友NC-Cloud文件上传漏洞_70

目录 一.概述 二 .漏洞影响 三.漏洞复现 1. 漏洞一: 四.修复建议: 五. 搜索语法: 六.免责声明 一.概述 用友NC Cloud大型企业数字化平台,深度应用新一代数字智能技术,完全基于云原生架构,打造开放、…

【Qt 学习笔记】Qt信号和槽的其他说明及Lambda表达式

博客主页:Duck Bro 博客主页系列专栏:Qt 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ Qt信号和槽的其他说明及Lambda表达式 文章编号:Qt 学习笔记…

团结引擎+OpenHarmony 2 xlua编译篇

文章目录 前言一、下载 xlua 源码二、OpenHarmony SDK三、开干 前言 提示:我们的 app 鸿蒙化过程 需要用到 xlua ,目前没有适配 OpenHarmony 平台,所以需要重新编译一下。编译有多种方式,但是我只会这一种 就是使用 cmake。 一、下载 xlua 源…

【UE5 C++】访问修饰符public/protected/private继承

限制类与类之间访问级别的方法 public 在类中创建一个public的部分,即" public: ",public之下的所有内容都是公共的,可以在类之间访问 private(最常见) 如若没有指明修饰符,则默认为private 不能在类的外…

如何保证消息不丢失?——使用rabbitmq的死信队列!

如何保证消息不丢失?——使用rabbitmq的死信队列! 1、什么是死信 在 RabbitMQ 中充当主角的就是消息,在不同场景下,消息会有不同地表现。 死信就是消息在特定场景下的一种表现形式,这些场景包括: 消息被拒绝访问&am…

what is tty?

waht is tty? 黑话:TTY 为什么使用Linux的时候CtrlC就会终止一个命令运行,ta是如何设置的? stty -a 桌面切换 CTRL ALT F1 – 锁屏 CTRL ALT F2 – 桌面环境 CTRL ALT F3 – TTY3 CTRL ALT F4 – TTY4 CTRL ALT F5 – TTY5 CTRL ALT F6 – TTY6

《C++程序设计》阅读笔记【7-堆和拷贝构造函数】

🌈个人主页:godspeed_lucip 🔥 系列专栏:《C程序设计》阅读笔记 本文对应的PDF源文件请关注微信公众号程序员刘同学,回复C程序设计获取下载链接。 1 堆与拷贝构造函数1.1 概述1.2 分配堆对象1.3 拷贝构造函数1.3.1 默…

python画图Matplotlib和Seaborn

python画图Matplotlib和Season 一、Matplotlib1、介绍2、安装3、内容二、Seaborn1、介绍2、安装3、内容一、Matplotlib Matplotlib官网 1、介绍 Matplotlib 是一个 Python 的绘图库,用于创建高质量的二维图表和一些基本的三维图表。它广泛应用于科学计算、数据分析、工程学和…

面试经典算法系列之双指针1 -- 合并两个有序数组

面试经典算法题1 – 合并两个有序数组 LeetCode.88 公众号:阿Q技术站 问题描述 给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目。 请你 合并 nums2 到 nums1 中&#…

LangChain入门:17.使用 ConversationChain实现对话记忆功能

在默认情况下,无论是 LLM 还是代理都是无状态的,每次模型的调用都是独立于其他交互的。也就是说,我们每次通过 API 开始和大语言模型展开一次新的对话,它都不知道你其实昨天或者前天曾经和它聊过天了。 你肯定会说,不可…

全新智慧公厕解决方案,一键查看附近公厕情况

随着城市化进程的不断加快,人口密集地区的公共厕所需求日益增长,而传统的公厕管理方式已经无法满足人们对卫生、便利的需求。为了提升公共卫生设施的管理水平和服务质量,一家智能科技公司近日推出了全新智慧公厕解决方案,通过手机…

Cohere推出全新升级版RAG大型AI模型:支持中文,搭载1040亿参数,现开源其权重!

4月5日,知名类ChatGPT平台Cohere在其官方网站上发布了一款全新的模型——Command R。 据官方消息,Command R拥有1040亿个参数,并且支持包括英语、中文、法语、德语在内的10种语言。这一模型的显著特点之一在于其对内置的RAG(检索增…

【日期】获取当天以及未来三天的日期和周几

// 获取当天以及未来三天的日期和周几getDates() {const today new Date();const dayOfWeek ["星期日", "星期一", "星期二", "星期三", "星期四", "星期五", "星期六"];const todayDate today.toDa…