看见统计——第四章 统计推断:频率学派

news2024/9/21 19:04:27

看见统计——第四章 统计推断:频率学派

接下来三节的主题是中心极限定理的应用。在不了解随机变量序列 { X i } \{X_i\} {Xi} 的潜在分布的情况下,对于大样本量,中心极限定理给出了关于样本均值的声明。例如,如果 Y Y Y 是一个 N ( 0 , 1 ) N(0,1) N(01) 随机变量,并且 { X i } \{X_i\} {Xi}的独立同分布具有平均值 μ μ μ 和方差 σ 2 σ^2 σ2,那么
P ( X ‾ − μ σ / n ∈ A ) ≈ P ( Y ∈ A ) P(\frac{\overline{X}-\mu}{\sigma /\sqrt{n}}\in A)\approx P(Y\in A) P(σ/n XμA)P(YA)
特别是,如果我们想要一个 Y Y Y 以概率 0.95 0.95 0.95 落点的区间,我们可以在网上或书中查找 z z z 表,,对于 N ( 0 , 1 ) N(0,1) N(01) 随机变量 Y Y Y
P ( Y ∈ ( − 1.96 , 1.96 ) ) = P ( − 1.96 ≤ Y ≤ 1.96 ) = 0.95 P(Y\in(-1.96,1.96))=P(-1.96\le Y\le 1.96) = 0.95 P(Y(1.96,1.96))=P(1.96Y1.96)=0.95
由于 X ‾ − μ σ / n \frac{\overline{X}-\mu}{\sigma /\sqrt{n}} σ/n Xμ 接近于 N ( 0 , 1 ) N(0,1) N(01) ,这意味着
P ( − 1.96 ≤ X ‾ − μ σ / n ≤ 1.96 ) = 0.95 P(-1.96\le \frac{\overline{X}-\mu}{\sigma /\sqrt{n}}\le 1.96) = 0.95 P(1.96σ/n Xμ1.96)=0.95
从上述声明中,我们可以对实验进行陈述,以量化置信度,接受或拒绝假设。

置信区间Confidence Intervals

假设在美国总统选举期间,我们对倾向于支持希拉里而非特朗普的人所占的比例 p p p 感兴趣。我们可以打电话给这个国家的每个人,记录他们支持的人,这种做法显然不现实。相反,我们可以取一堆样本 X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn,其中
X i = { 1 第 i 个人更支持希拉里 0 其它 X_i=\begin{cases} 1& 第i个人更支持希拉里\\ 0& 其它 \end{cases} Xi={10i个人更支持希拉里其它
那么样本均 X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\frac{1}{n}\sum_{i=1}^{n}X_i X=n1i=1nXi 就是我们样本中偏爱希拉里的比例。假设 p p p 是更喜欢希拉里的真实比例( p p p 未知)。注意 E ( X ‾ ) = p E(\overline{X})=p E(X)=p。然后通过 C L T CLT CLT(中心极限定理),
X ‾ − μ σ / n ∼ N ( 0 , 1 ) \frac{\overline{X}-\mu}{\sigma /\sqrt{n}} \sim N(0,1) σ/n XμN(0,1)
由于我们不知道 σ σ σ 的真实值,我们使用样本方差来估计它,定义如下:
S 2 ≐ 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2\doteq \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2 S2n11i=1n(XiX)2
这是 σ 2 σ^2 σ2 的一致估计量,因此当 n n n 很大时,它与真方差 σ 2 σ^2 σ2 相差很大的概率很小。因此,我们可以将表达式中的 σ σ σ 替换为 S = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S= \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2} S=n11i=1n(XiX)2 。由于 X ‾ − μ S / n \frac{\overline{X}-\mu}{S /\sqrt{n}} S/n Xμ 接近于 N ( 0 , 1 ) N(0,1) N(01) ,这意味着
P ( − 1.96 ≤ X ‾ − μ S / n ≤ 1.96 ) = 0.95 P(-1.96\le \frac{\overline{X}-\mu}{S /\sqrt{n}}\le 1.96) = 0.95 P(1.96S/n Xμ1.96)=0.95
重新排列 p p p 的表达式,我们有

image-20230219193456273

即使我们不知道 p p p 的真实值,我们可以从上面的表达式得出结论, p p p 有0.95的概率在如下区间中:
( X ‾ − 1.96 ⋅ S n , X ‾ + 1.96 ⋅ S n ) (\overline{X}-1.96 \cdot \frac{S}{\sqrt{n}},\overline{X}+1.96 \cdot \frac{S}{\sqrt{n}}) (X1.96n S,X+1.96n S)
这被称为参数 p p p 的95%的置信度区间。此近似适用于较大的 n n n 值,通常要确保 n > 30 n>30 n>30 。可视化如下:

love

假设检验Hypothesis Testing

让我们回到2016年总统选举中决定选民偏好的例子。假设我们怀疑支持希拉里的选民比例大于 1 / 2 1/2 1/2 ,并且我们从美国人口中抽取了标记为 { X i } i n = 1 \{X_i\}^n_i=1 {Xi}in=1的样本。基于这些样本,我们能支持或否定希拉里更受欢迎的假设吗?我们对我们的结论有多大的信心?假设检验是帮助回答这些问题的完美工具

构建一个测试

本文中的假设是关于感兴趣的参数的声明。在总统选举的例子中,感兴趣的参数是 p p p ,即支持希拉里的人所占的比。那么一个假设可能是 p > 0.5 p>0.5 p>0.5 ,即超过一半的人支持希拉里。

假设检验有四个主要组成部分。

  1. 备择假设alternative hypothesis,表示为 H a H_a Ha ,是一个我们想要支持的主张。在前面的例子中,备择假设为 p > 0.5 p>0.5 p>0.5

  2. 零假设null hypothesis,记为 H 0 H_0 H0,与备择假设相反。在这种情况下,零假设是 p ≤ 0.5 p≤0.5 p0.5 ,即只有不到一半的人支持希拉里。

  3. 检验统计量test statistic,是样本观测值的函数。基于检验统计量,我们将接受或拒绝零假设。在前面的例子中,检验统计量是样本均值 X ‾ \overline{X} X 。样本均值通常是许多假设检验的检验统计量。

  4. 拒绝域rejection region是样本空间 Ω Ω Ω 的子集,它决定是否拒绝零假设。如果检验统计量落在拒绝域,那么我们拒绝原假设。否则,我们接受。在总统选举的例子中,拒绝区域为
    R R : { ( x 1 , x 2 , . . . , x n ) : X ‾ > k } RR:\{(x_1,x_2,...,x_n):\overline{X}>k\} RR:{(x1,x2,...,xn):X>k}
    这种表示法意味着如果 X ‾ \overline{X} X 落在区间 ( k , ∞ ) (k,∞) (k),我们将拒绝,其中 k k k 是我们必须确定的某个数字。 k k kType I error 决定,它在下一节中定义。一旦计算出 k k k ,我们根据检验统计量的值拒绝或接受零假设,检验完成。

Tailed Test - an overview | ScienceDirect Topics

错误类型

在假设检验中有两种基本类型的错误。它们分别表示为 I I I 型和 I I II II 型错误。

🔥 定义 :当 H 0 H_0 H0 实际上为真,我们却拒绝它时,就犯了 I I I 型错误。Type I error的概率通常记为 α α α

换句话说, α α α 是假阳性的概率。

🔥 定义 :当 H 0 H_0 H0 实际上为假,我们却接受它时,就犯了 I I II II 型错误。Type II error的概率通常记为 β β β

换句话说, β β β 是假阴性的概率。

在假设检验的背景下, α α α 将决定拒绝域。如果我们将假阳性的概率限制在小于0.05,那么我们有
P ( X ‾ ∈ R R ∣ H 0 ) ≤ 0.05 P(\overline{X}\in RR|H_0)\le 0.05 P(XRRH0)0.05
即假设 H 0 H_0 H0 为真,我们的检验统计量落在拒绝域(意味着我们拒绝 H 0 H_0 H0 ),概率为0.05。继续我们的总统选举的例子,拒绝域的形式是 X ‾ > k \overline{X} > k X>k,零假设是 p ≤ 0.5 p≤0.5 p0.5。我们上面的表达式就变成了
P ( X ‾ > k ∣ p ≤ 5 ) ≤ 0.05 P(\overline{X}>k|p\le 5)\le 0.05 P(X>kp5)0.05
如果 n > 30 n>30 n>30 ,那我们可以应用中心极限定理

image-20230219201602996

其中 Y Y Y N ( 0 , 1 ) N(0,1) N(0,1) 的随机变量。由于 p ≤ 0.5 p≤0.5 p0.5 意味着 k − p S / n ≥ k − 0.5 S / n \frac{k-p}{S/\sqrt{n}} \ge \frac{k-0.5}{S/\sqrt{n}} S/n kpS/n k0.5,我们也必须有

image-20230219201852165

因此

image-20230219201918121

因此,如果我们将不等式右侧的概率限定为0.05,那么我们也将不等式左侧的概率(I型误差 α α α )限定为0.05。由于 Y Y Y N ( 0 , 1 ) N(0,1) N(0,1) 的随机变量,我们可以查 z z z 表,找到 z 0.05 = − 1.64 z_{0.05} =−1.64 z0.05=1.64,因此

image-20230219202104529

k − 0.5 S / n = 1.64 \frac{k-0.5}{S/\sqrt{n}}=1.64 S/n k0.5=1.64,我们可以求解 k k k 来确定拒绝域:
k = 0.5 + 1.64 ⋅ S n k=0.5+1.64\cdot \frac{S}{\sqrt{n}} k=0.5+1.64n S
由于我们的拒绝域形式为 X ‾ > k \overline{X} > k X>k,我们只需检查 X ‾ > 0.5 + 1.64 ⋅ S n \overline{X} > 0.5+1.64\cdot \frac{S}{\sqrt{n}} X>0.5+1.64n S。如果这是真的,那么我们拒绝零假设,并得出结论,超过一半的人口支持希拉里。因为我们设 α = 0.05 α = 0.05 α=0.05 ,所以我们有 1 − α = 0.95 1−α = 0.95 1α=0.95 的把握相信我们的结论是正确的。

在上面的例子中,我们通过为 p p p 代入0.5来确定拒绝域,即使零假设为 p ≤ 0.5 p≤0.5 p0.5 。这就好像我们的零假设是 H 0 : p = 0.5 H_0: p = 0.5 H0:p=0.5,而不是 H 0 : p ≤ 0.5 H_0: p≤0.5 H0:p0.5。一般来说,当我们确定拒绝域时,可以简化 H 0 H_0 H0 ,并假设边界情况(在这种情况下 p = 0.5 p = 0.5 p=0.5)。

p-Values

正如我们在上一节中看到的,选定的 α α α 确定了拒绝域,因此假阳性的概率小于 α α α 。现在假设我们观察一些检验统计数据,比如说,支持希拉里的选民 X ‾ \overline{X} X 的样本比例。然后,我们提出以下问题。给定 X ‾ \overline{X} X,使我们仍然拒绝零假设的 α α α 的最小值是多少?这将引出以下定义。
p = min ⁡ { α ∈ ( 0 , 1 ) : Reject  H 0  using an α level test } p =\min\{\alpha \in(0,1):\text{Reject}\ H_0\ \text{using an α level test}\} p=min{α(0,1):Reject H0 using an α level test}
p p p 值即我们仍然拒绝零假设的 α α α 的最小值。

下面我们通过一个例子来说明。

🍌 假设我们对 n n n 个人进行抽样,问他们更喜欢哪个候选人。就像我们之前做的那样,我们可以将每个人表示为一个指标函数,
X i = { 1 第 i 个人更支持希拉里 0 其它 X_i=\begin{cases} 1& 第i个人更支持希拉里\\ 0& 其它 \end{cases} Xi={10i个人更支持希拉里其它
那么 X ‾ \overline{X} X 是样本中倾向于希拉里的比例。在取了 n n n 个样本后,假设我们观察到 X ‾ = 0.7 \overline{X}=0.7 X=0.7 。如果我们要建立一个假设检验,我们的假设,检验统计量和拒绝域将是

image-20230219214419995

其中 q q q 是整个美国人口中支持希拉里的真实比例。使用直观的定义, p p p 值是我们观察到比 0.7 0.7 0.7 更极端的概率。由于零假设是 q ≤ 0.5 q≤0.5 q0.5 ,在这种情况下,"更极端” 意味着 “大于0.7”。因此, p p p 值是指在给定一个新的样本时,我们观察到新 X ‾ \overline{X} X 大于0.7的概率,假设无效,即 q ≤ 0.5 q≤0.5 q0.5 X ‾ \overline{X} X 归一化有
P ( X ‾ > 0.7 ∣ H 0 ) = P ( X ‾ − 0.5 S / n > 0.7 − 0.5 S / n ) ≈ P ( Y > 0.7 − 0.5 S / n ) ≐ p P( \overline{X}>0.7|H_0 )=P(\frac{\overline{X}-0.5}{S/\sqrt{n}}>\frac{0.7-0.5}{S/\sqrt{n}})\approx P(Y>\frac{0.7-0.5}{S/\sqrt{n}})\doteq p P(X>0.7∣H0)=P(S/n X0.5>S/n 0.70.5)P(Y>S/n 0.70.5)p
其中 Y ∼ N ( 0 , 1 ) Y\sim N(0,1) YN(0,1)。然后,我们将计算值 z p ≐ 0.7 − 0.5 S / n z_p\doteq \frac{0.7-0.5}{S/\sqrt{n}} zpS/n 0.70.5。然后,我们将查找 z z z 表并找到与 z p z_p zp 对应的概率,记为 p p p (就是我们的 p p p 值)。

Bootstrap

Bootstrap又称自展法、自举法、自助法、靴带法 , 是统计学习中一种重采样(Resampling)技术,用来估计标准误差、置信区间和偏差

Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好。机器学习中的Bagging,AdaBoost等方法其实都蕴含了Boostrap的思想,在集成学习的范畴里 Bootstrap直接派生出了Bagging模型.

子样本之于样本,可以类比样本之于总体

2

参考

  1. https://github.com/seeingtheory/Seeing-Theory
  2. 统计学中的Bootstrap方法(Bootstrap抽样)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/357832.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring系列-2 Bean的生命周期

背景: 作为Spring系列的第二篇,本文结合容器的启动流程介绍单例Bean的生命周期,包括Bean对象的创建、属性设置、初始化、使用、销毁等阶段;在此过程中会介绍Spring用于操作Bean或者BeanDefinition的相关扩展接口。 文章重心在于介…

Spring Boot 日志文件,你都会了吗?

目录 1、日志文件的作用 2、日志的使用 2.1、从程序中得到日志对象 2.2、使用日志 2.3、日志格式 3、日志级别 3.1、这样的日志级别有什么用? 3.2、日志级别分类和使用 3.3、日志级别设置 4、日志持久化 5、更简单的日志输出——lombok 5.1、对比 5.2、…

阅读源码和查看官方文档,是解决问题最高效的办法。

作为一个工作8年的老程序员告诉你:阅读源码和查看官方文档,是解决问题最高效的办法。不信你来看,这个困扰了读者半天的问题我查了源码和文档后瞬间解决。 前言 上周五有位读者私信我一个问题,说困扰了他半天,研究了一…

利用Rust与Flutter开发一款小工具

1.起因 起因是年前看到了一篇Rust iOS & Android|未入门也能用来造轮子?的文章,作者使用Rust做了个实时查看埋点的工具。其中作者的一段话给了我启发: 无论是 LookinServer 、 Flipper 等 Debug 利器,还是 Flutt…

基于springboot+vue的疾病匿名检测查询系统

基于springbootvue的疾病匿名检测查询系统 ✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背…

【拥抱开源】发布自己的项目到maven中央仓库

文章目录🎈第一步,注册账号💿第二步,登录📀第三步,设置信息💾第四步,创建问题📹第五步,验证信息🎥第六步,上传jar包到中央仓库&#x…

网页中字体混淆的处理(简易方法)——爬虫学习笔记

网页中字体混淆的处理——爬虫学习笔记之评论爬取一、网页分析1、打开某点评网址。2、在网页源代码中寻找评论信息(1)进入这个“火锅店”的详情页,然后右击“检查”(2)点上面“刷新”详情页,逐步寻找。&…

RK3288 GPIO记录

1、引脚对应的GPIO 编号第一种 使用/sys/kernel/debug/gpio查询所有gpio引脚的基数第二种 cat /sys/class/gpio/gpiochip248/label对应的label就是GPIO引脚,例如下图GPIO8对应的基数就是2482、计算编号编号 基数 PIN脚如GPIO8的基数是248, GPIO8_A6的编…

Java开发 - 数风流人物,还看“微服务”

目录 前言 服务器端的发展历程 早期的服务器 动态的页面 用户内容网站 微服务 企业级应用 互联网应用 微服务介绍 什么是微服务? 为什么使用微服务 怎么使用微服务 Spring Cloud 什么是Spring Cloud Nacos注册中心 什么是Nacos 创建微服务项目 创建…

【Servlet篇】一文带你吃透Request对象

文章目录1. 前言2. Request 对象2.1 Request 继承体系2.2 Request 获取请求参数1. 获取请求行数据2. 获取请求头数据3. 获取请求体数据4. 获取请求参数的通用方式3. IDEA中快速创建 Servlet你问我青春还剩几年?我的回答是,趁现在,正当时。身边…

CS144-Lab2

实验架构 除了写入传入流之外,TCPReceiver 还负责通知 sender 两件事: “First unassembled” 字节的索引,称为“acknowledgment”或 “ackno”。这是接收方需要来自发送方的第一个字节。“first unassembled ” 索引和“first unacceptable…

【项目精选】基于SSH的任务调度系统的设计与实现(视频+源码+论文)

点击下载源码 虽然科技进步在改革开发这几十年来速度飞快,计算机行业也发展迅速,但仍然有大量商家或企业,甚至项目组,采用落后的人工管理方式或者低效的任务调度策略,这无疑是对计算机的一种无视。 计算机处理信息的准…

Python每日一练(20230220)

目录 1. 存在重复元素 II 2. 按要求实现程序功能 3. 分割链表 附录 链表 1. 存在重复元素 II 给定一个整数数组和一个整数 k,判断数组中是否存在两个不同的索引 i 和 j,使得 nums [i] nums [j],并且 i 和 j 的差的 绝对值 至多为 k。 …

高级数据类型

为了解决单一的业务而存在bitmapsBitmaps类型的基础操作 获取指定key对应偏移量上的bit值getbit key offset 设置指定key对应偏移量上的bit值,value只能是1或0setbit key offset valueBitmaps类型的扩展操作状态位的统计业务需求:1. 统计每天某一部电…

云计算ACP云服务器ECS实例题库(三)

😘作者简介:一名99年软件运维应届毕业生,正在自学云计算课程。👊宣言:人生就是B(birth)和D(death)之间的C(choise),做好每一个选择。&…

关于监控服务器指标、CPU、内存、警报的一些解决方案

文章目录关于监控服务器指标、CPU、内存、警报的一些解决方案Prometheus Grafana 配置 IRIS / Cach 监控服务器Prometheus简介特点架构图Grafana简介特点配置流程自定义Prometheus接口定义配置 Exporter 监控服务器系统资源简介配置流程使用 Alertmanager报警简介配置流程基于…

软考高级-信息系统管理师之知识管理(最新版)

知识管理 知识与知识管理知识管理常用的方法和工具显性知识的管理隐形知识的管理知识管理的工具学习型组织知识产权保护计算机软件保护条例商标法专利法补充建议学的考点:知识与知识管理 1、知识的分类 知识可分为两类,分别是显性知识与隐性知识。 凡是能以文字与数字来表达…

【C++】关联式容器——map和set的使用

文章目录一、关联式容器二、键值对三、树形结构的关联式容器1.set2.multiset3.map4.multimap四、题目练习一、关联式容器 序列式容器📕:已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C11)等,这些容器统称为…

新能源汽车,有毒

作者| Mr.K 编辑| Emma来源| 技术领导力(ID:jishulingdaoli)新能源汽车到底有多火,生生逼得奥迪某4S店挂出横幅:我们也有纯电新能源!老牌名车的辛酸憋屈溢出屏幕。网友神评补刀“这标语给人‘诺基亚也有智能大屏机’的感觉。”一…

【Java基础】变量

Java基础 变量 variable 变量类型 实例变量(非静态字段) Instance Variables (Non-Static Fields) 类的非静态属性 类变量(静态字段) Class Variables (Static Fields) 类的静态属性 局部变量 Local Variables 参数 Parameters 变量命名 大小写敏感 开头:字…