数据分析:通俗易懂假设检验

news2024/11/17 1:51:47

导读

大多数关于假设检验的教程都是从先验分布假设开始,列出一些定义和公式,然后直接应用它们来解决问题。然而,在本教程[1]中,我们将从第一原则中学习。这将是一个示例驱动的教程,我们从一个基本示例开始,逐步了解假设检验的内容。

1. 选哪个骰子?

alt

想象一下,您面前有两个无法区分的骰子。您随机选择一个骰子并扔掉它。在观察它落在哪张面上之后,您能确定您选择了哪个骰子吗?

骰子的概率分布如下图所示:

Die 1:
P(X=x) = 1/6 if x = {1, 2, 3, 4, 5, 6}

Die 2:
P(X=x) = 1/4 if x = {1, 2}
       = 1/8 if x = {3, 4, 5, 6}

在二元假设检验问题中,我们通常会面临两个我们称之为假设的选择,我们必须决定是选择一个还是另一个。

假设由 H₀ 和 H₁ 表示,分别称为原假设和备择假设。在假设检验中,我们拒绝或接受零假设。

在我们的示例中,骰子 1 和骰子 2 分别是原假设和备择假设。接受或拒绝零假设的决定取决于观察的分布。

所以我们可以说假设检验的目标是画一个边界,把观察空间分成两个区域:拒绝区域和接受区域。

observation
observation

如果落在拒绝区域,我们拒绝原假设,否则我们接受它。现在,决策边界不会是完美的,我们会犯错误。例如,骰子 1 可能落在骰子 1 或 2 上,而我们将其误认为是骰子 2;但发生这种情况的可能性较小。我们将在下一节中学习如何计算错误概率。

我们如何确定决策边界?有一种简单有效的方法称为似然比检验,我们接下来将讨论。

2. 似然比检验

你必须首先意识到观察的分布取决于假设。下面我根据两个假设绘制了示例中的分布:

alt

现在,P(X=x;H₀) 和 P(X=x;H₁) 分别表示在假设 H₀ 和 H₁ 下观察的可能性。它们的比率告诉我们,对于不同的观察,一个假设比另一个假设正确的可能性有多大。

这个比率称为似然比,用 L(X) 表示。 L(X) 是依赖于观察值 x 的随机变量。

似然比
似然比

在似然比检验中,如果该比率高于某个值,我们拒绝原假设,即如果 L(X) > 𝜉 则拒绝原假设,否则接受它。称为临界比。

因此,这就是我们绘制决策边界的方法:我们将似然比大于临界比的观察值与似然比大于临界值的观察值分开。

所以形式为 x L(x) > 𝜉 落入拒绝域,其余落入接受域。

让我们用我们的骰子例子来说明它。似然比可以计算为:

L(X) = (1/4) / (1/6) = 3/2 if x = {1, 2}
     = (1/8) / (1/6) = 3/4 if x = {3, 4, 5, 6}

似然比图如下所示:

alt

现在决策边界的放置归结为选择临界比率。假设临界比率是 3/2 和 3/4 之间的值,即 3/4 < 𝜉 < 3/2。然后我们的决策边界看起来像这样:

if 3/4 < 𝜉 < 3/2:

L(X) > 𝜉 if x = {1, 2} (rejection region)
L(X) < 𝜉 if x = {3, 4, 5, 6} (acceptance region)
alt

让我们讨论与此决定相关的错误。如果观察 x 属于拒绝区域但发生在零假设下,则会发生第一类错误。在我们的示例中,这意味着骰子 1 落在 1 或 2 上。

这称为错误拒绝错误或类型 1 错误。此错误的概率由下式表示并且可以计算为:

False Rejection Error:

𝛼 = P(X|L(X) > 𝜉 ; H₀)

如果观察 x 属于接受区域但发生在备择假设下,则会发生第二个错误。这称为错误接受错误或类型 2 错误。此错误的概率由下式表示并且可以计算为:

False Acceptance Error:

𝛽 = P(X|L(X) < 𝜉 ; H₁)

在我们的示例中,错误拒绝和错误接受错误可以计算为:

Computing errors in the dice example:

𝛼 = P(X|L(X) > 𝜉 ; H₀)
  = P(X={1, 2} ; H₀)
  = 2 * 1/6 
  = 1/3

𝛽 = P(X|L(X) < 𝜉 ; H₁)
  = P(X={3, 4, 5, 6} ; H₁)
  = 4 * 1/8
  = 1/2

让我们考虑另外两种情况,其中临界比率采用以下值:𝜉 > 3/2 和 𝜉 < 3/4。

Critical ratio < 3/4
Critical ratio < 3/4
Critical ratio > 3/2
Critical ratio > 3/2

可以类似地计算类型 1 和类型 2 错误。

𝛼 = 0 if 𝜉 > 3/2
  = 1/3 if 3/4 < 𝜉 < 3/2
  = 1 if 𝜉 < 3/4

𝛽 = 1 if 𝜉 > 3/2
  = 1/2 if 3/4 < 𝜉 < 3/2
  = 0 if 𝜉 < 3/4

让我们绘制不同 𝜉 值的误差。

alt

随着临界值的增加,拒绝域变小。结果,错误拒绝概率降低,而错误接受概率增加。

3. 似然比的作用

我们可以在观察空间的任何地方画出边界。为什么我们需要计算似然比并通过所有这些?

下面我计算了不同边界的 I 类和 II 类错误。

Type I and Type II errors for different boundaries.

'|' is the separator - {rejection region | acceptance region}

1. {|, 1, 2, 3, 4, 5, 6}
𝛼 = P(x={} ; H₀) = 0
𝛽 = P(x={1, 2, 3, 4, 5, 6} ; H₁) = 1
𝛼 + 𝛽 = 1

2. {1, |, 2, 3, 4, 5, 6}
𝛼 = P(x={1} ; H₀) = 1/6
𝛽 = P(x={2, 3, 4, 5, 6} ; H₁) = 1/4 + 1/2 = 3/4
𝛼 + 𝛽 = 0.916

3. {1, 2, |, 3, 4, 5, 6}
𝛼 = P(x={1, 2} ; H₀) = 1/3
𝛽 = P(x={3, 4, 5, 6} ; H₁) = 1/2
𝛼 + 𝛽 = 0.833

4. {1, 2, 3, |, 4, 5, 6}
𝛼 = P(x={1, 2, 3} ; H₀) = 1/2
𝛽 = P(x={4, 5, 6} ; H₁) = 3/8
𝛼 + 𝛽 = 0.875

5. {1, 2, 3, 4, |, 5, 6}
𝛼 = P(x={1, 2, 3, 4} ; H₀) = 2/3
𝛽 = P(x={5, 6} ; H₁) = 1/4
𝛼 + 𝛽 = 0.916

6. {1, 2, 3, 4, 5, |, 6}
𝛼 = P(x={1, 2, 3, 4, 5} ; H₀) = 5/6
𝛽 = P(x={6} ; H₁) = 1/8
𝛼 + 𝛽 = 0.958

6. {1, 2, 3, 4, 5, 6, |}
𝛼 = P(x={1, 2, 3, 4, 5, 6} ; H₀) = 1
𝛽 = P(x={} ; H₁) = 0
𝛼 + 𝛽 = 1

I 类和 II 类错误及其不同边界总和的图如下所示:

alt

可以看出,对于似然比检验得到的临界比值的最优值,Ⅰ类和Ⅱ类错误之和最小。

换句话说,对于给定的错误拒绝概率,似然比检验提供了最小可能的错误接受概率。

4. 连续分布

在上面的例子中,我们没有讨论如何选择临界比的值。概率分布是离散的,因此临界比率的微小变化不会影响边界。

当我们处理连续分布时,我们固定错误拒绝概率的值并据此计算临界比率。

P(L(X) > 𝜉 ; H₀) = 𝛼

但同样,过程将是相同的。一旦我们获得临界比率的值,我们就分离观察空间。

𝛼的典型选择是 𝛼 = 0.01、𝛼 = 0.05 或 𝛼 = 0.01,具体取决于错误拒绝的不良程度。

alt

例如,如果我们正在处理正态分布,我们可以对其进行标准化并查找 Z 表以找到给定的值。

总结

在本文中,我们了解了假设检验背后的概念和过程。整个过程可以总结为下图:

alt

我们从两个假设 H₀ 和 H₁ 开始,使得基础数据的分布取决于假设。目标是通过找到将观察值 x 的已实现值映射到两个假设之一的决策规则来证明或反驳原假设 H₀。最后,我们计算与决策规则相关的误差。


欢迎Star -> 学习目录


参考资料

[1]

Source: https://towardsdatascience.com/introduction-to-hypothesis-testing-with-examples-60a618fb1799

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/160551.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Web(五、六)

JavascriptDOM* 功能&#xff1a;控制html文档的内容* 获取页面标签(元素)对象&#xff1a;Element* document.getElementById("id值"):通过元素的id获取元素对象* 操作Element对象&#xff1a;1. 修改属性值&#xff1a;明确获取的对象是哪一个&#xff1f;查看API文…

BI工具将数据分析拉下神坛

以前&#xff0c;数据分析是一件比较有门槛的事&#xff0c;它不仅要求数据分析师具备一定的数据分析思维和方法经验&#xff0c;还要求数据分析师们熟练使用各种复杂的数据分析工具&#xff0c;要求他们掌握Python、R、SQL等。但随着BI工具的发展&#xff0c;多维自助分析逐渐…

组织机构管理不得不了解的 RBAC 权限模型|身份云研究院

由于信息安全越来越被重视&#xff0c;企业的身份管理已经成为市场焦点&#xff0c;对于实施企业级安全策略和身份管理的需求随之迅速上升。而作为权限访问控制策略的 RBAC&#xff08;基于角色的访问控制&#xff09;模型也已被广泛使用到组织机构管理中&#xff0c;本文将带领…

LeetCode刷题模版:81 - 90

目录 简介81. 搜索旋转排序数组 II82. 删除排序链表中的重复元素 II83. 删除排序链表中的重复元素84. 柱状图中最大的矩形85. 最大矩形86. 分隔链表87. 扰乱字符串【未理解】88. 合并两个有序数组89. 格雷编码90. 子集 II结语简介 Hello! 非常感谢您阅读海轰的文章,倘若文中有…

vue组件中插槽slot的使用

目录 插槽 1、组件的三大核心&#xff1a;属性&#xff08;data、props&#xff09;、事件、插槽 2、插槽&#xff08;slot&#xff09;&#xff1a;将子组件和父组件进行组合&#xff0c;可以弥补视图的不足。使组件具有更好的扩展性 组件的封装方式&#xff1a;抽取共性、…

CMMI五大成熟度定义及过程管理类详解

一、成熟度级别CMMI组织的成熟度级别提供了描述其绩效特征的方式。经验表明&#xff0c;当组织每次过程改进工作所专注的过程域在数量上易管理时&#xff0c;组织能够做到最好&#xff1b;那些领域随着组织的改进&#xff0c;也需要不断成熟。成熟度级别是组织级过程改进的预定…

ADI边缘 AI MCU,助力从万物互联到万物智联

物联网被视为继计算机、互联网之后世界信息产业发展的第三次浪潮。据 IoT Analytics 在 2022 年 5月发布的《物联网现状 2022 年春季版》报告显示&#xff0c;2021 年全球物联网连接数量增长 8%&#xff0c;达到 122 亿个活跃端点&#xff1b;到 2022 年&#xff0c;物联网市场…

【KANO】需求管理模型

1.什么是Kano模型 Kano模型就是一个可以帮助我们有效识别“真伪需求”、划分需求优先级的有效工具。Kano模型是东京理工大学教授狩野纪昭&#xff08;Noriaki Kano&#xff09;发明的对用户需求分类和优先排序的有用工具&#xff0c;以分析用户需求对用户满意的影响为基础&…

【分享】原力计划的初衷 【探讨】新的一年,你对原力计划有哪些期待?

课前小差 哈喽&#xff0c;大家好&#xff0c;我是几何心凉&#xff0c;这是一份全新的专栏&#xff0c;唯一得倒CSDN王总的授权&#xff0c;来对于我们每周四的绿萝时间 ——【直达CSDN】直播内容进行总结概括&#xff0c;让大家能够省去看直播回放的时间也能够了解直播内容和…

JavaScript创建对象的方式

概述 JavaScript有多种创建对象的方式。 方式一&#xff1a;newfunction构造函数 function DogFactory(type, color) {this.type typethis.color color } // 方式一&#xff1a;new var dog new DogFactory(Dog, Black); console.log(dog) // new DogFactory(Dog, Black)…

jpeg压缩原理简述

一、色彩空间转换(RGB→YCrCb) 这一步没有数据删除&#xff0c;是可逆的步骤 YCbCr 是在世界数字组织视频标准研制过程中作为ITU - R BT1601 建议的一部分,其实是YUV经过缩放和偏移的翻版。其中Y与YUV 中的Y含义一致, Cb , Cr 同样都指色彩, 只是在表示方法上不同而已。在YUV家…

Android本地服务器NanoHttpd配置Https双向认证

一、 了解数字证书 在HTTPS的传输过程中&#xff0c;有一个非常关键的角色——数字证书&#xff0c;那什么是数字证书&#xff1f;又有什么作用呢&#xff1f; 所谓数字证书&#xff0c;是一种用于电脑的身份识别机制。由数字证书颁发机构&#xff08;CA&#xff09;对使用私…

超实用的办公小技巧,上班族必看

技巧一&#xff1a;使用“PS”来合并 这个方法大家是不是觉得有点出乎意料呢&#xff1f;虽然PS是一个图像处理的工具&#xff0c;但它总是有些我们想不到的功能。下面就给大家介绍一下究竟要怎么利用它来合并PDF文件。 使用感受&#xff1a;的确是可以合并多个PDF文件的&…

《啊哈算法》第二章栈,队列,链表(解析+代码)

从无到有学算法 吾日三省吾身&#xff0c;今天有写代码乎?&#x1f644; &#x1f644;抠门渣男语录&#xff1a;我的果汁分你一半&#xff08;月亮弯弯 绵绵绵绵缠缠&#xff09; - 李金源 - 单曲 - 网易云音乐 千年之后的你在哪里&#xff1a;星月神话 - 我觉得我还能再吃…

CACHE 概念

CACHE 概念 CPU 读写指令或者数据&#xff0c;可能直接从寄存器查取&#xff0c;也可能经过 TLB &#xff0c;经过 MMU&#xff0c;经过高速缓存&#xff0c;经过内存&#xff0c;经过外部存储器。这里面有一个 Cache 的概念&#xff0c;想多了解下了&#xff0c;于是有这这一…

【自定义类型】带你走进结构体、枚举、联合

欢迎来到小王学代码的博客 在字符型函数之后&#xff0c;我们接下来要学习的是自定义类型中的结构体、枚举、联合 目录 前言 一、结构体 1.1结构体的声明 1.2 特殊声明和结构自引用 1.4结构体的自引用 1.5结构体变量的定义和初始化 1.6 结构体内存对齐 1.7修改默认对齐…

【杂烩】Latex中的一些技巧备忘录

1. subfigure 和 minipage 环境的运用 首先是多张图组合到一起&#xff0c;左侧和下方备注列标题和行标题。 使用的时候需要的包&#xff1a; minipage不需要 \usepackage{subfigure} \usepackage{graphicx}代码1&#xff1a; \begin{figure*}[htbp]\centering%第一行图片展…

微信小程序怎么实现拍照功能,以及授权,拍完照保存到本地。

写微信小程序就是要不停的翻阅官方文档查阅所需要的需求。API的使用说明wx.getSetting 获取用户的当前设置。返回值中只会出现小程序已经向用户请求过的权限 scope.camera相机wx.authorize 提前向用户发起授权请求。调用后会立刻弹窗询问用户是否同意授权小程序使用某项功能或获…

复盘!!指针 ,地址 ,数组之间的联系

文章目录前言一、直接看题二、直接上代码总结前言 工作摸鱼 闲来无事 一、直接看题 二、直接上代码 所以&#xff0c;这个题目答案是5. 我来盘给你&#xff1a;int a[5] {1,2,3,4,5}; 1数组名本身就是表示数组首元素地址 2对数组名取地址&#xff1a;表示的是整个数组的地址…

Android抓包Charles入门教程

Android抓包工具有很多&#xff0c;有轻量的如httpCanary直接安装在手机上通过代理进行抓包&#xff0c;有功能强大的WireShark PC 端的抓包工具&#xff08;也要设置代理啦&#xff09;,还有老牌抓包工具Finder和Charles以及mitmproxy 。 手机上的抓包工具远离基本差不多&…