【AI知识点】假设检验(Hypothesis Testing)

news2024/10/7 0:27:33

假设检验(Hypothesis Testing) 是统计推断中用来判断一个关于总体参数的假设是否成立的标准方法。它通过样本数据来做出推断,从而确定是否可以拒绝原先设定的假设。假设检验广泛应用于科学实验、社会调查、质量控制等领域,用于验证假设是否具有统计学意义。

1. 假设检验的基本概念

假设检验涉及两个相对立的假设:

  • 零假设( H 0 H_0 H0:通常是表示没有效果没有差异没有显著性的假设。零假设假设总体参数没有发生改变或实验没有影响。
  • 备择假设( H 1 H_1 H1 H a H_a Ha:表示零假设不成立时的另一种情况,通常为我们希望证实的假设。备择假设假设总体参数发生了变化或实验具有显著影响。

2. 假设检验的步骤

a. 设定假设

  • 零假设( H 0 H_0 H0:表示我们最初设定的假设。例如,如果我们想知道某种药物是否有治疗效果,零假设通常设定为“药物没有效果”。
  • 备择假设( H 1 H_1 H1 H a H_a Ha:是与零假设相对的假设。例如,备择假设可以是“药物有效”。

b. 选择显著性水平( α \alpha α

  • 显著性水平( α \alpha α:表示犯第一类错误的概率,也就是错误地拒绝了正确的零假设的风险。显著性水平常设为 0.05、0.01 或 0.10。
    • 如果 α = 0.05 \alpha = 0.05 α=0.05,这意味着我们容忍有 5% 的概率犯第一类错误,即错误地认为药物有效(当实际上无效时)。

c. 选择检验统计量

  • 根据数据的类型和样本性质,选择合适的检验统计量。常见的检验包括 z z z 检验、 t t t 检验、卡方检验等。
    • z z z 检验:当样本量较大且总体方差已知时使用。
    • t t t 检验:当样本量较小且总体方差未知时使用。
    • 卡方检验:用于检验频数或比例的显著性。

d. 计算检验统计量

  • 使用样本数据计算检验统计量,根据选择的检验方法得到 z z z 值、 t t t 值或卡方值等。这个值将与临界值进行比较。

e. 计算 p p p

  • p p p 是指在零假设为真的情况下,观察到现有样本或更极端样本的概率。 p p p 值越小,表示观察到样本的概率越低,越有理由怀疑零假设。
    • 如果 p p p 值小于显著性水平 α \alpha α,则拒绝零假设。
    • 如果 p p p 值大于 α \alpha α,则不拒绝零假设。

f. 做出决策

  • 拒绝零假设:如果 p p p ≤ α \leq \alpha α,我们拒绝零假设,并接受备择假设。这意味着数据提供了足够的证据表明药物有效。
  • 不拒绝零假设:如果 p p p 值 > α \alpha α,我们不拒绝零假设。这意味着没有足够的证据表明药物有效。

3. 假设检验的错误类型

在假设检验中,可能犯两类错误:

a. 第一类错误(Type I Error)

  • 错误地拒绝了正确的零假设
  • 例如,当药物实际上无效时,我们错误地认为它有效。犯第一类错误的概率等于显著性水平 α \alpha α

b. 第二类错误(Type II Error)

  • 没有拒绝错误的零假设
  • 例如,当药物实际上有效时,我们错误地认为它无效。犯第二类错误的概率通常用 β \beta β 表示, 1 − β 1 - \beta 1β 称为检验的功效

4. 假设检验的类型

a. 双侧检验(Two-tailed Test)

  • 双侧检验用于检验总体参数是否与某个值不同。零假设是参数等于某个特定值,而备择假设是参数不等于这个值。

    • 零假设 H 0 : μ = μ 0 H_0: \mu = \mu_0 H0:μ=μ0
    • 备择假设 H 1 : μ ≠ μ 0 H_1: \mu \neq \mu_0 H1:μ=μ0

    双侧检验关注的是总体参数是否存在任意方向的偏差。

b. 单侧检验(One-tailed Test)

  • 单侧检验用于检验总体参数是否大于或小于某个值。单侧检验更关注参数的单方向变化。
    • 零假设 H 0 : μ ≤ μ 0 H_0: \mu \leq \mu_0 H0:μμ0 H 0 : μ ≥ μ 0 H_0: \mu \geq \mu_0 H0:μμ0
    • 备择假设 H 1 : μ > μ 0 H_1: \mu > \mu_0 H1:μ>μ0 H 1 : μ < μ 0 H_1: \mu < \mu_0 H1:μ<μ0

5. 假设检验的例子

a. 药物有效性检验

假设我们希望检验一种新药是否能有效降低血压。我们有一个样本数据,测量了使用该药物后的 30 名患者的血压变化。假设该药物在无效时的平均血压变化为 0 mmHg。

  • 零假设 H 0 H_0 H0:药物无效,即 μ = 0 \mu = 0 μ=0
  • 备择假设 H 1 H_1 H1:药物有效,即 μ ≠ 0 \mu \neq 0 μ=0

假设我们选择显著性水平 α = 0.05 \alpha = 0.05 α=0.05,计算出 p p p 值为 0.02。由于 p p p 值小于 0.05,我们拒绝零假设,认为该药物在统计学上显著有效。

b. A/B 测试

在互联网产品开发中,A/B 测试是常见的假设检验应用。假设我们开发了两个版本的网页(A 版和 B 版),希望测试哪一个能带来更高的转化率。

  • 零假设 H 0 H_0 H0:A 版和 B 版的转化率相同,即 p A = p B p_A = p_B pA=pB
  • 备择假设 H 1 H_1 H1:A 版和 B 版的转化率不同,即 p A ≠ p B p_A \neq p_B pA=pB

我们可以通过对比 A 版和 B 版的样本数据,计算 p p p 值,来判断是否可以拒绝零假设。如果 p p p 值小于显著性水平 α \alpha α,我们就可以拒绝零假设,认为 A 版和 B 版的转化率有显著差异。


6. 假设检验与 p p p 值的解读

  • p p p表示在零假设成立的条件下,观察到当前样本数据或更极端数据的概率。
    • 如果 p p p 值很小,表示在零假设成立的条件下,观察到当前数据的可能性很低。因此,我们倾向于怀疑零假设,可能会拒绝它。
    • 如果 p p p 值较大,表示在零假设成立的条件下,观察到当前数据的可能性较高,因此我们没有理由怀疑零假设。

7. 假设检验的实际应用

a. 质量控制

在制造业中,假设检验常用于检测产品的质量是否符合标准。例如,某条生产线生产的产品的重量是否符合规定的平均重量,可以通过假设检验进行检验。

b. 市场营销

在市场营销中,假设检验用于检测某种营销策略是否比另一种策略有效。例如,通过 A/B 测试来对比两种广告投放方案,检测哪一种方案能带来更多的客户转化。

c. 医学实验

在医学研究中,假设检验常用于评估某种药物或治疗方法的有效性。例如,通过随机对照实验(RCT)检验一种新药是否对某种疾病有显著的治疗效果。


8. 总结

假设检验是一种强大的统计工具,用于通过样本数据来推断总体参数是否符合某个假设。它帮助我们在不确定的条件下做出决策。假设检验的核心思想是设定零假设和备择假设,通过样本数据来计算检验统计量和 p p p 值,并根据显著性水平 α \alpha α 来决定是否拒绝零假设。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2193270.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

集合源码1

一、List接口分析 1、list接口的特点 ①List集合的所有元素是由一种线性方式进行存储的。 ②它是一个元素存储有序的集合。即元素的存入顺序和取出顺序有保证。 ③他是一个带有索引的集合&#xff0c;通过索引就可以精确的操作集合中的元素 ④集合中可以有重复的元素&#xff0…

二分查找算法——寻找旋转排序数组中的最小值点名

1.题目解析 题目来源&#xff1a;LCR173.点名——力扣 原名&#xff1a;剑指offer——0~n-1中消失的数字 测试用例 题目来源&#xff1a;153.寻找旋转排序数组中的最小值——力扣 测试用例 2.算法原理 点名 如果要寻找消失的数字&#xff0c;可以判断对应下标的数字是否和下标对…

视觉定位Revisit Anything

Revisit Anything: Visual Place Recognition via Image Segment Retrieval 项目地址 摘要&#xff1a; 准确识别重游地点对于嵌入代理的定位和导航至关重要。这要求视觉表现清晰&#xff0c;尽管摄像机视点和场景外观有很大变化。现有的视觉地点识别管道对“整个”图像进行编码…

制作离线版Koczkatamas工具包

一、下载源码 从https://github.com/koczkatamas/koczkatamas.github.io下载koczkatamas.github.io-master.zip 二、解压 $ unzip koczkatamas.github.io-master.zip三、运行index.html 可以看到输入一个字符后&#xff0c;下面的各种编码都没有显示&#xff0c;则表示运行…

【玩转 JS 函数式编程_008】3.1.2 JavaScript 函数式编程筑基之:箭头函数——一种更流行的写法

文章目录 3.1.2 箭头函数——更流行的方式 Arrow functions - the modern way1. 返回值 Returning values2. this 值的处理 Handling the this value3. arguments 的处理 Working with arguments4. 单参数还是多参数&#xff1f; One argument or many? 写在前面 故天将降大任…

儿童需要学习C++多久才能参加信息学奥赛的CSP-J比赛?

信息学奥赛&#xff08;NOI&#xff09;是国内编程竞赛领域的顶尖赛事&#xff0c;而对于初学者来说&#xff0c;参加NOI的第一步通常是通过CSP-J&#xff08;全国青少年信息学奥林匹克联赛初赛&#xff09;&#xff0c;这也是面向青少年程序员的入门级竞赛。作为信息学奥赛的基…

vue3使用three.js加载.obj模型示例

vue3使用three.js加载.obj模型示例 效果&#xff1a; 代码&#xff1a; 需要先安装three.js npm install three<template><div ref"threeContainer" class"three-container"></div> </template><script> import * as TH…

男单新老对决:林诗栋VS马龙,巅峰之战

听闻了那场激动人心的新老对决&#xff0c;不禁让人热血沸腾。在这场乒乓球的巅峰之战中&#xff0c;林诗栋与马龙的对决无疑是一场视觉与技术的盛宴。 3:3的决胜局&#xff0c;两位选手的每一次挥拍都充满了策略与智慧&#xff0c;他们的每一次得分都让人心跳加速。 林诗栋&am…

10.6学习

1.Hystrix / Sentinel ●服务雪崩场景 自己即是服务消费者&#xff0c;同时也是服务提供者&#xff0c;同步调用等待结果导致资源耗尽 ●解决方案 服务方&#xff1a;扩容、限流&#xff0c;排查代码问题&#xff0c;增加硬件监控 消费方&#xff1a;使用Hystrix资源隔离&a…

JavaSE——面向对象10:抽象类、接口

目录 一、抽象类 (一)抽象类的引出 (二)抽象类基本介绍 (三)注意事项和使用细节 (四)抽象类的最佳实践——模板设计模式 二、接口 (一)接口快速入门 (二)基本介绍 (三)注意事项与使用细节 (四)接口VS继承 (五)接口的多态性 1.多态参数 2.多态数组 3.接口存在多态…

CoreGen项目实战——代码提交信息生成

数据与相关代码见文末 1.概述 源代码与自然语言之间的语义鸿沟是生成高质量代码提交信息的一个重大挑战。代码提交信息对于开发者来说非常重要,因为它们简明扼要地描述了代码更改的高层次意图,帮助开发人员无需深入了解具体实现即可掌握软件的演变过程。手动编写高质量的提交…

Vite多环境配置与打包:

环境变量必须以VITE开头 1.VITE_BASE_API&#xff1a; 在开发环境中设置为 /dev-api&#xff0c;这是一个本地 mock 地址&#xff0c;通常用于模拟后端接口。 2.VITE_ENABLE_ERUDA&#xff1a; 设置为 "true"&#xff0c;表示启用调试工具&#xff0c;通常是为了…

Elasticsearch学习笔记(六)使用集群令牌将新加点加入集群

随着业务的增长&#xff0c;陆续会有新的节点需要加入集群。当我们在集群中的某个节点上使用命令生成令牌时会出现报错信息。 # 生成令牌 /usr/share/elasticsearch/bin/elasticsearch-create-enrollment-token -s node出现报错信息&#xff1a; Unable to create enrollment…

VMware WorkStation Pro 15.5(低版本安装) 教学用

VMware WorkStation Pro 15.5(低版本安装) 教学用 文章目录 VMware WorkStation Pro 15.5(低版本安装) 教学用前言安装使用 前言 VMware Workstation Pro 15.5 是一款功能强大的桌面虚拟化软件&#xff0c;适用于在单台物理电脑上运行多个操作系统。它被广泛应用于软件开发、测…

【文献阅读】Attention Bottlenecks for Multimodal Fusion

Abstract 在多模态视频分类中&#xff0c;将各模态的最终表示或预测进行后期融合&#xff08;“后期融合”&#xff09;仍然是主流范式。为此&#xff0c;本文提出了一种基于 Transformer 的新型架构&#xff0c;该架构使用“融合瓶颈”在多个层次进行模态融合。与传统的成对自…

科研必备语料库

1. Corpus of Contemporary American English 链接&#xff1a;https://www.english-corpora.org/coca/ 2. Purdue Online Writing Lab 链接&#xff1a;https://owl.purdue.edu/owl/ 3. Academic Phrases and Vocabulary 链接&#xff1a;https://www.ref-n-write.com/blog…

IntelliJ IDE 插件开发 | (十三)自定义项目脚手架(下)

系列文章 本系列文章已收录到专栏&#xff0c;交流群号&#xff1a;689220994&#xff0c;也可点击链接加入。 前言 在上一篇文章中介绍了如何在 IDEA 中自定义项目脚手架&#xff0c;本文将介绍如何在WebStorm、PyCharm、CLion等其它 IntelliJ 主流平台中如何自定义项目脚手…

【论文速看】DL最新进展20241006-视频深度估计、3D、自监督学习

目录 【视频深度估计】【3D】【自监督学习】 【视频深度估计】 [TPAMI 2024] NVDS: Towards Efficient and Versatile Neural Stabilizer for Video Depth Estimation 论文链接&#xff1a;https://arxiv.org/pdf/2307.08695 代码链接&#xff1a;https://github.com/RaymondW…

地理空间数据存储与处理:MySQL空间数据类型的优化与应用!

在 MySQL 数据库中&#xff0c;空间数据类型用于存储和处理地理空间数据。这些数据类型允许我们在开发时可在数据库中存储和操作地理位置、几何形状和地理空间关系等信息。 一、什么是空间数据类型 MySQL 中的空间数据类型主要包括以下几种&#xff1a; GEOMETRY&#xff1a…

【无人水面艇路径跟随控制3】(C++)USV代码阅读: ROS包的构建和管理:包的依赖关系、包含目录、库文件以及链接库

【无人水面艇路径跟随控制3】&#xff08;C&#xff09;USV代码阅读&#xff1a; ROS包的构建和管理&#xff1a;包的依赖关系、包含目录、库文件以及链接库 写在最前面ROS是什么CMakeLists.txt总结详细解释CMake最低版本和项目名称编译选项查找catkin包catkin包配置包含目录添…