假设检验的基本思想

news2024/12/24 11:31:33

假设检验

首先了解参数估计,比如有服从正态分布的数据集 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^{2}) XN(μ,σ2),我们希望根据样本 x 1 , . . . x n x_{1},...x_{n} x1,...xn估计出参数 μ , σ \mu,\sigma μ,σ,这些参数可以是一个具体值,也可以是一个范围(即一个区间)。

对于假设检验,分为两种情况:

  • 参数假设检验:这种情况下,我们知道总体分布,比如我们已知数据集服从正态分布 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^{2}) XN(μ,σ2),但参数 μ , σ \mu,\sigma μ,σ我们是不知道的,我们假设 μ = μ 0 , σ = σ 0 \mu=\mu_{0},\sigma=\sigma_{0} μ=μ0,σ=σ0,现在,我们依然根据样本 x 1 , . . . x n x_{1},...x_{n} x1,...xn去判断 μ \mu μ是否等于 μ 0 \mu_{0} μ0,即根据样本判断假设是否成立。
  • 非参数假设检验:这是对于分布未知的情况。

总之,假设检验的目的是根据样本判断假设是否成立。

通常存在两种假设,以前面参数假设检验为例:

  • 原假设 H 0 H_{0} H0:假设 μ = μ 0 \mu=\mu_{0} μ=μ0;原假设的概率通常较大;
  • 备择假设 H 1 H_{1} H1:假设 μ ≠ μ 0 \mu\neq\mu_{0} μ=μ0

如果根据样本检验后发现,原假设不成立,备择假设成立,则称 [ x 1 , . . . , x n ] ∈ K 0 [x_{1},...,x_{n}]\in K_{0} [x1,...,xn]K0,样本属于拒绝域 K 0 K_{0} K0。换言之,如果原假设不成立,我们应拒绝原假设。

在拒绝域中的样本才能判断出假设不成立,如果样本不在拒绝域中,我们才能接受原假设。

我们根据样本判断假设,但存在局限性,因为样本数量有限,样本数量多只能降低检验出错的概率,不能代表检验结果完全正确。因此假设检验应考虑到两种错误:

  • 原假设成立,但检验后却拒绝了原假设,即弃真错误;
    我们把概率 P { 拒绝 H 0 ∣ H 0 成立 } = α P\left\{拒绝H_{0}|H_{0}成立\right\}=\alpha P{拒绝H0H0成立}=α α \alpha α称为显著性水平,通常, α \alpha α的值是很小的。如果样本落在拒绝域内的概率 P { [ x 1 , . . . , x n ] ∈ K 0 } ≤ α P\left\{[x_{1},...,x_{n}]\in K_{0}\right\}\leq\alpha P{[x1,...,xn]K0}α,我们就接受原假设,因为此时检验出错的概率已经很低。
    反过来,如果 P { [ x 1 , . . . , x n ] ∈ K 0 } > α P\left\{[x_{1},...,x_{n}]\in K_{0}\right\}>\alpha P{[x1,...,xn]K0}>α,我们应当拒绝原假设。
  • 原假设不成立,但检验后接受了原假设,即取伪错误;

p-value

p值是假设检验中,判断是否要拒绝原假设的指标,p值是一个概率。

p值:原假设正确时,样本观测值取得某一结果(以及比这个结果更极端结果)的概率

举例:判断硬币是否公平(出现正面的概率为50%)

原假设:抛硬币结果为正面的概率为50%;
备择假设:抛硬币结果为正面的概率不为50%;

样本,抛硬币500次,正面出现次数10次,反面出现490次。

对于抛硬币500次,整体应服从二项分布:
fig1

因此,在原假设正确时,预期应该是250次正面,然而实际情况是10次正面,比该结果更极端的情况是正面次数为0次-9次。

另外,如果正面出现超过490次也属于极端情况,因此,图中红色区域表示当前结果以及极端结果。

p值就是图中红色区域对应的概率(面积)。如果p值很小,则意味着,在原假设正确的情况下,小概率事件发生了,比如p值只有1%,即我们只有1%的概率得到目前的观测结果,既然小概率事件发生,我们就有更大概率怀疑这个原假设,因此我们可以拒绝原假设。

通常,只要p值小于显著性水平 α \alpha α,我们就拒绝原假设。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/366909.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++】Windows动态库【.DLL文件】制作方法总结

如题,我们本篇介绍如何制作DLL,将代码类中的方法以接口的形式暴露出来给exe程序使用。会涉及类厂创建方法实例、声明DLL接口、.def文件的使用等。 目录 一、DLL介绍 二、C制作DLL文件 2.1 DLL端 2.2 调用端 三、DLL导出类方法 四、COM技术制作DLL…

扎心话题 | 设计院背后的潜规则你知道吗?

大家好,我是建模助手。 大家都知道,在过去的2022年经济是真难!以小编所在的广东为例,全年GDP增长仅1.9%。 这个数据足以呈现一个社会现象——不仅消费力咔咔下降,各行各业更有不同程度地嗝屁。这其中也包括一些设计院…

只要一直向前定能到达远方,社科院与杜兰大学金融管理硕士项目为你注入动力

在人生这条道路上,我们很远的路要走,不管前方是否平坦,我们只要坚持前向,终将抵达远方。一路上我们付出很多,也收获很多。想要变得更强大,就要不断优化自身,积攒更多的能量,社科院与…

Flask入门(10):Flask使用SQLAlchemy

目录11.SQLAlchemy11.1 简介11.2 安装11.3 基本使用11.4 连接11.5 数据类型11.6 执行原生sql11.7 插入数据11. 8 删改操作11.9 查询11.SQLAlchemy 11.1 简介 SQLAlchemy的是Python的SQL工具包和对象关系映射,给应用程序开发者提供SQL的强大功能和灵活性。它提供了…

浅析无人值守+智慧巡检变电站安全管控系统设计方案

一、项目背景 安全是电力生产的基石,确保电网安全和人身安全,是电网企业安全工作的出发点和落脚点。 随着智能信息化技术应用越来越广泛,智能信息化现场安全管理是近年来基于智能安全巡检技术下发展起来的现场作业安全管理新技术。 变电站运…

【机器学习】朴素贝叶斯算法

朴素贝叶斯(Naive Bayes)是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。由于朴素贝叶斯计算联合概率,所以朴素贝叶斯模型属于生成式模型。经典应用案例包括:文本分类、垃圾邮件过滤等。 1.贝叶斯公式…

rust 安装

rust 安装一、需要一个c的环境二、配置环境变量三、开始安装一、需要一个c的环境 安装Visual Studio 二、配置环境变量 Rust需要安装两个东西,一个是rustup,一个是cargo。所以你需要设置两个环境变量来分别指定他们的安装目录。 通过RUSTUP_HOME指定…

滤波算法:经典卡尔曼滤波

卡尔曼滤波实质上就是基于观测值以及估计值二者的数据对真实值进行估计的过程。预测步骤如图1所示: ​图1 卡尔曼滤波原理流程图 假设我们能够得到被测物体的位置和速度的测量值 ​,在已知上一时刻的最优估计值 ​以及它的协方差矩阵 的条件下&#xff…

ChatGPT热潮背后,金融行业大模型应用路在何方?——金融行业大模型应用探索

ChatGPT近两个月以来不断引爆热点,对人工智能应用发展的热潮前所未有地高涨,ChatGPT所代表的大模型在语义理解、多轮交互、内容生成中所展现的突出能力令人惊喜。而人工智能技术在金融行业的落地应用仍然面临挑战,虽然已经让大量宝贵的人力从…

易基因|ChIP-seq等组学研究鉴定出结直肠癌的致癌超级增强子:Nature子刊

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。超级增强子(Super enhancer)是一类包含多个普通增强子的大簇,主要富集高密度的转录因子、辅助因子及增强子相关表观修饰位点。与普通增强子相比&#xf…

canal实时同步mysql数据到elasticsearch(部署,配置,测试)

这里写目录标题简介工作原理MySQL主备复制原理canal 工作原理canal 使用流程环境搭建环境使用版本mysql配置修改配置创建从库权限账号创建测试数据库创建测试数据表elasticsearch配置创建索引建立映射canal的下载部署下载canal配置服务端 canal-deployer配置客户端canal-adapte…

Keysight E5061B网络分析仪

Keysight E5061B(安捷伦)网络分析仪可在 5 Hz 至 3 GHz 的宽频率范围内提供多功能的高性能网络分析。E5061B 提供了 ENA 系列共有的出色射频性能,还提供了成熟的 LF(低频)网络测量功能;包括带有内置 1 Mohm…

【Vue学习】Vue基本使用

1. 模板语法 插值:使用双大括号进行数据的插值,包括文本、JS表达式。动态属性:可以使用模板字符串。如果使用标签使用了v-html指令,那么标签中的子元素会被引入的html代码覆盖掉,同时也会存在xss风险。 2. compute…

Python + Airtest + poco + pytest + pytest-html 实现Android App自动化测试框架

Python Airtest poco pytest pytest-html 实现Android App自动化测试框架 一、背景 为了尝试除Appium外的测试框架,本文将介绍基于网易的airtest框架为基础,配合poco及pytest实现对Android App的自动化测试。 二、框架介绍 框架集成使用airtest p…

puzzle(1321)时间旅人

时间旅人 最强大脑同款项目。​​​​​​​ 每个指针会带动周围2圈指针一起带动,内圈8个旋转180度,外圈16个旋转90度,全部调整为朝上则胜利。 问题本质: 很明显,问题本质就是求每个格子的点击次数,最少为…

Mac mini 外接移动硬盘无法显示,磁盘工具装载报错显示 com apple diskmanagement disenter

使用“启动安全性实用工具”可确保 Mac 始终从您指定的启动磁盘以及合法的受信任操作系统启动。 如果您使用的是配备 Apple T2 安全芯片的 Mac,则“启动安全性实用工具”提供以下三项功能来帮助保护您的 Mac 免受未经授权的访问:固件密码保护、安全启动…

Java中安装Maven环境

Java中安装Maven环境 apache-maven-3.6.0 下载地址 云盘不限速下载 或者进入官网按下图下载 方法/步骤一 安装 打开压缩包,将maven压缩包解压至软件安装处,建议D根目录或其他,记住安装位置 类似于 方法/步骤二 环境变量配置 变量 1.新…

XSS-labs通关挑战

目录标题1、开始页面2、level 13、level 24、level 35、level 46、level 57、level 68、level 79、level 810、level 911、level 1012、level 1113、level 1214、level 131、开始页面 2、level 1 在url后面可以发现有注入点。如下: 这里出现弹窗,可以知道…

一文搞清楚LoRa网关,LoRa网关全知道

欢迎来到东用知识小课堂下面,今天我们用东用科技的OGC300系列LoRa为例,以简单的方式帮助大家了解一下LoRa相关的小知识一、LoRa网关的基本介绍LoRa是semtech公司创建的低功耗局域网无线标准,低功耗一般很难覆盖远距离,远距离一般功…

Roblox小游戏走出元宇宙试炼年

当元宇宙业务成为海内外互联网巨头急于甩掉的包袱时,“元宇宙第一股”Roblox最近的表现极其提气。 先是2月15日,这家在线游戏娱乐及创作平台公布上一年财报,公司全年营收为 22 亿美元,同比增长 16%。今年1 月,该公司的…