【小白学机器学习14】确定零假设h0的技巧:先根据错误的严重程度确定第1类错误α,再确定零假设h0

news2025/1/9 1:56:13

目录

1 前言: 如何确定H0的逻辑思路

1.1 推导的原理

2 假设检验的2类错误

2.1 什么叫2类错误

2.2 这两类错误的计算公式

2.2.1 计算公式

 2.2.2 第1类错误和第2类错误的特点

3  如何设计H0的一些例子和思考

3.1 很多书上的原则1:备择假设通常才是研究者最想证明的。这个原则有道理,但是可执行性不强

3.2 同1个事情不同人的看法和预设的想法判断,很可能相反。

3.3 自然语言也很不严谨,不靠谱,不能用“弃真,纳伪” 这样的自然语言去判断

3.4 因此,我总结了下:相比自然语言,根据可接受的严重程序,求判断第一类弃真概率更重要这个原则来设计一些检验,特别是有价值判断的那些

4 具体例子

4.1无罪推定例子

4.2 检验例子

4.3 新药测试是否有效

4.4 新药测试副作用时

5 总结确定H0的步骤


1 前言: 如何确定H0的逻辑思路

关于如何确定假设H0,我一直比较困惑,经过最近的总结和思考,我摸索到一条规律,哪就是先确定,什么是我们最不愿意接受的错误,把这个作为第1类错误,然后就可以顺利的确定H0假设了。

1.1 推导的原理

  • 因为第1类错误和第2类错误,往往是此消彼长,不能同时都降到最低‘
  • 先判断两类里,哪一类是我们最不能接受的错误误差
  • 所以我们只能选择,优先降低我们最不能接受的错误误差,当成第1类错误/弃真错误
  • 然后顺势就可以确定H0

2 假设检验的2类错误

2.1 什么叫2类错误

  • 但是在检验的过程中,我们通过样本数据来判断总体参数的假设是否成立,但样本是随机的,因而有可能出现小概率的错误。这种错误分两种,一种是弃真错误,另一种是取伪错误。       
  • 弃真错误也叫第I类错误或α错误:它是指原假设实际上是真的,但通过样本估计总体后,拒绝了原假设。明显这是错误的,我们拒绝了真实的原假设,所以叫弃真错误,这个错误的概率我们记为α。        
  • 取伪错误也叫第II类错误或β错误:它是指原假设实际上假的,但通过样本估计总体后,接受了原假设,这个错误的概率我们记为β。        

2.2 这两类错误的计算公式

2.2.1 计算公式

  • 第1类错误 / 弃真错误 / 假阳性:其概率p=α
  • 第2类错误/ 取伪错误 / 假阴性:其概率p=β

 2.2.2 第1类错误和第2类错误的特点

  • type 1 error和type 2 error的概率相加肯定远远比1=100%要小,
  • 第1类错误和第2类错误,很难同时都降到最低
  • 因此,只能优先选择一个我们最不能接受的当第1类错误,把这个降低到最低/ 或接近最低的一个限度比如α,第2类错误只能暂时任其放大一些
  • 所以我们主要目标是减少第1类错误α的概率!如果只能选1个的话

3  如何设计H0的一些例子和思考

3.1 很多书上的原则1:备择假设通常才是研究者最想证明的。这个原则有道理,但是可执行性不强

  • 记住:备择假设通常才是研究者最想证明的。
  • 但这条也很模糊,但是可执行性不强
  • 为什么? 因为每个人的想法并不同
    • 如果两个研究者的想法相反呢???

3.2 同1个事情不同人的看法和预设的想法判断,很可能相反。

  • 比如一些具体问题,大家预设立场可能就是对立相反的
    • 有的人想证明a<b,有些人想证明a>b 
    • 有些人出发预设认为所有人都是好人,有些人认为所有人都是坏人

3.3 自然语言也很不严谨,不靠谱,不能用“弃真,纳伪” 这样的自然语言去判断

  • 哪种错误,符合自然语言里的弃真,就算第1类错误?这个也不像
  • 比如ATM机器,就是宁愿错误拒绝真币,也要降低接受假币的概率:纳伪。我们要优先降低纳伪的概率?所以自然语言的“弃真,纳伪” 并不靠谱
  • 后面还有具体的例子,请见下文关于 ATM机的弃真,纳伪的例子

3.4 因此,我总结了下:相比自然语言,根据可接受的严重程序,求判断第一类弃真概率更重要这个原则来设计一些检验,特别是有价值判断的那些

原则:先根据那种错误更严重,来确定第一类弃真概率更重要这个原则,然后来确定H0

  • 因为第1类错误和第2类错误,往往是此消彼长,不能同时都降到最低‘
  • 先判断两类里,哪一类是我们最不能接受的错误误差
  • 所以我们只能选择,优先降低我们最不能接受的错误误差,当成第1类错误/弃真错误
  • 然后顺势就可以确定H0

4 具体例子

4.1无罪推定例子

比如我们经常说,无罪推定更重要。我们更愿意容忍坏人被放跑,但是不愿意被容忍好人被误判。

  • 假设人人无罪推定,那么第一类错误就是人无罪但是被拒绝了无罪的假设被误判了,所以h0就应该是 此人无罪的推定。
  • 无罪的被判有罪算是弃真 还是纳伪?算弃真概率,让这个尽量低,这个社会成本太高了
  • 有罪的暂时被判无罪,这个社会成本是相对低的

4.2 检验例子

疫情检测时,倾向于宁愿假阳性更多,可以二次筛,一定要假阴性少,放跑阳性危害大

体验时也应该是相同的思路把,不过这样确实会造成假阳性很多(因为目的是降低假阴性),而且因为即使一个准确率很高的检测,也会因为检查健康人群而非等比例人群而出现大量的假阳性误判。这个其他地方也讨论过。

  • 错误的思路,先确定H0,这是碰运气
    • H0假设人是阴性
    • 第1类错误,弃真错误,把阴性的人当成了阳性,
    • 这个是因为思考的次序错了
  • 正确思考的次序,先思考什么是最不能接受的,把这个当成第1类弃真错误,再去设计H0
    • 第1类错误/弃真错误,把阴性的人当成了阳性更能接受-二次检查可排除,成本较低,不能接受把阳性的人当成阴性,会造成更大危害,成本太高。
    • 所以H0应该是此人为阳性
    • 第1类错误,弃真错误成本太高,是他是阳性被误认为阴性,这个要尽量的低。

4.3 新药测试是否有效

  • 这两种误差,我们思考下:有效药被认为无效的误差,而不是无效药被认为有效,哪个成本更高?
  • 无效药被认为有效,这个成本太高,我们更不愿意接受,我们把这个当第1类错误
  • 那么H0就是 这个新药是无效的

4.4 新药测试副作用时

  • 先比较没有副作用被认为是有副作用的错误,有副作用的被认为没有副作用的错误,哪个更严重?成本更高?
  • 有副作用的被认为没有副作用的错误更严重,所以这个是第1类错误
  • 那么H0就应该是 新药有副作用

银行的ATM存款纸币识别的思路

  • 1 先考虑,ATM接受假币错误的成本,ATM拒绝真币的错误成本
  • 2 显然,ATM接受假币,把假币当真币错误的成本很高,错误严重
  • 3 所以 H0就是假设钱币为假币
  • 从这个例子看,这个第1类错误的 弃真概率,是把 假币当真币的概率,用日常语言来说,反而是 纳伪的概率。所以日常语言是不准确的。
  • 而第2类错误,把真币当假币给拒绝,这个再假设检验这里是第2类错误, 纳伪错误,但对应到真实日常生活的语言,这应该是“弃真”
  • 所以要警惕日常语言对我们的误导。
  • 在什么语言环境就用当下语境更精确的语言来说话!比如这里就要在统计学假设检验的语言环境下考虑弃真,纳伪。而不是口语化的“弃真,纳伪”。

5 总结确定H0的步骤

  • step1:先确定第1类错误。
    • 先根据能接受的两类错误里,考虑哪一类错误是我们更不愿意接受的,更严重的,成本更高的,先确定第1类错误。
  • step2: 确定H0 零假设
    • 确定了第1类错误后,就可以顺势确定H0的假设了。
  • step3: 根据H0,确定与之矛盾的H1假设

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1604809.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多高的学历才能轻松找到工作?这个热点有点扯吧~

先来唠唠 昨天刷脉脉的时候&#xff0c;热榜第一的内容吸引了我&#xff1a;多高的学历才能轻松找到工作&#xff1f; 现在这行情&#xff0c;不管多高得学历都很难说能轻松找到工作吧~ 评论区也有不少小伙伴发表自己的见解&#xff0c;比如&#xff1a; 学历固然是非常重要…

2D动画制作软件Moho Pro14 mac注册激活版

Moho Pro 14 for mac 是一款专业的2D动画制作软件。它具有强大的功能和工具&#xff0c;适用于动画制作师、插画师和设计师。 Moho Pro14 mac注册激活版下载 Moho Pro 14提供了丰富的动画功能&#xff0c;包括骨骼动画、形状插值、帧逐帧动画等。您可以使用骨骼工具来创建复杂的…

中缀表达式求值

题目 请写一个整数计算器&#xff0c;支持加减乘三种运算和括号。 示例1 输入&#xff1a;“12” 返回值&#xff1a;3示例2 输入&#xff1a;“(2*(3-4))*5” 返回值&#xff1a;-10示例3 输入&#xff1a;“32*3*4-1” 返回值&#xff1a;26 思路 经典的中缀表达式求值。…

Ubuntu 20.04.06 PCL C++学习记录(二十六)

[TOC]PCL中点云配准模块的学习 学习背景 参考书籍&#xff1a;《点云库PCL从入门到精通》以及官方代码PCL官方代码链接,&#xff0c;PCL版本为1.10.0&#xff0c;CMake版本为3.16&#xff0c;可用点云下载地址 学习内容 在代码中使用ICP迭代最近点算法&#xff0c;程序随机…

游戏前摇后摇Q闪E闪QE闪QA等操作

备注&#xff1a;未经博主允许禁止转载 个人笔记&#xff08;整理不易&#xff0c;有帮助&#xff0c;收藏点赞评论&#xff0c;爱你们&#xff01;&#xff01;&#xff01;你的支持是我写作的动力&#xff09; 笔记目录&#xff1a;学习笔记目录_pytest和unittest、airtest_w…

负荷预测 | Matlab基于TCN-LSTM-Attention单变量时间序列多步预测

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.负荷预测 | Matlab基于TCN-LSTM-Attention单变量时间序列多步预测&#xff1b; 2.单变量时间序列数据集&#xff0c;采用前12个时刻预测未来96个时刻的数据&#xff1b; 3.excel数据方便替换&#xff0c;运行环境ma…

请陪伴Kimi和GPT成长

经验的闪光汤圆 但是我想要写实的 你有吗&#xff1f; 岁数大了&#xff0c;希望如何学习新知识呢&#xff1f;又觉得自己哪些能力亟需补强呢&#xff1f; 看论文自然得用Kimi&#xff0c;主要是肝不动了&#xff0c;眼睛也顶不住了。 正好昨天跟专业人士学会了用工作流的办法跟…

buuctf之ciscn_2019_c_1

ciscn_2019_c_1 一、查看属性二、静态分析三、动态分析四、思路五、exp 一、查看属性 首先还是必要的查看属性环节&#xff1a; 可以知道该文件是一个x86架构下的64位小端ELF文件&#xff0c;开启了栈不可执行&#xff08;NX&#xff09; 执行一下&#xff0c;先有一个选择&…

树莓派+Openwrt连接校园网,打破校园网设备限制

前言 因为本校学生校园网只允许最多三个设备登录&#xff0c;对于同时拥有多个联网设备的我十分不友好&#xff0c;而且大多单片机如esp32的wifi模块是只允许一般的WPA/WPA2认证的&#xff0c;是不支持校园网的portal认证。所以我决定搞一个路由器。 然后我上网买了一个TP-Li…

加密软件作用有哪些?迅软DSE加密系统满足企业防泄密需求

加密软件在保护个人隐私、商业机密、敏感数据等方面发挥着重要作用&#xff0c;为用户和组织提供了重要的安全保障措施。保护数据的安全性和隐私性。通过加密软件&#xff0c;用户可以对文件、图纸、文档、源代码等进行加密处理&#xff0c;使其变得不可读取&#xff0c;只有授…

java动态代理--JDK代理

1.概述 JDK动态代理&#xff1a;只能代理实现了接口的类&#xff0c;代理对象是实现了目标对象所有接口的代理类 使用java.lang.reflect.Proxy类和java.lang.reflect.InvocationHandler接口来创建代理对象&#xff0c;工作通过反射机制完成。 2.实现接口InvocationHandler …

37、Tomato(VulnHub)

Tomato 一、nmap 2211是ssh的端口&#xff0c;21的ftp也不是弱密码 二、web渗透 随便看看 目录爆破 /seclists/Discovery/Web-Content/common.txt /antibot_image/antibots/readme.txt 发现该站点存在反爬机制 /antibot_image/antibots/info.php 提示我们该网页存在个参数 GET&…

汇编语言——将DX,AX组成的32位数逻辑左移3位

data segment data ends stack segment stacktop label worddw 100 dup (?) stack ends code segmentassume cs:code,ds:data,ss:stack main proc farmov ax,datamov ds,axmov ax,stackmov ss,axlea sp,top;0000 0001 1100 1010 | 0000 0010 0001 1111;逻辑左移三位后&#xf…

VsCode调试远程服务器上面的Docker容器

第一步 VsCode 连接ssh 下载安装VsCode(Visual Studio Code)&#xff0c;首次安装会提示你安装Chinese(Simplified)中文简体&#xff0c;安装完后重新打开就是汉化界面了。在左边侧边栏找到扩展选项&#xff0c;然后安装Remote Development插件&#xff0c;里面包含了Remote S…

FAT16文件系统

FAT16 大端存储&#xff1a;高位字节放在低地址端&#xff0c;低位字节放在高地址端。 小端存储&#xff1a;低位字节放在低地址端&#xff0c;高位字节放在高地址端。 举一个例子&#xff0c;比如数字0x12 34 56 78在内存中的表示形式为&#xff1a; 大端模式&#xff1a; 低地…

【Gradle】Gradle的构建过程

Gradle是一个基于Apache Ant和Apache Maven概念的项目自动化构建开源工具。它使用一种基于Groovy的特定领域语言(DSL)来声明项目设置&#xff0c;也增加了基于Kotlin语言的kotlin-based DSL&#xff0c;抛弃了基于XML的各种繁琐配置。 面向Java应用为主。当前其支持的语言C、J…

二、pwn - 零基础ROP之PIE保护绕过-碰撞

欲学本文,先看前文:一、pwn - 零基础ROP之Android ARM 32位篇(新修订,精华篇)-CSDN博客 代码、文件同第一篇,自行复制。本文唯一区别在于,我们不利用vulnerable_function打印的地址,无法定位pie base地址,直接随机碰撞(爆破)~ 有一定比例成功的可能,贴近实战! 多…

终于总结出一套小红书万能涨粉公式

新手做小红书&#xff0c;最关心的除了变现、提升流量、应该就是涨粉了。 但关于小红书涨粉&#xff0c;小伙伴表示难如登天&#xff0c;臣妾做不到啊。 别担心&#xff0c;小易拆解近100个博主账号后&#xff0c;终于总结出小红书涨粉公式&#xff0c;垂直不违规干货人设活跃…

IDEA2024配置RunDashBoard(Services)面板

IDEA2024配置RunDashBoard(Services)面板 新版本的IDEA没有RunDashBoard&#xff0c;取而代之的是Services面板&#xff0c;不需要配置workspace.xml文件; 本文教你简单的方法就能一个SpringBoot的Main运行多次&#xff0c;方便调试。 1、配置启动类 导航栏&#xff0c;Edit…

基于SpringBoot的“外卖点餐系统”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“外卖点餐系统”的设计与实现&#xff08;源码数据库文档PPT) 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;SpringBoot 工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 系统功能图 用户功能界面 订单管理界面 配送单管…