【基础统计学】带重叠差分置信区间的检验

news2024/12/25 13:26:21

一、说明

        对于统计模式识别,需要从基本的检验入手进行学习掌握,本篇是对统计中存在问题的探讨:如果两个分布有重叠该怎么做。具体的统计学原理,将在本人专栏中系统阐述。

二、几个重要概念

2.1 什么是假设检验

        假设检验是一种统计学方法,用于确定两个或多个样本之间是否存在差异或者是否符合某种假设。它通常涉及两个假设,一个是原假设(null hypothesis),另一个是备择假设(alternative hypothesis)。原假设是一种默认假设,认为样本之间没有差异或者不符合某种假设;备择假设则认为样本之间存在差异或者符合某种假设。通过统计技术计算样本的差异程度和假设的置信度,可以得出是否拒绝原假设的结论,从而判断样本是否具有统计学意义。

 2.2 什么是置信区间

        置信区间是指通过样本数据估计总体参数时,给出一个区间,该区间内包含我们对总体参数真值的估计值的置信程度。换句话说,它是对总体参数一个区间估计,而不是一个确定的值。通常情况下,置信区间由一个下限和一个上限组成,并且由置信水平和样本统计量确定。例如,如果置信水平为95%,则置信区间为从样本统计量下侧的5%到上侧的5%。换句话说,有95%的置信度,真实总体参数的值位于置信区间中。

        执行假设检验时,可以使用 p 值或置信区间来确定结果是否具有统计显著性。

        我最近遇到一种情况,讨论是关于确定两个样本的统计显著性或两个样本之间的差异。结论是对两个样本进行测试导致更保守的结果。即使两个样本之间的差异显示了统计显著性,但在某些情况下,两个样本检验不会显示统计显著性。

        我想知道为什么会这样,并被这篇文章删除了。这是我用一些代码模仿帖子上的讨论。

三、具有重叠置信区间的统计显著性

3.1 当方差接近时

        当两组统计数据分布距离太近,用假设检验已经无法说明其显著性,此时用ME模型可以解决,本文仅限于说明两组统计数据,显著性差异不明显情况。

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
import matplotlib.style as style
style.use('fivethirtyeight')

m1 = 9
m2 = 17
sd1 = 2.5
sd2 = 2.5
ci1 = stats.norm.interval(0.95, loc=m1, scale=sd1)
ci2 = stats.norm.interval(0.95, loc=m2, scale=sd2)

def returnNormalY(x, mu, sd):
    return 1/(sd * np.sqrt(2 * np.pi)) * np.exp(-(x - mu)**2 / (2 * sd**2))
  
# Generate Data for Plot
# Fill Section
x1 = np.linspace(ci1[0], ci1[1], 1000)
y1 = returnNormalY(x1, m1, sd1)
x2 = np.linspace(ci2[0], ci2[1], 1000)
y2 = returnNormalY(x2, m2, sd2)
# Line Section
x1_line = np.linspace(0, 17)
y1_line = returnNormalY(x1_line, m1, sd1)
x2_line = np.linspace(9, 25)
y2_line = returnNormalY(x2_line, m2, sd2)

# Generate Plot
fig, ax = plt.subplots()
ax.plot(x1_line, y1_line)
ax.plot(x2_line, y2_line)
ax.fill_between(x1, y1, alpha=0.3)
ax.fill_between(x2, y2, alpha=0.3)

# Plot Editing
fig.set_size_inches(8, 6, forward=False)
ax.set_yticklabels([])
plt.title("Overlapping Confidence Intervals")
plt.show()

从上图中可以看出,两个样本的 95% 置信区间是重叠的。仅此图就应表明缺乏统计显著性。然而

3.2 当方差相异时,具有样本差异的统计显著性

# Generate Data for Difference
m3 = m2 - m1
sd3 = np.sqrt(np.square(sd1)/1 + np.square(sd2)/1)
ci3 = stats.norm.interval(0.95, loc=m3, scale=sd3)
# Fill Section
x3 = np.linspace(ci3[0], ci3[1], 1000)
y3 = returnNormalY(x3, m3, sd3)
# Line Section
x3_line = np.linspace(-1, 25)
y3_line = returnNormalY(x3_line, m3, sd3)

# Generate Plot
fig, ax = plt.subplots()
ax.plot(x3_line, y3_line, 'y')
ax.fill_between(x1, y1, alpha=0.1)
ax.fill_between(x2, y2, alpha=0.1)
ax.fill_between(x3, y3, alpha=0.4)

# Plot Editing
fig.set_size_inches(8, 6, forward=False)
ax.set_yticklabels([])
plt.title("Confidence Interval of Difference")
plt.show()

        两个样本之差的 95% 置信区间显示出统计学意义。这背后的原因是在上述代码的第 3 行。差值上的标准差不是两个标准差的总和。他们加正(取平方和的平方根)。

        看看这个例子,前面关于两个样本导致保守结果的说法似乎是有效的。

四、总结 

  1. 重叠置信区间缺乏统计显著性
  2. 两个样本之间方差有差异的置信区间对统计显著性有更宽松的批准
  3. 当不包括 0 时,单个置信区间有效

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/777483.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第二节 C++ 数据类型

文章目录 1. 概述1.1 数据类型的重要作用 (了解) 2. 数据类型2.1 什么是进制 ?2.1.1 存储单位 2.2 整数类型2.2.1 整数类型使用2.2.2 超出范围2.2.3 关键字 sizeof 2.3 实型(浮点型)2.3.1 setprecision()函数2.3.2 科学计数 (了解即可) 2.4 字符型2.4.1 字符型定义2.4.2 ASCII…

树-用Java托举

再讲完前面几个数据结构后,下面,我们开始对树进行一个讲解分析 树 引言 树是一种重要的数据结构,在计算机科学中有着广泛的应用。树是由节点和边组 成的非线性数据结构,具有层次结构和递归定义的特点。每个节点可以有多个子 节点…

【英杰送书第三期】Spring 解决依赖版本不一致报错 | 文末送书

Yan-英杰的主 悟已往之不谏 知来者之可追 C程序员,2024届电子信息研究生 目录 问题描述 报错信息如下 报错描述 解决方法 总结 【粉丝福利】 【文末送书】 目录: 本书特色: 问题描述 报错信息如下 Description:An attempt…

Docker 命令(二)

查看 docker 版本信息 docker version #查看版本信息docker 信息查看 docker info Client:Context: defaultDebug Mode: falsePlugins:app: Docker App (Docker Inc., v0.9.1-beta3)buildx: Build with BuildKit (Docker Inc., v0.5.1-docker)Server:Containers: 0 …

get请求传入[ ]这类字符 返回400错误解决

问题描述 使用get请求查询,传入特殊字符 []时,接口报错。 分析原因 高版本的tomcat,有个新特性: 严格按照RFC 3986规范进行访问解析,而 RFC3986规范定义了Url中只允许包含英文字母(a-zA-Z)、数…

【Python】数据分析+数据挖掘——Pandas中文件I/O操作

文章目录 前言1. 读入文本格式数据文件1.1 pd.read_csv实例 1.2 pd.read_table1.3 pd.read_excel实例 1.4 pd.read_sql 2. 保存数据文件2.1 保存数据文件到外部文件中2.2 保存数据文件到数据库中 结束语 前言 在数据分析和数据挖掘中,数据通常以文件的形式存储在磁…

静电消除风机风棒的工作原理

静电消除风机风棒的工作原理静电消除离子风机是一种专门用于消除静电的设备。静电是由于物体表面带有静电荷而引起的现象,容易导致尘埃吸附、静电放电等问题。静电消除离子风机通过释放负离子或正离子来中和空气中的静电荷,从而减少静电问题的发生。 静…

【基于CentOS 7的Rsync服务】

目录 一、概述 二、特性 1.快速 2.安全 3.应用场景 三、数据的同步方式 1.pull 2.push 四、rsync传输模式 1.本地传输 2.远程传输 3.守护进程 五、rsync应用 1.安装 2.监听端口 六、rsync命令 1.格式 1.1 作为远程命令 1.2 作为rsync服务 2.选项 3.举例 …

服务器数据恢复-ESX SERVER无法连接到STORAGE的数据恢复案例

服务器数据恢复环境: 某公司信息管理平台,数台VMware ESX SERVER虚拟机共享一台IBM某型号存储。 服务器故障: VC报告虚拟磁盘丢失,管理员ssh到ESX中执行fdisk -l命令查看磁盘,发现STORAGE已经没有分区表了。重启设备后…

2023-7-20-第二十一式访问者模式

🍿*★,*:.☆( ̄▽ ̄)/$:*.★* 🍿 💥💥💥欢迎来到🤞汤姆🤞的csdn博文💥💥💥 💟💟喜欢的朋友可以关注一下&#xf…

unity预制体打包

unity做好的预制体如果给别的工程使用,如果是单纯的ctrlcv会导致丢失引用,如材质信息等,我们可以将其打包好再导入给别的工程。 如打包这个cube: 点击Export,选择保存位置

【算法基础:搜索与图论】3.2 树与图的dfs和bfs

文章目录 例题846. 树的重心(深度优先遍历 / 树形DP)⭐⭐⭐⭐⭐🚹🚹🚹🚹🚹(重要!好题!)847. 图中点的层次 相关链接 要学会建树、建图的通用方法。…

【C++】C++ 11 新特性

文章目录 📕 ★ 右值引用 ★概念左值引用和右值引用的比较使用场景和意义移动构造左值引用的缺陷 完美转发属性丢失为什么会属性丢失解决方法 📕 新的类功能默认成员函数default 和 delete 关键字 📕 lambda 表达式问题的提出概念函数对象和 …

nuxt获取地址栏(路由)参数

要获取的路由地址(页面顶部地址栏):http://172.31.0.1:5353/judge-manage?id3694089482878918764&name%E6%B5%8B%E8%AF%95&judgeIde9IJWN5usmzbrtNC3zYSRtAcKu-M333h 1、获取域名或ip端口:172.31.0.1:5353 2、获取地址…

JMeter的使用方法

JMeter是开源软件,100%的使用Java语言来进行开发的,支持主流的协议(HTTP,HTTPS,WebService,gRPC)的API测试和性能测试,是一款非常优秀的测试工具软件。 java 语言编写的程序,程序要运行,对外运行的程序有两…

Windows 2012 R2 编辑ini文本遇到的编码问题

在编辑服务端配置文件时,发现对于ini文本文件: 需注意点一:如果另存为UTF-8保存的实际上格式是UTF-8-BOM编码格式; 但是两种格式是存在差异的: 因此造成在使用C#调用系统DLL读取文件时并未报错,但是当使用…

access数据库注入

access数据库一般是100人以下的小型数据库,后缀是asp的网站 先加一个’看下回显内容,有没有报错 在用and 11 和and 12看下回复内容 and 12 有报错内容,可以确定存在注入点 猜数据库名字,asp的数据库后缀是mdb and exists(select *…

Java将数据集合转换导出为图片

将数据集合导出为图片 Java将数据集合转换导出为根据数据自适应大小的图片,并且保证数据的完整展示 工具类代码 package xxxxxxxxx;import cn.hutool.core.date.DateTime;import javax.imageio.ImageIO; import javax.servlet.ServletException; import javax.se…

linux部署前后端项目

使用nginx部署前端vue项目: nginx的安装就不在过了,直接打包vue项目: npm run build运行完之后会生成一个dist文件夹 将dist文件夹复制到linux文件中,我这里放到了/usr/local/vue目录下: 打开nginx的conf目录下的ngi…

Vue3通透教程【十六】TS编译配置

文章目录 🌟 写在前面🌟 初始化配置文件⭐ target⭐ module⭐ lib⭐ types/node⭐ include⭐ outDir🌟 写在最后 🌟 写在前面 专栏介绍: 凉哥作为 Vue 的忠实 粉丝输出过大量的 Vue 文章,应粉丝要求开始更…