python统计分析——样本方差的分布

news2024/11/19 0:46:39

参考资料:用python动手学统计学

1、导入库

import numpy as np
import pandas as pd
import scipy as sp
from scipy import stats

from matplotlib import pyplot as plt
import seaborn as sns

2、数据准备

      建立一个平均数为4,标准差为0.8的正态分布总体

# stats.norm()表示正态分布,其中loc参数表示均值,scale参数表示标准差
pop=stats.norm(loc=4,scale=0.8) 

3、程序模拟:执行1万次“从总体中抽取10个数据作为一个样本并求其方差”

# 建立一个数组用于存放样本方差
sample_var_array=np.zeros(10000)
# 设置随机种子,用于复现结果
np.random.seed(1)
# 获取1万个样本方差
for i in range(0,10000):
    sample=pop.rvs(size=10)
    sample_var_array[i]=np.var(sample,ddof=0)
np.mean(sample_var_array)

      np.var()的相关解释可参考:python统计分析——单变量描述统计-CSDN博客

注意此处在求方差时的参数ddof=0的设置。

      1万个样本方差的平均数计算结果为:0.5746886877332101,与总体方差0.64,相差较大。可见这个数过小地估计了总体方差。

4、采取无偏方差消除偏离

      还是上一段代码,但此时np.var()的参数中,ddof设置为1,计算结果为样本的无偏方差。

# 建立一个数组用于存放样本方差
sample_var_array=np.zeros(10000)
# 设置随机种子,用于复现结果
np.random.seed(1)
# 获取1万个样本方差
for i in range(0,10000):
    sample=pop.rvs(size=10)
    sample_var_array[i]=np.var(sample,ddof=1)
np.mean(sample_var_array)

      1万个样本的无偏方差的平均数计算结果为:0.6385429863702334,与总体方差0.64十分接近。

5、样本容量越大,其无偏方差越接近总体方差

      下面用程序拟合不同样本容量下样本的无偏方差变化情况。

5.1 生成不同样本容量下的无偏方差数组

# 创建数组存放样本容量,从10变化至100010
size_array=np.arange(start=10,stop=100100,step=100)
# 创建数组用于存放样本方差
unbias_var_array_size=np.zeros(len(size_array))
# 设置随机种子,用于复现运行结果
np.random.seed(1)
# 利用循环,生成对应样本容量的样本无偏方差
for i in range(0,len(size_array)):
    sample=pop.rvs(size=size_array[i])
    unbias_var_array_size[i]=np.var(sample,ddof=1)

5.2 绘制无偏方差随样本容量变化的曲线

plt.plot(size_array,unbias_var_array_size)
plt.xlabel('sample size')
plt.ylabel('unbias var')

      由上图,可以看出,随着样本容量的不断变大,其无偏方差月接近总体方差(0.64)

有兴趣的同学,可以将ddof设置为0,查看下运行结果。t提示:随着样本容量的不断变大,样本容量n与n-1将无限接近,样本方差和无偏方差趋于相等。

名词解释

无偏性:估计量的期望值相当于真正的参数的特性叫作无偏性。说估计量具有无偏性,就是说它没有偏差,它的均值不会过大也不会太小。

一致性:样本容量越大,估计量越接近真正的参数的特性称为一致性。说估计值具有一致性,就是说当样本容量趋向于无穷大时,估计量趋近于参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1419197.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

腾讯云4核16G服务器价格,用于幻兽帕鲁Palworld专用

腾讯云幻兽帕鲁服务器4核16G、8核32G和16核64G配置可选,4核16G14M带宽66元一个月、277元3个月,8核32G22M配置115元1个月、345元3个月,16核64G35M配置580元年1个月、1740元3个月、6960元一年,腾讯云百科txybk.com分享腾讯云幻兽帕鲁…

自然语言处理 TF-IDF

✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心&…

Java强训day10(选择题编程题)

选择题 public class Test01 {public static void main(String[] args) {try{int i 100 / 0;System.out.print(i);}catch(Exception e){System.out.print(1);throw new RuntimeException();}finally{System.out.print(2);}System.out.print(3);} }编程题 题目1 import jav…

重构改善既有代码的设计-学习(六):处理继承关系

1、函数上移(Pull Up Method) 无论何时,只要系统内出现重复,你就会面临“修改其中一个却未能修改另一个”的风险。通常,找出重复也有一定的难度。 所以,某个函数在各个子类中的函数体都相同(它们…

leetcode hot100跳跃游戏Ⅱ

本题和上一题还是有不一样的地方,这个题中,我们需要记录我们跳跃的步数并尽可能的满足最小的跳跃步数到达终点。 那么我们还是采用覆盖范围的概念,但是我们需要两个,一个是在当前位置的覆盖范围,另一个是下一步的覆盖…

Linux的 .bashrc 有什么作用?

一、.bashrc 是什么? 有什么用? .bashrc是一个存储在你的home目录下的隐藏文件,它用来配置和自定义你的终端环境和行为。 每次你启动一个新的终端时,.bashrc文件就会被执行,加载你设置的环境变量,别名,函数…

深度学习-自注意力机制

文字编码 one-hot编码,让模型自己去学习怎么进行编码 常见的输出 1.每个词都有一个输出值 2.每个句子输出一个值,情感分类 3.输入与输出长度不对应,翻译任务,生成任务。 RNN最早的语言处理 RNN解决的是模型去考虑前面的输入…

数字图像处理(实践篇)二十八 使用OpenCV Python中的K-means对图像进行颜色量化处理

目录 1 颜色量化 2 实践 在某些时候,不可避免的某些设备只能生成有限数量的颜色。因此需要执行颜色量化。选择使用cv2.kmeans()函数对颜色量化应用k-means聚类。 1 颜色量化 使用K-means聚类在图像中实现颜色量化的步骤如下: ① 导入依赖库

js实现动漫拼图2.0版

比较与1.0版,2.0版就更像与华容道类似的拼图游戏,从头到尾都只能控制白色块移动,而且打乱拼图和求助的实现与1.0都不相同 文章目录 1 实现效果2 实现思路2.1 打乱拼图2.2 求助功能2.3 判赢 3 代码实现 js实现动漫拼图1.0版 https://blog.csdn…

【千亿生意】一张眼底图,浮现你未来十年身体1000多种疾病风险

【千亿生意】一张眼底图,浮现你未来十年身体1000多种疾病风险 一眼看全身鹰瞳思路眼底看全身论文眼底成像技术眼底看肝脏眼底看多囊卵巢综合征眼底看肺部眼底看贫血眼底看少肌症眼底看神经退行眼底看心血管眼底看肾脏 鹰瞳视网膜论文 一眼看全身 眼病,是…

Redisson分布式锁介绍及实战应用(防止缓存击穿)

本地锁 浏览器把100w请求由网关随机往下传,在集群情况下,每台服务都放行10w请求过来,这时候每台服务都用的是本地锁是跨JVM的, 列如这些服务都没有49企业,此时有几个服务进行回原了打击在DB上面,那后期把这…

fastapi报错

初始化报错,非常低级错,扇自己10八张 app FastApi()

如何在Shopee越南站点进行有效的选品

在如今的电商市场中,选品是卖家们取得成功的关键之一。在Shopee越南站点进行选品时,卖家可以采取一些策略来提高产品的竞争力和销售业绩。本文将介绍一些有效的选品策略,帮助卖家在Shopee越南站点取得成功。 先给大家推荐一款shopee知虾数据…

算法沉淀——二分查找(leetcode真题剖析)

算法沉淀——二分查找 01.二分查找02.在排序数组中查找元素的第一个和最后一个位置03.搜索插入位置04.x 的平方根05.山脉数组的峰顶索引06.寻找峰值07.寻找旋转排序数组中的最小值08.LCR 173. 点名 二分查找(Binary Search)是一种在有序数组中查找特定元…

【服务器APP】利用HBuilder X把网页打包成APP

目录 🌺1. 概述 🌼1.1 新建项目 🌼1.2 基础配置 🌼1.3 图标配置 🌼1.4 启动界面配置 🌼1.5 模块配置 🌼1.6 打包成APP 🌺1. 概述 探讨如何将网页转化为APP,这似乎…

【大厂AI课学习笔记】1.3 人工智能产业发展(1)

我国人工智能政策,分为5个阶段。从探索期,到后面的4个阶段。 MORE:(以下为文心一言4.0的参考内容,和腾讯课程资料的分阶段,略有不同) 我国的人工智能政策发展可以大致分为以下几个阶段,每个阶段…

网络防御安全知识(第三版)

配置黑洞路由 --- 黑洞路由即空接口路由,在NAT地址池中的地址,建议配置达到这个地址指 向空接口的路由,不然,在特定环境下会出现环路。(主要针对地址池中的地址和出接口地址 不再同一个网段中的场景。) …

一文解锁——那些你不太了解的AI!

ChatGPT现象级走红,国内也有文心一言等模型紧随其后,彻底将大语言模型送上大热门。 不管是你是否深度应用过这些模型,不可否认的是,AI已经彻底地融入我们的生活,甚至成为赚钱利器。除了ChatGPT和百度的文心一言&#…

力扣712. 两个字符串的最小ASCII删除和

动态规划 思路: 假设 dp[i][j] 是 s1 长度 i 和 s2 长度 j 两个字符串的最小 ASCII 删除和;dp[i][j] 可以由: 如果 s1 的第 i 个字符(s1[i - 1])和 s2 的第 j 个字符(s2[j - 1])不相等&#xf…

详解SpringCloud微服务技术栈:ElasticSearch实战(旅游类项目)

👨‍🎓作者简介:一位大四、研0学生,正在努力准备大四暑假的实习 🌌上期文章:详解SpringCloud微服务技术栈:ElasticSearch实践2——RestClient查询并处理文档 📚订阅专栏:…