Python | 中心极限定理介绍及实现

news2024/10/6 8:26:54

统计学是数据科学项目的重要组成部分。每当我们想从数据集的样本中对数据集的总体进行任何推断,从数据集中收集信息,或者对数据集的参数进行任何假设时,我们都会使用统计工具。

中心极限定理

定义:中心极限定理,通俗地来说,就是研究独立随机变量和的极限分布为正态分布的问题。在自然界和生产中,许多现象受到许多相互独立的随机因素的影响。当每个因素的影响都很微小时,这些因素产生的总影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。

具体来说,中心极限定理表明,无论随机变量的初始分布是什么,只要我们对这些随机变量进行大量的独立抽取,并将这些随机变量加起来,那么这些总和的分布就会接近正态分布。这种规律在我们的生活中也随处可见,比如人的身高、体重等数据的分布都近似于正态分布。

举个例子:

假设有一个班级,其中学生的成绩是随机变量,每个学生都是一个独立的随机变量。如果我们把所有学生的成绩加起来,并计算平均分,那么这个平均分的分布就会接近正态分布。

具体来说,我们可以将每个学生的成绩看作是一个独立的随机变量,每个随机变量都有自己的分布。如果我们把所有学生的成绩加起来,那么这个总和就是一个随机变量。根据中心极限定理,这个总和的分布就会接近正态分布。

这个例子可以用来解释为什么大多数情况下,班级的平均分分布会呈现出一个类似于正态分布的形状。这是因为每个学生的成绩都是独立的随机变量,而这些随机变量的总和近似于正态分布。

应用场景

中心极限定理在数理统计和概率论中有着广泛的应用,主要包括以下几个方面:

  1. 验证数据是否满足正态分布:如果数据符合正态分布的条件,则可以使用相关的统计方法进行分析。而如果数据不符合正态分布的条件,就需要采用其他的统计方法进行分析。
  2. 求解总体参数:中心极限定理可以用于求解总体的均值和方差等参数。通过对样本进行一些简单的统计分析,就可以根据中心极限定理的推导,得到总体的均值和方差等参数的近似值。
  3. 构造置信区间:当对总体参数进行估计时,可以使用中心极限定理的知识,构造置信区间进行区间估计,从而提高估计的可靠性。
  4. 应用于大样本:在处理大样本时,中心极限定理是非常重要的工具。它能够证明在样本容量足够大的情况下,样本均值的分布近似于正态分布,从而可以应用正态分布的统计性质进行各种统计推断。
  5. 解决实际问题:中心极限定理可以用于解决许多实际问题,例如金融领域中的风险评估、医学领域中的临床试验、生产制造中的质量控制等。在这些领域中,中心极限定理可以帮助我们理解数据的分布规律,并进行更准确的预测和决策。

总之,中心极限定理是概率论中的一组非常重要的定理,它揭示了大量随机变量之和的分布规律,并广泛应用于数理统计学、误差分析、自然与生产现象的解释等领域。在实际应用中,它可以用于验证数据的分布、求解总体参数、构造置信区间、应用于大样本以及解决各种实际问题。

中心极限定理的Python实现

import numpy
import matplotlib.pyplot as plt

# number of sample
num = [1, 10, 50, 100] 
# list of sample means
means = [] 

# Generating 1, 10, 30, 100 random numbers from -40 to 40
# taking their mean and appending it to list means.
for j in num:
	# Generating seed so that we can get same result 
	# every time the loop is run...
	numpy.random.seed(1)
	x = [numpy.mean(
		numpy.random.randint(
			-40, 40, j)) for _i in range(1000)]
	means.append(x)
k = 0

# plotting all the means in one figure
fig, ax = plt.subplots(2, 2, figsize =(8, 8))
for i in range(0, 2):
	for j in range(0, 2):
		# Histogram for each x stored in means
		ax[i, j].hist(means[k], 10, density = True)
		ax[i, j].set_title(label = num[k])
		k = k + 1
plt.show()

在这里插入图片描述
从图中可以明显看出,随着样本量从1增加到100,直方图趋于正态分布。

中心极限定理的经验法则

中心极限定理的经验法则是指在实际应用中,如果随机变量足够多,那么这些随机变量之和的分布近似于正态分布。这个经验法则在数理统计学和误差分析中非常重要,可以用来解决各种实际问题。

例如,在金融领域中,中心极限定理的经验法则可以用来评估投资组合的风险。通过将大量的股票价格看作是随机变量,并计算它们的均值和方差,就可以得到投资组合的收益率分布。由于这些随机变量足够多,它们的分布近似于正态分布,因此可以使用正态分布的性质来计算投资组合的风险。

在生产制造中,中心极限定理的经验法则可以用来控制产品质量。通过对生产过程中产生的大量数据进行分析,可以计算出这些数据的均值和方差,并根据中心极限定理的推导,得到这些数据的分布近似于正态分布。因此,可以根据正态分布的性质制定控制限,控制产品质量,提高生产效率。

总之,中心极限定理的经验法则是数理统计学和误差分析中非常重要的一个工具,可以用来解决各种实际问题。在实际应用中,只要随机变量足够多,它们的分布就可以近似地看作是正态分布,从而可以使用正态分布的性质进行各种统计推断。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1829029.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Liunx】基础开发工具的使用介绍-- yum / vim / gcc / gdb / make

前言 本章将介绍Linux环境基础开发工具的安装及使用,在Linux下安装软件,编写代码,调试代码等操作。 目录 1. yum 工具的使用1.1 什么是软件包:1.2 如何下载软件:1.3 配置国内yum源: 2. vim编辑器2.1 vim的安…

NetSuite Saved Search 之 Filter By Summary

在某些业务场景中,用户需要一个TOP X的报表。例如,过去一段时间内,最多数量的事务处理类型。这就需要利用Saved Search中的Filter By Summary功能。 这在Criteria下的Summary页签里可以定义。其作用是对Result中Summary类型的结果进行过滤。也…

【论文速读,找找启发点】2024/6/16

ICME 2023 End-To-End Part-Level Action Parsing With Transformer 类似 DETR,通过 加 query的方式实现 端到端 ELAN: Enhancing Temporal Action Detection with Location Awareness 如何实现位置感知? > 重叠的卷积核? Do we really …

解决MacOS docker 拉取镜像慢的问题

docker官网:https://docker.p2hp.com/get-started/index.html 下载完成之后,拉取镜像速度慢,问题如下: 解决方法 配置阿里源:https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors在docker desktop里面设置…

代码随想录二刷DAY1~3

Day1 704 二分查找&#xff0c;简单 我也有自己写题解的能力了&#xff0c;而且思维很清晰&#xff1a; 找什么就在if里写什么。 class Solution {public: int search(vector<int>& nums, int target) { int l0,rnums.size()-1; while(l<r){ …

基于C++、MFC和Windows套接字实现的简单聊天室程序开发

一、一个简单的聊天室程序 该程序由服务器端和客户端两个项目组成&#xff0c;这两个项目均基于对话框的程序。服务器端项目负责管理客户端的上线、离线状态&#xff0c;以及转发客户端发送的信息。客户端项目则负责向服务器发送信息&#xff0c;并接收来自服务器的信息&#…

不一样的SYSTEM APP(SYSTEM flag和system_prop区别)

1.问题引入 在Android开发中, 1)Framework中PackageManager扫包后,会把app归类为SYSTEM, SYSTEM_EXT, PRIVILEGED 类别. 2)同样的, SeAndroid也会把APP归类程platform_app, system_app, untrusted_app(甚至还有其他,mediaprovider,gmscore_app). flag SYSTEM和system_app我们…

IDEA配置JavaFX

一、下载SDK &#x1f4ce;javafx-sdk-18.zip 二、配置依赖包 三、复制一个javafx代码 import javafx.application.Application; import javafx.scene.Scene; import javafx.scene.layout.VBox; import javafx.scene.shape.Line; import javafx.stage.Stage;public class Java…

基于Java和SSM框架的多人命题系统

你好呀&#xff0c;我是计算机学长猫哥&#xff01;如果你对多人命题系统感兴趣或者有相关开发需求&#xff0c;文末可以找到我的联系方式。 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;Java SSM框架 工具&#xff1a;Eclipse、MySQL Workbench、…

树莓派4B_OpenCv学习笔记10:调整视频帧大小

今日继续学习树莓派4B 4G&#xff1a;&#xff08;Raspberry Pi&#xff0c;简称RPi或RasPi&#xff09; 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: Opencv 版本是4.5.1&#xff1a; 今日学习一下如何降低视频帧像素 文章提供测试代码讲解…

USB转I2C转SPI芯片CH341与CH347比较

1. 芯片中文资料&#xff1a; USB转I2C转SPI芯片CH341 高速USB转接芯片CH347转9M双串口转I2C转SPI转JTAG转SWD USB2.0高速转接芯片CH347应用开发手册 2. CH341与CH347比较&#xff1a; 类别CH341CH347备注串口速度2M9MCH347的串口速度更快设置CH341的I2C或SPI不能与串口同…

DAY24 回溯算法part01 77. 组合 216.组合总和III 17.电话号码的字母组合

理论基础 #什么是回溯法 回溯法也可以叫做回溯搜索法&#xff0c;它是一种搜索的方式。 在二叉树系列中&#xff0c;我们已经不止一次&#xff0c;提到了回溯&#xff0c;例如二叉树&#xff1a;以为使用了递归&#xff0c;其实还隐藏着回溯 (opens new window)。 回溯是递…

系统集成项目管理工程师第9章思维导图发布

今天发布系统集成项目管理工程师新版第9章脑图的图片版

移动硬盘接入mac无法复制文件进去怎么办,mac里的文件如何存进移动硬盘

如果要传输的文件数据量比较大&#xff0c;相比于使用U盘&#xff0c;移动硬盘是更多的选择。移动硬盘可存储量大、传输速度快&#xff0c;是实用性比较强的储存设备。不仅是Windows设备&#xff0c;Mac电脑也经常使用到移动硬盘。但有时候&#xff0c;移动硬盘在Mac上不能传文…

Python合并文件(dat、mdf、mf4)

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。 每个人都有惰性&#xff0c;但不断学习是好好生活的根本&#xff0c;共勉&#xff01; 文章均为学习整理笔记&#xff0c;分享记录为主&#xff0c;如有错误请指正&#xff0c;共同学习进步。…

揭秘最强气象武器的库,SPEI-Python不可思议之处.

spei-python是一个专门用于计算标准化降水蒸散指数&#xff08;Standardized Precipitation Evapotranspiration Index,SPEI&#xff09;的Python库.SPEI是一种综合考虑降水和潜在蒸散发的干旱指数,用于评估干旱的严重程度和持续时间. 安装 ## 可以使用 pip 来安装 spei-pyth…

C | 在ubuntu22下开发的一些配置

目录 VScode设置 要下载的插件&#xff1a; 卸载VScode的话就是哪装的哪删。 浅用gcc 预处理指令 使用gcc 语言编译过程 1. 预处理&#xff08;Preprocessing&#xff09; 2. 编译&#xff08;Compilation&#xff09; 3. 汇编&#xff08;Assembly&#xff09; 4. …

光明网发稿投稿流程与要求,光明日报如何投稿?附光明网多少钱(价格表)

对于想要在光明网发稿的作者来说&#xff0c;媒介多多网发稿平台是一个绝佳的投稿选择。光明网作为国内一流的新闻媒体平台&#xff0c;其严谨的文章审核标准和广泛的读者基础吸引着无数作者。然而&#xff0c;由于其严格的发稿标准&#xff0c;一些作者可能会遇到一些困难&…

盛世古董乱世金-数据库稳定到底好不好?

是不是觉得这个还用问&#xff1f; 是的要问。因为这个还是一个有争议的问题。但是争议双方都没有错。这就像辩论&#xff0c;有正反双方。大家都说的有道理&#xff0c;但是很难说谁对谁错。 正方观点&#xff1a;数据库稳定好 其实这个是用户的观点&#xff0c;应用开发人…

目标检测算法SSD与FasterRCNN

目标检测算法SSD与FasterRCNN SSD:&#xff08; Single Shot MultiBox Detector&#xff09;特点是在不同特征尺度上预测不同尺度的目标。 SSD网络结构 首先对网络的特征进行说明&#xff1a;输入的图像是300x300的三通道彩色图像。 网络的第一个部分贯穿到Vgg16模型 Conv5的…