中心极限定理模拟
文章目录
- 中心极限定理模拟
- @[toc]
文章目录
- 中心极限定理模拟
- @[toc]
设服从均值为 μ \mu μ、方差为 σ 2 < ∞ \sigma^2<\infty σ2<∞的任意一个总体,抽取样本量为 n n n的样本,当 n → ∞ n\to\infty n→∞,样本均值 X ˉ \bar{X} Xˉ的抽样分布近似服从均值为 μ \mu μ,方差为 σ 2 / n \sigma^2/n σ2/n的正态分布。假设总体服从均匀分布U(0,1),抽取样本量分别为1,3,10,30,100,500,重复2000次。
# ----------------均匀分布总体------------------
set.seed(2)
N = 100000
X1 = runif(N,min=0,max=1)
M <- 2000 # 重复次数
par(mfrow = c(2,3),mar=c(5,5,5,5))
n <- c(1,3,10,30,100,500)
for(j in n){ #抽取样本量
mean.x = numeric()
for(i in 1:M){
mean.x[i] = mean(sample(X1,j))
}
hist(mean.x,col = rgb(0,0,1,alpha=0.5),breaks = 30,
main=paste("抽取",j,"个样本"),border = "red",
cex.lab=2,cex.axis=2,cex.main=2,ylab="")
}
随着样本容量
n
n
n不断增大,样本均值
X
ˉ
\bar{X}
Xˉ的抽样分布逐渐服从均匀分布,当样本量
n
=
30
n=30
n=30时,样本均值
X
ˉ
\bar{X}
Xˉ抽样分布比较接近正态。
假设总体服从 χ 2 ( 3 ) \chi^2(3) χ2(3),样本均值抽样分布随着样本量增加也会逐渐服从正态分布。
# ----------------卡方分布总体-------------------
rm(list=ls())
set.seed(1)
N = 100000
X2 = rchisq(N,df=3)
M <- 2000 # 重复次数
par(mfrow = c(2,3),mar=c(5,5,5,5))
n <- c(1,3,10,30,100,500)
for(j in n){ #抽取样本量
mean.x = numeric()
for(i in 1:M){
mean.x[i] = mean(sample(X2,j))
}
hist(mean.x,col = rgb(0,0,1,alpha=0.5),breaks = 30,
main=paste("抽取",j,"个样本"),border = "red",
cex.lab=2,cex.axis=2,cex.main=2,ylab = "")
}