1.正态总体下常见的抽样分布
本人博客:总体分布、样本分布、抽样分布的区别
本人博客:三大抽样分布
正态总体下常见的抽样分布意思是:样本来自服从正态分布的总体中,从样本中抽样后得到的分布
1.1 单个正态总体下的抽样分布:正态分布
设总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2), X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布),样本均值为 X ˉ \bar{X} Xˉ
样本均值服从的分布为:
X
ˉ
∼
N
(
μ
,
σ
2
n
)
\bar{X} \sim N(\mu,\frac{\sigma^2}{n})
Xˉ∼N(μ,nσ2)(正态分布)
服从正态分布的各个随机变量线性组合仍为正态分布
可以将样本均值(随机变量)标准化:
X
ˉ
−
μ
σ
/
n
∼
N
(
0
,
1
)
\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)
σ/nXˉ−μ∼N(0,1)
若将上述标准化后的随机变量进行平方,则处理后服从自由度为1的卡方分布
(
X
ˉ
−
μ
σ
/
n
)
2
∼
χ
2
(
1
)
\big(\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\big)^2\sim \chi^2(1)
(σ/nXˉ−μ)2∼χ2(1)
1.2 单个正态总体下的抽样分布:自由度为 n 的卡方分布
设总体
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),
X
1
,
X
2
,
⋯
,
X
n
X_1,X_2,\cdots,X_n
X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布)
若将每个样本(随机变量)进行标准化后平方再进行加和,则服从自由度为n的卡方分布
∑ i = 1 n ( X i − μ ) 2 σ 2 ∼ χ 2 ( n ) \frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\sigma^2}\sim \chi^2(n) σ2∑i=1n(Xi−μ)2∼χ2(n)
1.3 单个正态总体下的抽样分布:自由度为 n-1 的卡方分布
设总体
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),
X
1
,
X
2
,
⋯
,
X
n
X_1,X_2,\cdots,X_n
X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布),样本均值为
X
ˉ
\bar{X}
Xˉ,样本方差为
S
2
S^2
S2,
X
ˉ
\bar{X}
Xˉ 与
S
2
S^2
S2 相互独立
下图来自《统计学图鉴》中对自由度的理解
样本方差
S
2
S^2
S2本身是不遵循概率分布的,为了能让它遵循卡方分布,我们需要将其变换为与样本方差
S
2
S^2
S2成比例的统计量(卡方分布)
n
B
2
σ
2
=
(
n
−
1
)
S
2
σ
2
=
∑
i
=
1
n
(
X
i
−
X
ˉ
)
2
σ
2
∼
χ
2
(
n
−
1
)
\frac{nB_2}{\sigma^2}=\frac{(n-1)S^2}{\sigma^2}=\frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\sigma^2}\sim \chi^2(n-1)
σ2nB2=σ2(n−1)S2=σ2∑i=1n(Xi−Xˉ)2∼χ2(n−1)
注意区分下图中两个式子:
区别:一个是总体均值(数值)
μ
\mu
μ,一个是样本均值(随机变量)
X
ˉ
\bar{X}
Xˉ
∑
i
=
1
n
(
X
i
−
μ
)
2
σ
2
∼
χ
2
(
n
)
∑
i
=
1
n
(
X
i
−
X
ˉ
)
2
σ
2
∼
χ
2
(
n
−
1
)
\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\sigma^2}\sim \chi^2(n)\\ ~\\ \frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{\sigma^2}\sim \chi^2(n-1)
σ2∑i=1n(Xi−μ)2∼χ2(n) σ2∑i=1n(Xi−Xˉ)2∼χ2(n−1)
1.4 两个正态总体下的抽样分布:自由度为 n 的 t 分布
X
Y
1
2
+
Y
2
2
+
⋯
+
Y
n
2
n
∼
t
(
n
)
\frac{X}{\sqrt{\frac{Y_1^2+Y_2^2+\cdots+Y_n^2}{n}}}\sim t(n)
nY12+Y22+⋯+Yn2X∼t(n)
1.5 单个正态总体下的抽样分布:自由度为 n-1 的 t 分布
设总体
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),
X
1
,
X
2
,
⋯
,
X
n
X_1,X_2,\cdots,X_n
X1,X2,⋯,Xn 是来自总体X的样本(独立且同分布),样本均值为
X
ˉ
\bar{X}
Xˉ,样本方差为
S
2
S^2
S2,
X
ˉ
\bar{X}
Xˉ 与
S
2
S^2
S2 相互独立
X
ˉ
−
μ
S
/
n
∼
t
(
n
−
1
)
\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1)
S/nXˉ−μ∼t(n−1)
若将上述随机变量平方,则其服从F分布
(
X
ˉ
−
μ
S
/
n
)
2
∼
F
(
1
,
n
−
1
)
\big(\frac{\bar{X}-\mu}{S/\sqrt{n}}\big)^2\sim F(1,n-1)
(S/nXˉ−μ)2∼F(1,n−1)
1.6 小结:单个正态总体下的抽样分布
1.7 两个正态总体下的抽样分布:自由度为 n 1 + n 2 − 2 n_1+n_2-2 n1+n2−2 的 t 分布
1.8 两个正态总体下的抽样分布: F ( n 1 − 1 , n 2 − 1 ) F(n_1-1,n_2-1) F(n1−1,n2−1)