参考书籍:概率论与数理统计教程第三版 茆诗松 程依明 濮晓龙 编著
文章声明:如有错误还望批评指正
文章目录
ξ \xi ξ 6.1点估计的概念与无偏性
定义6.1.1:设
x
1
,
x
2
,
…
,
x
n
x_1,x_2,\dots,x_n
x1,x2,…,xn是来自总体的一个样本,用于估计未知参数
θ
\theta
θ的统计量
θ
^
=
θ
^
(
x
1
,
x
1
,
…
,
x
n
)
\hat \theta=\hat\theta(x_1,x_1,\dots,x_n)
θ^=θ^(x1,x1,…,xn)称为
θ
\theta
θ的估计量,或称为
θ
\theta
θ的点估计。简称估计。
定义6.1.2:设
θ
^
=
θ
^
(
x
1
,
x
2
,
…
,
x
n
)
\hat\theta=\hat\theta(x_1,x_2,\dots,x_n)
θ^=θ^(x1,x2,…,xn)是
θ
\theta
θ的一个估计,
θ
\theta
θ的参数空间为
Θ
\Theta
Θ,若对任意的
θ
∈
Θ
,有
E
θ
(
θ
^
)
=
θ
\theta \in \Theta,有E_{\theta}(\hat \theta)=\theta
θ∈Θ,有Eθ(θ^)=θ。则称
θ
^
\hat\theta
θ^是
θ
\theta
θ的无偏估计,否则称为有偏估计。
定义6.1.3:设
θ
^
1
,
θ
^
2
\hat\theta_1,\hat\theta_2
θ^1,θ^2是
θ
\theta
θ的两个无偏估计,如果对任意的
θ
∈
Θ
\theta\in\Theta
θ∈Θ有
V
a
r
(
θ
^
1
)
≤
V
a
r
(
θ
^
2
)
Var(\hat\theta_1)\leq Var(\hat\theta_2)
Var(θ^1)≤Var(θ^2)且至少有一个
θ
∈
Θ
\theta\in\Theta
θ∈Θ使得上述不等号严格成立,则称
θ
^
1
\hat\theta_1
θ^1比
θ
^
2
\hat\theta_2
θ^2有效。
关于习题:做下,1题,2题(感觉这道题答案解析不太好理解),3题,4题,7题。适合练手。其他我没做了,也不知道考不。
PS:
ξ
6.1
\xi6.1
ξ6.1还有一些东西没看,总感觉不踏实。但是毕竟我的目标不是学好数理统计而是应付期末考试以及未来潜在考试。
ξ 6.2 \xi6.2 ξ6.2矩估计及相和性
替换原理(矩法):1.样本矩替换总体矩;2.样本矩的函数替换总体矩的函数。 它的实质使用经验分布替换总体分布,理论基础来自格列文科定理。
定义6.2.1:设
θ
∈
Θ
\theta\in\Theta
θ∈Θ为未知参数,
θ
^
n
=
θ
^
n
(
x
1
,
x
2
,
…
,
x
n
)
\hat\theta_n=\hat\theta_n(x_1,x_2,\dots,x_n)
θ^n=θ^n(x1,x2,…,xn)是
θ
\theta
θ的一个估计量,
n
n
n是样本容量,若对任何一个
ϵ
>
0
\epsilon>0
ϵ>0,有
lim
n
→
∞
P
(
∣
θ
^
n
−
θ
∣
≥
ϵ
)
=
0
\lim\limits_{n\rightarrow\infty}P(|\hat\theta_n-\theta|\geq\epsilon)=0
n→∞limP(∣θ^n−θ∣≥ϵ)=0,则称
θ
^
n
\hat\theta_n
θ^n为参数
θ
\theta
θ的相合估计。
定理6.2.1:设
θ
^
n
=
θ
^
n
(
x
1
,
x
2
,
…
,
x
n
)
\hat\theta_n=\hat\theta_n(x_1,x_2,\dots,x_n)
θ^n=θ^n(x1,x2,…,xn)是
θ
\theta
θ的一个估计量,若
lim
n
→
∞
E
(
θ
^
n
)
=
θ
,
lim
n
→
∞
V
a
r
(
θ
^
n
)
=
0
\lim\limits_{n\rightarrow\infty}E(\hat\theta_n)=\theta,\lim\limits_{n\rightarrow\infty}Var(\hat\theta_n)=0
n→∞limE(θ^n)=θ,n→∞limVar(θ^n)=0,则
θ
^
n
\hat\theta_n
θ^n是
θ
\theta
θ的相合估计。
定理6.2.2:若
θ
^
n
1
,
θ
^
n
2
,
…
,
θ
^
n
k
\hat\theta_{n1},\hat\theta_{n2},\dots,\hat\theta_{nk}
θ^n1,θ^n2,…,θ^nk分别是
θ
1
,
θ
2
,
…
,
θ
k
\theta_1,\theta_2,\dots,\theta_k
θ1,θ2,…,θk的相合估计,
η
=
g
(
θ
1
,
θ
2
,
…
,
θ
k
)
\eta=g(\theta_1,\theta_2,\dots,\theta_k)
η=g(θ1,θ2,…,θk)是
θ
1
,
θ
2
,
…
,
θ
k
\theta_1,\theta_2,\dots,\theta_k
θ1,θ2,…,θk的连续函数,则
η
^
=
g
(
θ
^
n
1
,
θ
^
n
2
,
…
,
θ
^
n
k
)
\hat\eta=g(\hat\theta_{n1},\hat\theta_{n2},\dots,\hat\theta_{nk})
η^=g(θ^n1,θ^n2,…,θ^nk)是
η
\eta
η的相合估计。
矩估计一般具有相合性。
关于习题:1题,2题,3题(1),3题(2)(有步变化不能理解应该是数学分析的内容,暂时跳过)。适合练手,后面套路都是一样。实在没有把握自己再挑几道。
PS:这节两个定理证明也没有看,希望不要埋下伏笔。
ξ 6.3 \xi6.3 ξ6.3最大似然估计与EM算法
定义6.3.1:设总体的概率函数为
p
(
x
;
θ
)
,
θ
∈
Θ
p(x;\theta),\theta\in\Theta
p(x;θ),θ∈Θ,其中
θ
\theta
θ是一个未知参数或几个未知参数组成的参数向量,
Θ
\Theta
Θ是参数空间,
x
1
,
x
2
,
…
,
x
n
x_1,x_2,\dots,x_n
x1,x2,…,xn是来自该总体的样本,将样本的联合概率函数看成
θ
\theta
θ的函数,用
L
(
θ
;
x
1
,
x
2
,
…
,
x
n
)
L(\theta;x_1,x_2,\dots,x_n)
L(θ;x1,x2,…,xn)表示,简计为
L
(
θ
)
L(\theta)
L(θ),
L
(
θ
)
=
L
(
θ
;
x
1
,
x
2
,
…
,
x
n
)
=
p
(
x
1
;
θ
)
p
(
x
2
;
θ
)
…
p
(
x
n
;
θ
)
,
L
(
θ
)
L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=p(x_1;\theta)p(x_2;\theta)\dots p(x_n;\theta),L(\theta)
L(θ)=L(θ;x1,x2,…,xn)=p(x1;θ)p(x2;θ)…p(xn;θ),L(θ)称为样本的似然函数。如果某统计量
θ
^
=
θ
^
(
x
1
,
x
2
,
…
,
x
n
)
\hat\theta=\hat\theta(x_1,x_2,\dots,x_n)
θ^=θ^(x1,x2,…,xn)满足
L
(
θ
^
)
=
max
θ
∈
Θ
L
(
θ
)
L(\hat\theta)=\max\limits_{\theta\in\Theta}L(\theta)
L(θ^)=θ∈ΘmaxL(θ)则称
θ
^
\hat\theta
θ^是
θ
\theta
θ的最大似然估计,简记为MLE。
关于习题:1题,2题,3题(一个题型,超级简单,挑几道题来做就好,二元就求偏导就好)。4题(前面有道例题一样,学会转换)。5题,6题感觉都是应用,做了4题就不做了。7题,8题(一个题型,挑7道题来做就好,不是很难)。9题得做一下吧(思路挺好)。10题不想看了。
PS:EM算法感觉考不到吧。但是机器学习要用,等到机器学习再来。渐近正态性感觉也考不到吧,先放下吧。
ξ
\xi
ξ 6.4最小方差无偏估计
不作考察
ξ
\xi
ξ 6.5贝叶斯估计
不作考察
ξ 6.6 \xi6.6 ξ6.6区间估计
定义6.6.1:设
θ
\theta
θ是总体的一个参数,其参数空间为
Θ
\Theta
Θ,
x
1
,
x
2
,
…
,
x
n
x_1,x_2,\dots,x_n
x1,x2,…,xn是来自该总体的样本,对给定的一个
α
(
0
<
α
<
1
)
\alpha(0<\alpha<1)
α(0<α<1),假设有两个统计量
θ
^
L
=
θ
^
L
(
x
1
,
x
2
,
…
,
x
n
)
\hat\theta_L=\hat\theta_L(x_1,x_2,\dots,x_n)
θ^L=θ^L(x1,x2,…,xn)和
θ
^
U
=
θ
^
U
(
x
!
,
x
2
,
…
,
x
n
)
\hat\theta_U=\hat\theta_U(x_!,x_2,\dots,x_n)
θ^U=θ^U(x!,x2,…,xn),若对任意的
θ
∈
Θ
\theta\in\Theta
θ∈Θ,有
P
θ
(
θ
^
L
≤
θ
≤
θ
^
U
)
≥
1
−
α
P_{\theta}(\hat\theta_L\leq\theta\leq\hat\theta_U)\geq 1-\alpha
Pθ(θ^L≤θ≤θ^U)≥1−α则称随机区间
[
θ
^
L
,
θ
^
U
]
[\hat\theta_L,\hat\theta_U]
[θ^L,θ^U]为
θ
\theta
θ的置信水平为
1
−
α
1-\alpha
1−α的置信区间,或简称
[
θ
^
L
,
θ
^
U
]
[\hat\theta_L,\hat\theta_U]
[θ^L,θ^U]是
θ
\theta
θ的
1
−
α
1-\alpha
1−α置信区间,
θ
^
L
\hat\theta_L
θ^L和
θ
^
U
\hat\theta_U
θ^U分别称为
θ
\theta
θ的(双侧)置信下限和置信上限。
模拟例6.6.1
import numpy as np
lt=[]
for i in range(100):
lt_new=np.random.normal(15,2,10)
x,y=np.mean(lt_new),np.std(lt_new)
a,b=x-0.5797*y,x+0.5797*y
lt.append((a,b))
import matplotlib.pyplot as plt;import seaborn as sns
plt.figure(figsize=(16,9));sns.set_style("darkgrid")
for i in range(100):
plt.vlines(x=i+1,ymin=lt[i][0],ymax=lt[i][1],linewidth=2,colors="green")
plt.scatter(i+1,lt[i][0],c="blue");plt.scatter(i+1,lt[i][1],c="red")
plt.show()
cnt=1
for i in lt:
if 15>i[0] and 15<i[1]:
cnt+=1
print(cnt/100)
import numpy as np
lt=[]
for i in range(100):
lt_new=np.random.normal(15,2,10)
x,y=np.mean(lt_new),np.std(lt_new)
a,b=x-0.2222*y,x+0.2222*y
lt.append((a,b))
import matplotlib.pyplot as plt;import seaborn as sns
plt.figure(figsize=(16,9));sns.set_style("darkgrid")
for i in range(100):
plt.vlines(x=i+1,ymin=lt[i][0],ymax=lt[i][1],linewidth=2,colors="green")
plt.scatter(i+1,lt[i][0],c="blue");plt.scatter(i+1,lt[i][1],c="red")
plt.show()
cnt=1
for i in lt:
if 15>i[0] and 15<i[1]:
cnt+=1
print(cnt/100)
定义6.6.2:沿用定义6.6.1的记号,如对给定的
α
(
0
<
α
<
1
)
\alpha(0<\alpha<1)
α(0<α<1),对任意的
θ
∈
Θ
\theta\in\Theta
θ∈Θ,有
P
θ
(
θ
^
L
≤
θ
≤
θ
^
U
)
=
1
−
α
P_{\theta}(\hat\theta_L\leq\theta\leq\hat\theta_U)= 1-\alpha
Pθ(θ^L≤θ≤θ^U)=1−α,则称
[
θ
^
L
,
θ
^
U
]
[\hat\theta_L,\hat\theta_U]
[θ^L,θ^U]为
θ
\theta
θ的
1
−
α
1-\alpha
1−α同等置信区间。
定义6.6.3:设
θ
^
L
=
θ
^
L
(
x
1
,
x
2
,
…
,
x
n
)
\hat\theta_L=\hat\theta_L(x_1,x_2,\dots,x_n)
θ^L=θ^L(x1,x2,…,xn)是统计量,对给定的
α
∈
(
0
,
1
)
\alpha\in(0,1)
α∈(0,1)和任意的
θ
∈
Θ
\theta\in\Theta
θ∈Θ,有
P
θ
(
θ
^
L
≤
θ
)
≥
1
−
α
,
∀
θ
∈
Θ
P_{\theta}(\hat\theta_L\leq\theta)\geq1-\alpha,\forall\theta\in\Theta
Pθ(θ^L≤θ)≥1−α,∀θ∈Θ,则称
θ
^
L
\hat\theta_L
θ^L为
θ
\theta
θ的置信水平为
1
−
α
1-\alpha
1−α的(单侧)置信下限。假如等号对一切
θ
∈
Θ
\theta\in\Theta
θ∈Θ成立,则称
θ
^
L
\hat\theta_L
θ^L为
θ
\theta
θ的
1
−
α
1-\alpha
1−α同等置信下限。
定义6.6.3:设
θ
^
U
=
θ
^
U
(
x
1
,
x
2
,
…
,
x
n
)
\hat\theta_U=\hat\theta_U(x_1,x_2,\dots,x_n)
θ^U=θ^U(x1,x2,…,xn)是统计量,对给定的
α
∈
(
0
,
1
)
\alpha\in(0,1)
α∈(0,1)和任意的
θ
∈
Θ
\theta\in\Theta
θ∈Θ,有
P
θ
(
θ
^
U
≥
θ
)
≥
1
−
α
,
∀
θ
∈
Θ
P_{\theta}(\hat\theta_U\geq\theta)\geq1-\alpha,\forall\theta\in\Theta
Pθ(θ^U≥θ)≥1−α,∀θ∈Θ,则称
θ
^
U
\hat\theta_U
θ^U为
θ
\theta
θ的置信水平为
1
−
α
1-\alpha
1−α的(单侧)置信上限。假如等号对一切
θ
∈
Θ
\theta\in\Theta
θ∈Θ成立,则称
θ
^
U
\hat\theta_U
θ^U为
θ
\theta
θ的
1
−
α
1-\alpha
1−α同等置信上限。
根本思想轴枢量法
单正态总体的参数置信区间
1.
σ
\sigma
σ已知时
u
u
u的置信区间:
[
x
ˉ
−
u
1
−
α
/
2
σ
/
n
,
x
ˉ
+
u
1
−
α
/
2
σ
/
n
]
[\bar x-u_{1-\alpha/2}\sigma/\sqrt{n},\bar x+u_{1-\alpha/2}\sigma/\sqrt{n}]
[xˉ−u1−α/2σ/n,xˉ+u1−α/2σ/n]
对应1题,2题,3题(3题2小题解析我感觉不好理解。应该是求出X的密度函数吧,然后求出X的期望,得到了
E
(
X
)
=
e
u
+
1
2
E(X)=e^{u+\frac{1}{2}}
E(X)=eu+21这个式子。概率论不好,暂时没有算,不知道对不对,以后回来),5题(2)小题
获取
u
1
−
α
/
2
u_{1-\alpha/2}
u1−α/2值
import scipy.stats as stats
p=0.975
print(stats.norm.ppf(p))
#1.959963984540054
书上有表那就按照书上的来
2.
σ
\sigma
σ未知时
u
u
u的置信区间:
[
x
ˉ
−
t
1
−
α
/
2
(
n
−
1
)
s
/
n
,
x
ˉ
+
t
1
−
α
/
2
(
n
−
1
)
s
/
n
]
[\bar x-t_{1-\alpha/2}(n-1)s/\sqrt{n},\bar x+t_{1-\alpha/2}(n-1)s/\sqrt{n}]
[xˉ−t1−α/2(n−1)s/n,xˉ+t1−α/2(n−1)s/n]
对应4题(2)小题,5题(1)小题
获取
t
1
−
α
/
2
t_{1-\alpha/2}
t1−α/2值
import scipy.stats as stats
p=0.975;df=10
print(stats.t.ppf(p,df))
#2.2281388519649385
书上有表那就按照书上的来
3.
u
u
u未知时
σ
\sigma
σ的置信区间:
[
(
n
−
1
)
s
2
/
X
1
−
α
/
2
2
(
n
−
1
)
,
(
n
−
1
)
s
2
/
X
α
/
2
2
(
n
−
1
)
]
[\sqrt{(n-1)s^2/\mathcal{X}^2_{1-\alpha/2}(n-1)},\sqrt{(n-1)s^2/\mathcal{X}^2_{\alpha/2}(n-1)}]
[(n−1)s2/X1−α/22(n−1),(n−1)s2/Xα/22(n−1)]
对应4题(1)小题,5题(3)小题
获取
X
1
−
α
/
2
2
(
n
−
1
)
\mathcal{X}^2_{1-\alpha/2}(n-1)
X1−α/22(n−1)值
import scipy.stats as stats
p=0.025;df=9
print(stats.chi2.ppf(p,df))
#2.700389499980358
书上有表那就按照书上的来
大样本的置信区间
两点分布大样本置信区间:
[
x
ˉ
−
u
1
−
α
/
2
x
ˉ
(
1
−
x
ˉ
)
n
,
x
ˉ
+
u
1
−
α
/
2
x
ˉ
(
1
−
x
ˉ
)
n
]
[\bar x-u_{1-\alpha/2}\sqrt{\frac{\bar x(1-\bar x)}{n}},\bar x+u_{1-\alpha/2}\sqrt{\frac{\bar x(1-\bar x)}{n}}]
[xˉ−u1−α/2nxˉ(1−xˉ),xˉ+u1−α/2nxˉ(1−xˉ)]
对应6题
样本量的确定
按照前面公式进行n的反推。(一般都会给你区间长度不超过某个值,实际操作应该只有大样本置信区间能手算反推)。
双正态总体的参数置信区间
1.
u
1
−
u
2
u_1-u_2
u1−u2的置信区间
1.1
σ
1
2
\sigma_1^2
σ12和
σ
2
2
\sigma_2^2
σ22已知时:[
x
ˉ
−
y
ˉ
−
u
1
−
α
/
2
σ
1
2
m
+
σ
2
2
n
,
x
ˉ
−
y
ˉ
+
u
1
−
α
/
2
σ
1
2
m
+
σ
2
2
n
]
\bar x-\bar y-u_{1-\alpha/2}\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}},\bar x-\bar y+u_{1-\alpha/2}\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}]
xˉ−yˉ−u1−α/2mσ12+nσ22,xˉ−yˉ+u1−α/2mσ12+nσ22]。对应9题(1)小题。
1.2
σ
1
2
=
σ
2
2
=
σ
2
\sigma_1^2=\sigma_2^2=\sigma^2
σ12=σ22=σ2未知时:
[
x
ˉ
−
y
ˉ
−
m
+
n
m
n
s
w
t
1
−
α
/
2
(
m
+
n
−
2
)
,
x
ˉ
−
y
ˉ
+
m
+
n
m
n
s
w
t
1
−
α
/
2
(
m
+
n
−
2
)
]
[\bar x-\bar y-\sqrt{\frac{m+n}{mn}}s_wt_{1-\alpha/2}(m+n-2),\bar x-\bar y+\sqrt{\frac{m+n}{mn}}s_wt_{1-\alpha/2}(m+n-2)]
[xˉ−yˉ−mnm+nswt1−α/2(m+n−2),xˉ−yˉ+mnm+nswt1−α/2(m+n−2)]。对应9题(2)小题。
1.3
σ
2
2
/
σ
1
2
=
c
\sigma_2^2/\sigma_1^2=c
σ22/σ12=c已知时:
[
x
ˉ
−
y
ˉ
−
m
c
+
n
m
n
s
w
t
1
−
α
/
2
(
m
+
n
−
2
)
,
x
ˉ
−
y
ˉ
+
m
c
+
n
m
n
s
w
t
1
−
α
/
2
(
m
+
n
−
2
)
]
[\bar x-\bar y-\sqrt{\frac{mc+n}{mn}}s_wt_{1-\alpha/2}(m+n-2),\bar x-\bar y+\sqrt{\frac{mc+n}{mn}}s_wt_{1-\alpha/2}(m+n-2)]
[xˉ−yˉ−mnmc+nswt1−α/2(m+n−2),xˉ−yˉ+mnmc+nswt1−α/2(m+n−2)]。没有对应。
1.4
m
m
m与
n
n
n很大时:
[
x
ˉ
−
y
ˉ
−
u
1
−
α
/
2
s
x
2
m
+
s
y
2
n
,
x
ˉ
−
y
ˉ
+
u
1
−
α
/
2
s
x
2
m
+
s
y
2
n
]
[\bar x-\bar y-u_{1-\alpha/2}\sqrt{\frac{s_x^2}{m}+\frac{s_y^2}{n}},\bar x-\bar y+u_{1-\alpha/2}\sqrt{\frac{s_x^2}{m}+\frac{s_y^2}{n}}]
[xˉ−yˉ−u1−α/2msx2+nsy2,xˉ−yˉ+u1−α/2msx2+nsy2]。对应9题(3)小题。
PS:还是自己推一推吧,不是很难,反正我是记不住的。
1.5一般情况近似置信区间:跳过。
[
x
ˉ
−
y
ˉ
−
s
0
t
1
−
α
/
2
(
l
)
,
x
ˉ
−
y
ˉ
+
s
0
t
1
−
α
/
2
(
l
)
]
,
s
0
=
s
x
2
/
m
+
s
y
2
/
n
,
l
=
s
0
4
s
x
4
m
2
(
m
−
1
)
+
s
y
4
n
2
(
n
−
1
)
[\bar x-\bar y-s_0t_{1-\alpha/2}(l),\bar x-\bar y+s_0t_{1-\alpha/2}(l)],s_0=\sqrt{s_x^2/m+s_y^2/n},l=\frac{s_0^4}{\frac{s_x^4}{m^2(m-1)}+\frac{s_y^4}{n^2(n-1)}}
[xˉ−yˉ−s0t1−α/2(l),xˉ−yˉ+s0t1−α/2(l)],s0=sx2/m+sy2/n,l=m2(m−1)sx4+n2(n−1)sy4s04。没有对应。
σ
1
2
/
σ
2
2
\sigma_1^2/\sigma_2^2
σ12/σ22的置信区间
σ
1
2
/
σ
2
2
\sigma_1^2/\sigma_2^2
σ12/σ22的置信区间
[
s
x
2
s
y
2
⋅
1
F
1
−
α
/
2
(
m
−
1
,
n
−
1
)
,
s
x
2
s
y
2
⋅
1
F
α
/
2
(
m
−
1
,
n
−
1
)
]
[\frac{s_x^2}{s_y^2}\cdot\frac{1}{F_{1-\alpha/2}(m-1,n-1)},\frac{s_x^2}{s_y^2}\cdot\frac{1}{F_{\alpha/2}(m-1,n-1)}]
[sy2sx2⋅F1−α/2(m−1,n−1)1,sy2sx2⋅Fα/2(m−1,n−1)1]。对应9题(4)小题。
获取
F
1
−
α
/
2
(
m
−
1
,
n
−
1
)
F_{1-\alpha/2}(m-1,n-1)
F1−α/2(m−1,n−1)值
import scipy.stats as ss
p=0.025;df1=9;df2=14
print(ss.f.ppf(p,9,14))
#0.2632997660331528
书上有表那就按照书上的来
只做了知识点对应部分,其他没有时间来做了吧。感觉应该十分重要,以后回来再慢慢做吧。