概率论与数理统计总复习

news2025/1/11 3:14:27

复习课本:中科大使用的教辅《概率论和数理统计》缪柏其、张伟平版本

目录

0.部分积分公式

1.容斥原理 

2.条件概率

3.全概率公式

4.贝叶斯公式

5.独立性

6.伯努利分布(两点分布)

7.二项分布

8.帕斯卡分布(负二项分布)

9.泊松(Poisson)分布

10.分布函数

11.连续型随机变量,概率密度函数

12.均匀分布

13.指数分布

14.正态分布

15.随机变量函数(一种变换)

16.多维随机变量

17.边际分布

18.条件分布

19.数学期望

20.中位数和众数

21.方差和矩

22.协方差

23.熵

24.大数定理和中心极限定理

25.统计量

26.χ²分布

27.t分布

28.F分布

29.矩估计

30.最大似然估计

31.优良性准则

32.置信区间和置信系数

33.枢轴变量法

34.大样本方法

35.假设检验概念

36.正态总体参数检验

37.拟合优度检验


0.部分积分公式

\Gamma函数:

\Gamma(r)=\int_{0}^{+\infty}e^{-t}t^{r-1}dt

性质:

\Gamma(r+1)=r\Gamma(r)

\Gamma(n)=(n-1)!

\Gamma(1)=1,\Gamma(\frac{1}{2})=\sqrt \pi

\Gamma(z)\Gamma(1-z)=\frac{\pi}{\sin(\pi z)}

\beta函数:

B(P,Q)=\int_{0}^{1}x^{p-1}(1-x)^{q-1}dx

性质:

B(P,Q)=\frac{\Gamma(P)\Gamma(Q)}{\Gamma(P+Q)}

1.容斥原理 

P(\bigcup_{k=1}^{n}A_k)=\sum_{k=1}^{n}P(A_k)-\sum_{1\leq i <j\leq n}P(A_iA_j)+\sum_{1\leq i <j<k\leq n}P(A_iA_jA_k)-\dots+(-1)^{n-1}P(A_1A_2\dots A_n)

2.条件概率

P(A|B)=\frac{P(AB)}{P(B)}

3.全概率公式

B_i\dots是样本空间\Omega的一个划分(完备事件群),则

P(A)=\sum_{i=1}^{n}P(A|B_i)P(B_i)

例1.20

4.贝叶斯公式

B_i\dots是样本空间\Omega的一个划分(完备事件群),则

P(B_i|A)=\frac{P(B_iA)}{P(A)}=\frac{P(A|B_i)P(B_i)}{\sum_{j=1}^{n}P(A|B_j)P(B_j)}

即因果关系互换

例1.24

5.独立性

P(AB)=P(A)P(B)

或            P(B|A)=P(B)

P(A_{i1}A_{i2}\dots A_{ik})=P(A_{i1})P(A_{i2})\dots P(A_{ik})

读完18后

对于随机变量X,Y的联合分布:

F(x,y)=F_1(x)F_2(y)

则X,Y相互独立

同理:

f(x,y)=f_1(x)f_2(y)

见例3.16

读22后

若非退化的X,Y存在方差,X,Y不相关的等价命题:

Cov(X,Y)=0,\\ E(XY)=E(X)E(Y),\\ Var(X+Y)=Var(X)+Var(Y)

6.伯努利分布(两点分布)

满足0-1分布

P(X=0)=1-p\\ P(X=1)=p

7.二项分布

设离散型随机变量X所有可能取值为{0,1,...,n},0<p<1

P(X=k)=\binom{n}{k}p^k(1-p)^{n-k},k=0,1,\dots,n

X\sim B(n,p)

读19后

E(X)=np

Var(X)=np(1-p)

读25后

X=(X_1,X_2,\dots,X_n)为来自总体X\sim B(1,p)的简单样本,统计量的抽样分布:

T(X)=\sum_{i=1}^{n}X_i\sim B(n,p)

读36后

比例p的检验

X=(X_1,X_2,\dots,X_n)为来自总体X\sim B(1,p)的简单样本,p的常见假设有三种:

H_0:p\leq p_0\leftrightarrow H_1:p>p_0

H_0':p\geq p_0\leftrightarrow H_1':p<p_0

H_0'':p= p_0\leftrightarrow H_1'':p\neq p_0

其中p_0为(0,1)已知常数

8.帕斯卡分布(负二项分布)

X_r取正整数值,其分布率为:

P(X_r=k)=\binom{k-1}{r-1}p^r(1-p)^{k-r},k=r,r+1,\dots

其中r为正整数,0<p<1,记为X\sim NB(r,p)

P(X_r=k)记为nb(r,p,k),代表【前k-1次恰有r-1次成功,且第k次成功】的概率

见例2.8

9.泊松(Poisson)分布

P(X=k)=e^{-\lambda}\frac{\lambda^k}{k!},k=0,1,\dots\\\lambda>0

记为X\sim P(\lambda)

泊松逼近定理

设一族随机变量X_n\sim B(n,p_n),若当n\rightarrow \infty时,np_n\rightarrow \lambda >0,则

\lim_{n\rightarrow \infty}P(X_n=k)=e^{-\lambda}\frac{\lambda^k}{k!},k=0,1,\dots

n\geq30,np_n\leq 5时即可应用

例2.15

读19后

E(X)=\lambda

Var(X)=\lambda

读34后

从泊松分布总体P(\lambda)中抽取一个简单随机样本x_1,x_2,\dots,x_n,求\lambda的区间估计

由中心极限定理以及上面的期望方差,有枢轴变量:

\frac{\sqrt{n}(\bar{X}-\lambda)}{\sqrt{\lambda}}\sim N(0,1)

得:\lambda\in \bar{x}+\frac{u_{\alpha/2}^2}{2n}\pm u_{\alpha/2}\sqrt{\frac{\bar{x}}{n}+\frac{u_{\alpha/2}^2}{4n^2}}

同理,样本方差也可进入枢轴变量:

\sqrt{n}(\bar{X}-\lambda)/S\sim N(0,1)

10.分布函数

F(x)=P(X\leq x)

11.连续型随机变量,概率密度函数

若存在非负函数f(x)\geq 0,对于任意x

F(x)=\int_{-\infty}^{x}f(t)dt

则X为连续性随机变量,f(x)为概率密度函数,

记为X\sim f(x)

12.均匀分布

f(x)=\frac{1}{b-a}I_{(a,b)}(x)

记为X\sim U(a,b)

读19后

E(X)=\frac{b+a}{2}

Var(X)=\frac{(b-a)^2}{12}

13.指数分布

f(x)=\lambda e^{-\lambda x}I_{(0,\infty)}(x)

其中\lambda >0

记为X\sim Exp(\lambda)

性质:无记忆性

P(X>s+t|X>t)=P(X>s)

读19后

E(X)=\frac{1}{\lambda}

Var(X)=\frac{1}{\lambda^2}

读20后

矩母函数

M_Y(s)=E(e^{sY})=\int_{0}^{\infty}\lambda e^{-\lambda y}e^{sy}dy=\frac{\lambda}{\lambda-s}

读34后

从指数分布总体Exp(\lambda)中抽取一个简单随机样本x_1,x_2,\dots,x_n

求均值\theta=\lambda^{-1}1-\alpha置信区间

枢轴变量:2n\lambda\bar{X}\sim \chi^2_{2n}

\theta=\lambda^{-1}\in[\frac{2n\bar{x}}{\chi^2_{2n}(\alpha/2)},\frac{2n\bar{x}}{\chi_{2n}^2(1-\alpha/2)}]

同理n充分大时,可以用中心极限定理

枢轴变量:\frac{\sqrt{n}(\bar{X}-\theta)}{\theta}\sim N(0,1)

14.正态分布

f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp\{-\frac{(x-\mu)^2}{2\sigma^2}\},x\in \mathbb{R}

记为X\sim N(\mu,\sigma^2)

\mu=0,\sigma=1时为标准正态分布,此时的f(x)记为\varphi(x),分布函数F(x)记为\Phi(x)

性质:

\Phi(-x)=1-\Phi(x)

对于一般正态分布的F(x),有变换\frac{X-\mu}{\sigma}\sim N(0,1),称为标准化变换。

F(x)=\Phi(\frac{x-\mu}{\sigma})

读19后

E(X)=\mu

Var(X)=\sigma^2

读20后

矩母函数

M_X(s)=E(e^{sX})=\int_{-\infty}^{\infty}e^{xs}\frac{1}{\sqrt{2\pi \sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=e^{\mu s+\frac{1}{2}\sigma^2s^2}

读28后

如果随机变量X_1,X_2,\dots,X_n \sim N(\mu,\sigma^2),c都为常数,则独立的正态随机变量的线性组合服从正态分布:

T=\sum_{k=1}^{n}c_kX_k\sim N(\mu\sum_{k=1}^nc_k,\sigma^2\sum_{k=1}^nc_k^2)

特殊:c都为1/n,则T为样本均值

\bar{X}\sim N(\mu,\frac{\sigma^2}{n})

读33后

正态总体均值\mu的置信区间为\bar{x}\pm d,其中误差界限d:

\sigma^2已知时:

枢轴变量:\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}\sim N(0,1)

d=\frac{\sigma}{\sqrt{n}}u_{\alpha/2}  

\sigma^2未知时:

枢轴变量:\frac{\sqrt{n}(\bar{X}-\mu)}{S}\sim t_{n-1}

d=\frac{s}{\sqrt{n}}t_{n-1}(\alpha/2)

n>30,\sigma^2未知,总体不必为正态:

使用中心极限定理:\hat{\sigma}为总体标准差的相合估计

d=\frac{\hat{\sigma}}{\sqrt{n}}u_{\alpha/2}

均值方差都未知时,正态分布方差\sigma^2的置信区间估计

枢轴变量:\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}

\sigma^2\in [(n-1)s^2/\chi^2_{n-1}(\alpha/2),(n-1)s^2/\chi^2_{n-1}(1-\alpha/2)]

两个独立正态分布总体,分别服从N(\mu_1,\sigma^2_1),N(\mu_2,\sigma^2_2)

求均值差\mu_1-\mu_2置信系数为1-\alpha的置信区间

\sigma_1^2,\sigma^2_2已知时:

\bar{Y}-\bar{X}\sim N(\mu_2-\mu_1,\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n})

枢轴变量:\frac{(\bar{Y}-\bar{X})-(\mu_2-\mu_1)}{\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}}\sim N(0,1)

则:        \mu_2-\mu_1\in (\bar{y}-\bar{x})\pm \sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}u_{\alpha/2}

\sigma_1^2,\sigma^2_2未知时:

枢轴变量: \sqrt{\frac{mn}{m+n}}\frac{(\bar{Y}-\bar{X})-(\mu_2-\mu_1)}{S_T}\sim t_{n+m-2}

其中(n+m-2)S_T^2=(m-1)S_X^2+(n-1)S_Y^2

则:        \mu_2-\mu_1\in\bar{y}-\bar{x}\pm\sqrt{\frac{mn}{m+n}}s_Tt_{m+n-2}(\alpha/2)

两个正态总体方差比的区间估计:

两个独立正态分布总体,分别服从N(\mu_1,\sigma^2_1),N(\mu_2,\sigma^2_2),求\frac{\sigma_1^2}{\sigma_2^2}的区间估计

枢轴变量: \frac{S_X^2}{S_Y^2}\frac{\sigma_2^2}{\sigma_1^2}\sim F_{m-1,n-1}

则:        \sigma_1^2/\sigma_2^2\in [(s_1^2/s^2_2)F_{n-1,m-1}(1-\alpha/2),(s_1^2/s^2_2)F_{n-1,m-1}(\alpha/2)]

15.随机变量函数(一种变换)

分布函数

X\sim f(x),Y=g(x),则随机变量Y的分布函数F_1(y)

F_1(y)=P(Y\leq y)=P(g(X)\leq y)=\int_{g(x)\leq y}f(x)dx

密度函数变换公式

g(x)是严格单调的且反函数h(y)可导,则随机变量Y仍为连续性随机变量,且有概率密度函数f_1(y)

f_1(y)=\left\{\begin{matrix} f(h(y))|h'(y)|,\qquad \alpha<y<\beta,\\ 0,\qquad \mbox{\text{else}} \end{matrix}\right.

其中\alpha=\min\{g(-\infty),g(\infty)\},\beta=\max\{g(-\infty),g(\infty)\}

如果不是严格单调函数,求解思路为:

先求目标转换值的分布函数(难点在积分限,搞出原值的范围),再求导得到它的概率密度函数

例2.26,2.27

看完18后

二元密度函数的变换

其中Z_1=g_1(X,Y),Z_2=g_2(X,Y)为一维随机变量

即有z_1=g_1(x,y),z_2=g_2(x,y),对应的反函数x=\varphi_1(z_1,z_2),y=\varphi_2(z_1,z_2)l

f_Z(z_1,z_2)=f(\varphi_1(z_1,z_2),\varphi_2(z_1,z_2))|\frac{\partial(\varphi_1(z_1,z_2),\varphi_2(z_1,z_2))}{\partial(z_1,z_2)}|

对于常见的Z=X+Y变换,取Z'=X,则雅可比行列式值为1,转换为卷积形式

f_{X+Y}(z)=\int_{-\infty}^{\infty}f_1(x)f_2(z-x)dx=f_1*f_2(z)

例3.20,3.21

最大值和最小值的分布

设X和Y相互独立,求max{X,Y}和min{X,Y}的分布

F_{\max}(z)=F_1(z)F_2(z)\\ F_{\min}(z)=1-(1-F_1(z))(1-F_2(z))

对于密度分布X\sim f_1(x),Y\sim f_2(y)

f_{\max}(z)=f_1(z)F_2(z)+F_1(z)f_2(z)\\ f_{\min}(z)=f_1(z)(1-F_2(z))+(1-F_1(z))f_2(z)

例3.28

读25后

X=(X_1,X_2,\dots,X_n)为来自总体X\sim U(0,\theta)的简单样本,统计量的抽样分布:

T(X)=X_{(n)}

由上文知识可知:F_T(t)=(F(t))^n,可知T的分布函数:

F_T(t)=\frac{t^n}{\theta^n}I_{(0,\theta)}(t)

概率密度函数:

f_T(t)=\frac{nt^{n-1}}{\theta^n}I_{(0,\theta)}(t)

读31后

X=(X_1,X_2,\dots,X_n)为来自总体X\sim U(0,\theta)的简单样本,证明\theta的最大似然估计\hat{\theta_L}=X_{(n)}不是\theta的无偏估计。

E(\hat{\theta}_L)=E(X_{(n)})=\int_{0}^{\theta}\frac{nx^n}{\theta^n}dx=\frac{n}{n+1}\theta

则做个修正:

\frac{n+1}{n}X_{(n)}\theta的无偏估计

读19后

X有分布函数F_X(x),变换Y=g(X)

分别为离散型和连续型的情况

E(Y)=\left\{\begin{matrix} \sum g(x)P(X=x)\\ \int_{\mathbb{R}^n}g(x)f_X(x)dx \end{matrix}\right.

16.多维随机变量

对于试验结果需要两个及以上随机变量来描述。

\textbf{X}(\omega)=(X_1(\omega),X_2(\omega),\dots,X_n(\omega))

称为n维随机变量,简记为\textbf{X}

联合分布函数

设(X,Y)为二维随机变量,称二元函数

F(x,y)=P(X\leq x,Y\leq y)=P(\{X\leq x\}\bigcap \{Y\leq y\})

为(X,Y)的分布函数(联合分布函数)

ps:类似于落在矩形域上

二维连续型随机变量

F(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)dudv

若f(x,y)在该点连续,则

\frac{\partial^2F(x,y)}{\partial x\partial y}|_{x_0,y_0}=f(x_0,y_0)

二元正态分布

f(x,y)=\frac{1}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\{-\frac{1}{2(1-\rho^2)}[\frac{(x-a)^2}{\sigma_1^2}-2\rho\frac{(x-a)(y-b)}{\sigma_1\sigma_2}+\frac{(y-b)^2}{\sigma_2^2}]\}

其中-\infty<a,b<\infty,0<\sigma_1,\sigma_2<\infty,-1<\rho<1

记为N(a,b,\sigma_1^2,\sigma_2^2,\rho)

分布

Y|x\sim N(\mu_2+\rho \sigma_2\sigma_1^{-1}(x_1-\mu_1),(1-\rho^2)\sigma_2^2)

读22后

Cov(X,Y)=\rho \sigma_1\sigma_2

\rho_{X,Y}=\rho

17.边际分布

设(X,Y)的联合分布函数为F(x,y),则其分量X和Y的分布函数F_1(x)F_2(y)称为F的边缘分布

F_1(x)=P(X\leq x)=P(X\leq x,Y<\infty)\\ =\lim_{y\rightarrow \infty}F(x,y)\equiv F(x,\infty)

因为相关性的存在,边缘分布律不能决定联合分布律。

F_1(x)=F(x,\infty)=\int_{-\infty}^{x}\int_{-\infty}^{\infty}f(u,y)dudy\\ F_2(y)=F(\infty,y)=\int_{-\infty}^{\infty}\int_{-\infty}^{y}f(u,y)dudy

求个导:

f_1(x)=\int_{\mathbb{R}}f(x,y)dy\\ f_2(y)=\int_{\mathbb{R}}f(x,y)dx

边际概率密度函数

例3.9

18.条件分布

f_2(y)>0,那么称

f_{X|Y}(x|y)=\frac{f(x,y)}{f_2(y)}

为给定Y=y下随机变量X的条件概率密度函数

可得出连续性随机变量的贝叶斯公式的密度函数形式:

f_{Y|X}(y|x)=\frac{f(x,y)}{f_1(x)}=\frac{f_{X|Y}(x|y)f_2(y)}{f_1(x)}

例3.12

19.数学期望

离散型:

分布律为P(X=x_k)=p_k,k=0,1,\dots

如果\sum_{k\geq1}|x_k|p_k<\infty(绝对收敛)

那么数学期望E(X)=\sum_{k\geq 1}x_kp_k

例4.2

连续型:

X\sim f(x),如果\int_{\mathbb{R}}|x|f(x)dx<\infty (即E(|X|)<\infty

则数学期望E(X)=\int_{\mathbb{R}}xf(x)dx

性质:

E(X_1+X_2+\dots+X_n)=\sum_{i=1}^{n}E(X_i)

如果随机变量相互独立

 E(X_1X_2)=E(X_1)E(X_2)

变换性质见15

条件数学期望

E(X|Y=y_k)=\left\{\begin{matrix} \sum_{i=1}^{n}x_iP(X=x_i|Y=y_k)\\ \int_{-\infty}^{\infty}xf_{X|Y}(x|y)dx \end{matrix}\right.

E(Y|x)是x的函数(一个值)

E(Y|X)不固定X的值,那么这就是随机变量X的函数。(是随机变量)

条件期望的平滑公式(全期望公式)

E(E(Y|X))=E(h(X))=\int_{-\infty}^{\infty}h(x)f_1(x)dx\\ =\int_{-\infty}^{\infty}f_1(x)dx\int_{-\infty}^{\infty}yf_{Y|X}(y|x)dy\\ =\iint y\frac{f(x,y)}{f_1(x)}f_1(x)dxdy\\ =\int_{-\infty}^{\infty}ydy\int_{-\infty}^{\infty}f(x,y)dx\\ =\int_{-\infty}^{\infty}yf_2(y)dy\\ =E(Y)

例4.12

20.中位数和众数

中位数为m,有

P(X\geq m)=1-F(m-0)\geq \frac{1}{2}\\ P(X\leq m)=F(m)\geq\frac{1}{2}

中位数可能不唯一,但当X的概率密度函数f(x)>0时,中位数唯一,且:

F(m)=\frac{1}{2}                \int_{-\infty}^{m}f(x)dx=\frac{1}{2}

众数m_d,有

X为离散型,概率质量函数最大时对应的随机变量X值

X为连续型,f(x)达到最大时的x值

众数可能不唯一。

唯一的话,称为单峰。

例4.15

p分位数

设0<p<1,Q_p是随机变量X的p分位数,是指

P(X\leq Q_p)\geq p,\qquad P(X\geq Q_p)\geq 1-p

例4.16

21.方差和矩

随机变量X是平方可积的,即E(X^2)<\infty

\sigma^2=Var(X)=E(X-\mu)^2\\ \sigma=\sqrt{Var(X)}

分别为方差和标准差

性质:

Var(X)=E(X^2)-[E(X)]^2

Var(cX)=c^2Var(X),Var(X+c)=Var(X)

Var(\sum_{i=1}^{n}X_i)=\sum_{i=1}^{n}Var(X_i)

即有

Var(\sum_{i=1}^{n}c_iX_i)=Var(\bar{X})=\frac{Var(X)}{n}=\frac{\sigma^2}{n}

Var(X_1-X_2)=Var(X_1)+Var(X_2)

马尔科夫不等式

P(Y\geq \varepsilon )\leq\frac{E(Y)}{\varepsilon}

推论:切比雪夫不等式

P(|X-\mu|\geq \varepsilon)\leq \frac{Var(X)}{\varepsilon^2}

例4.23

E(X-c)^k称为X关于c的k阶矩

\alpha_k=E(X^k)为随机变量的k阶原点矩

\mu_k=E(X-E(X))^k为随机变量的k阶中心矩

其中k为正整数,也要有必要的收敛(k方可积)

E(X)=\alpha_1,Var(X)=\mu_2

计算有关正态分布矩:

\int_{0}^{\infty}x^\alpha e^{-\beta x^2}dx=\frac{\Gamma((\alpha+1)/2)}{2\beta^{(\alpha+1)/2}}

矩母函数

M_X(s)=E(e^{sX})

可以生成中心矩

E(X^k)=\frac{\mathrm{d} ^k}{\mathrm{d} s^k}M_X(s)|_{s=0}

22.协方差

设X和Y平方可积,则有协方差

Cov(X,Y)=E[(X-E(X))(Y-E(Y))]

此时即有:

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

性质:

Cov(X,Y)=Cov(Y,X)

Cov(X,Y)=E(XY)-E(X)E(Y)

Cov(aX+b,cY+d)=ac\mbox{ } Cov(X,Y)

Cov(aX+bY,cX+dY)=acVar(X)+(ad+bc)Cov(X,Y)+bdVar(Y)

若X,Y相互独立,则Cov(X,Y)=0

[Cov(X,Y)]^2\leq Var(X)Var(Y)

相关系数

\rho_{X,Y}=Cov(\frac{X-E(X)}{\sqrt{Var(X)}},\frac{Y-E(Y)}{\sqrt{Var(Y)}})=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}

相关系数不能反映随机变量之间具有某种函数关系,只是刻画线性相关程度

例4.48

23.熵

设X为离散型随机变量,分布律:

P(X=x_k)=p_k

H(X)=-\sum_{k=1}^{\infty}p_k\log_2(p_k)

若X为连续型随机变量,概率密度函数f_X(x)

H(x)=-\int_{-\infty}^{\infty}f_X(x)\ln f_X(x)dx

性质:对于常数c

H(X+c)=H(X)

给定期望\mu和方差\sigma^2,具有最大熵的连续型随机变量是正态分布

给定期望\lambda,具有最大熵的取值于(0,\infty)的连续型随机变量是指数分布

24.大数定理和中心极限定理

依概率收敛

X_1,X_2,\dots,X_n,\dots是一串随机变量序列,X为随机变量,如果对\forall \varepsilon>0,有

\lim_{n\rightarrow \infty}P(|X_n-X|\geq \varepsilon)=0

则称随机变量序列\{X_n\}依概率收敛于随机变量X,记为

X_n\xrightarrow[]{P}X

依分布收敛

X_1,X_2,\dots,X_n,\dots是一串随机变量序列,X为随机变量,

\lim_{n\rightarrow \infty}F_n(x)=F(x)

则称\{F_n\}弱收敛于F,也称随机变量序列\{X_n\}依分布收敛于随机变量X,记为

X_n\xrightarrow[]{L}X

两者关系:

依概率收敛能推出依分布收敛;

而依分布收敛只有收敛于常数c,才能推出依概率收敛于c

大数定律

X_1,X_2,\dots,X_n,\dots是一串随机变量序列,他们有相同期望和方差

\lim_{n\rightarrow \infty}P(|\frac{S_n}{n}-\mu|\geq \varepsilon)=0

伯努利大数定律:

\{X_k\}是0-1分布,P(X_k=1)=p

\frac{1}{n}\sum_{k=1}^{n}X_k\xrightarrow[]{P}p

林德伯格——莱维中心极限定理

X_1,X_2,\dots,X_n,\dots是一串随机变量序列,他们有相同期望和方差

\lim_{n\rightarrow \infty}P(\frac{\sqrt n(S_n/n-\mu)}{\sigma}\leq x)=\Phi(x)

亦可写为:

\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}\xrightarrow{L}N(0,1)

其中均值\bar{X}=\frac{S_n}{n}

也是说部分和标准化后的分布函数近似于标准正态分布函数

\lim_{n\rightarrow \infty}P(\frac{(S_n-E(S_n))}{\sqrt {Var(S_n)}}\leq x)=\Phi(x)

例4.42

棣莫弗——拉普拉斯中心极限定理

X_1,X_2,\dots,X_n,\dots是一串随机变量序列,0<p<1,且X_i\sim B(1,p),则对于任意实数x

\lim_{n\rightarrow \infty}P(\frac{S_n-np}{\sqrt{np(1-p)}}\leq x)=\Phi(x)

np较小时,可以用泊松分布逼近二项分布

np较大时,可以用正态分布逼近二项分布

例4.40

25.统计量

完全由样本决定的量称为统计量

样本均值:

\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i

样本方差:

S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2

样本矩:

        样本k阶原点矩:

                \alpha_k=\frac{1}{n}\sum_{i=1}^{n}X_i^k,k=1,2,\dots

        样本k阶中心矩:

                m_k=\frac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X})^k,k=2,3,\dots

样本相关系数:

\rho_n=\frac{\sum_{i=1}^{n}(X_i-\bar{X})(Y_i-\bar{Y})}{\sqrt{\sum_{i=1}^{n}(X_i-\bar{X})^2}\sqrt{\sum_{i=1}^{n}(Y_i-\bar{Y})^2}}

次序统计量:

X_{(1)}\leq X_{(2)}\leq \dots \leq X_{(n)}

        样本中位数:

                m_n=\left\{\begin{matrix} X_{(\frac{n+1}{2})} \qquad \qquad \quad n=odd\\ \frac{1}{2}[X_{(\frac{n}{2})}+X_{(\frac{n}{2}+1)}] \qquad n=even \end{matrix}\right.

        极值:

                X_{(1)},X_{(n)}分别为样本的极小值和极大值,他们之差为极差(大减小)

抽样分布:

(X_1,X_2,\dots,X_n)为一个样本,统计量T=T(X_1,X_2,\dots,X_n)的分布称为抽样分布。

抽样分布不同于样本分布!

例子可见7,15

26.χ²分布

设样本(X_1,X_2,\dots,X_n)为来自标准正态总体的一个简单随机样本,称:

X=X_1^2+X_2^2+\dots+X_n^2

服从自由度为n的\chi^2分布,记为:X\sim \chi^2_n

概率密度函数:

k_n(x)=\frac{1}{\Gamma(n/2)2^{n/2}}\mbox{ }e^{-x/2}\mbox{ }x^{(n-2)/2}\mbox{ }I_{(0,\infty)}(x)

性质:

X\sim \chi^2_n,则容易算得E(X)=n,Var(X)=2n

X\sim \chi^2_mY\sim \chi^2_n,且X,Y独立,则Z=X+Y\sim \chi^2_{m+n}

结论:

X_1,X_2,\dots,X_n \sim N(\mu,\sigma^2)S^2为样本方差

\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}

X_1,X_2,\dots,X_m\sim Exp(\lambda),服从f(x,\lambda)=\lambda e^{-\lambda x}I_{(0,\infty)}(x),则:

2\lambda n \bar{X}=2\lambda\sum_{i=1}^{n}X_i\sim \chi^2_{2n}

卡方分布图形特征如下:

该函数n=1,2时曲线单调下降趋于0,当n≥3时有单峰

分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着自由度增大,分布趋近于正态分布。

27.t分布

X\sim N(0,1),Y\sim \chi^2_n,且X,Y相互独立,称

T=\frac{X}{\sqrt{Y/n}}

服从自由度为n的t分布,记为T\sim t_n

概率密度函数:

f_n(t)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\mbox{ }\Gamma(n/2)}(1+\frac{t^2}{n})^{-(n+1)/2},t\in \mathbb{R}

n=1时,为柯西分布,此时f_1(t)=\frac{1}{\pi (1+t^2)}

性质:

T\sim t_n,则当n≥2时,由对称性可得E(T)=0;当n≥3时,Var(T)=\frac{n}{n-2}

n\rightarrow \infty时,t_n分布的概率密度函数趋于标准正态分布概率密度函数

\lim_{n\rightarrow \infty}f_n(t)=\varphi(t)

结论:

X_1,X_2,\dots,X_n \sim N(\mu,\sigma^2)S为样本标准差

\frac{\sqrt{n}(\bar{X}-\mu)}{S}\sim t_{n-1}

X_1,X_2,\dots,X_m\sim N(\mu_1,\sigma_1^2),Y_1,Y_2,\dots,Y_n\sim N(\mu_2,\sigma^2_2),且两组样本相互独立,则:

T=\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{S_T}\sqrt{\frac{mn}{m+n}}\sim t_{n+m-2}

其中(n+m-2)S_T^2=(m-1)S_X^2+(n-1)S_Y^2

S_X为X样本组的样本方差

用于比较两组样本

t分布图形特性:

t分布的图形特征主要包括以下几个方面

  1. 单峰分布‌:t分布是一个单峰分布,以0为中心,左右对称。
  2. 尾部较厚‌:与标准正态分布相比,t分布的尾部较厚,这意味着它对极端值(异常值)更敏感。
  3. 自由度的影响‌:t分布的图形与自由度(df)有关。自由度越小,t分布的峰部越矮,尾部越高;随着自由度的增加,t分布逐渐接近标准正态分布;当自由度趋于无穷大时,t分布趋近于标准正态分布。

28.F分布

X\sim \chi_m^2,Y\sim \chi^2_n,且X,Y相互独立,称

F=\frac{X/m}{Y/n}

为服从自由度为m,n的F分布,记为F\sim F_{m,n}

概率密度函数:

f_{m,n}(x)=m^{m/2}n^{n/2}\frac{\Gamma((m+n)/2)}{\Gamma(m/2)\Gamma(n/2)}x^{m/2-1}(mx+n)^{-(m+n)/2}I_{(0,\infty)}(x)

性质:

(1)若Z\sim F_{m,n},则1/Z\sim F_{n,m}

(2)若T\sim t_n,则T^2\sim F_{1,n}

(3)F_{m,n}(1-\alpha)=1/F_{n,m}(\alpha)

结论:

X_1,X_2,\dots,X_m\sim N(\mu_1,\sigma_1^2),Y_1,Y_2,\dots,Y_n\sim N(\mu_2,\sigma^2_2),且两组样本相互独立,则:

F=\frac{S_X^2}{S_Y^2}\frac{\sigma_2^2}{\sigma_1^2}\sim F_{m-1,n-1}

用于比较两组样本方差

F分布图形特性:

1. 非负性: F分布的取值范围是非负的,即 F ≥ 0。这是因为卡方变量本身是非负的,并且自由度也都是正数。

2. 偏态性: F分布是右偏的,其偏度取决于它的自由度。当分子自由度d1较小,分母自由度d2较大时,偏度较大;反之,当分子自由度d1较大,分母自由度d2较小时,偏度较小。随着自由度的增大,F分布逐渐趋近于对称分布。

3. 单峰性: F分布具有单峰性,即只有一个峰值。峰值的位置取决于它的自由度。

4.其中一个自由度v2趋近无穷时,F分布趋近于v1的卡方分布。

29.矩估计

离散型略

连续型:

\alpha_i=E(X^j)=\int_{-\infty}^{\infty}x^jf(x;\theta_1,\theta_2,\dots,\theta_k)dx\\ \mu_i=E(X-\alpha_1)^j=\int_{-\infty}^{\infty}(x-\alpha_1)^jf(x;\theta_1,\theta_2,\dots,\theta_k)dx

由大数定律,样本矩依概率收敛到总体矩。

应用中会做一点修正,尽量用低阶矩

样本矩是总体矩的渐近无偏估计

\lim_{n\rightarrow \infty} E(\hat{\theta}(X_1,X_2,\dots,X_n))=\theta

30.最大似然估计

样本X有联合概率密度分布:

f(x;\theta)=f(x;\theta_1,\theta_2,\dots,\theta_k)

固定x时,看做与参数\theta有关的函数,称为似然函数L(\theta;x),L(\theta)

估计在哪些\theta之下,似然函数能取最大。

把 x 拆成多个 x_i ,形成积形式的联合概率密度函数。

L=\prod_{i=1}^{k}f(x_i;\theta_1,\theta_2,\dots,\theta_n)

对数似然函数

\textit{l}(\theta)=\ln L(\theta)

再求驻点

\frac{\partial \textit{l}}{\partial \theta_i}=0,i=1,2,\dots,k

若似然函数的严格单调的,则最大值在边界取到。

31.优良性准则

若对任何可能的(\theta_1,\theta_2,\dots,\theta_k)

E_{\theta_1,\theta_2,\dots,\theta_k}(\hat{g}(X_1,X_2,\dots,X_n))=g(\theta_1,\theta_2,\dots,\theta_k)

则 \hat{g} 是 g(\theta_1,\theta_2,\dots,\theta_k) 的一个无偏估计量

证明样本方差S^2\sigma^2的无偏估计

Var(\bar{X})=\frac{Var(X)}{n}

S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_k-\bar{X})^2

\sum_{i=1}^{n}(X_k-\bar{X})^2=\sum_{i=1}^{n}(X_k-\mu+\mu-\bar{X})^2\\ =\sum_{i=1}^{n}(X_k-\mu)^2+\sum_{i=1}^{n}(\bar{X}-\mu)^2-2\sum_{i=1}^{n}(X_k-\mu)(\bar{X}-\mu)\\ =\sum_{i=1}^{n}(X_k-\mu)^2+n(\bar{X}-\mu)^2-2(\bar{X}-\mu)\sum_{i=1}^{n}(X_k-\mu)

E(\sum_{i=1}^{n}(X_i-\bar{X})^2)\\ =E(\sum_{i=1}^{n}(X_i-\mu)^2)+nE(\bar{X}-\mu)^2-2E((\sum_{i=1}^{n}(X_i-\mu))(\bar{X}-\mu))\\ =nE(X-\mu)^2+nE(\bar{X}-\mu)^2-2E(n(\frac{\sum_{i=1}^{n}X_i}{n}-\mu)(\bar{X}-\mu))\\=nE(X-\mu)^2+nE(\bar{X}-\mu)^2-2nE(\bar{X}-\mu)^2\\ =nE(X-\mu)^2+n\frac{E(X-\mu)^2}{n}-2n\frac{E(X-\mu)^2}{n}\\ =n\sigma^2+n\frac{\sigma^2}{n}-2n\frac{\sigma^2}{n} =(n-1)\sigma^2

而样本标准差 S 不是样本总体标准差 \sigma 的无偏估计:

S需要乘上一个修正系数。

c_n=\sqrt{\frac{n-1}{2}}\frac{\Gamma((n-1)/2)}{\Gamma(n/2)}

有效性:

\hat{\theta_1},\hat{\theta_2}都是总体参数\theta的无偏估计,方差存在,若:

Var_\theta(\hat{\theta_1})\leq Var_\theta(\hat{\theta_2}),\forall \theta \in \Theta

至少存在一个\theta,使得上式不等号成立,则称 \hat{\theta_1} 比 \hat{\theta_2} 更有效

算术平均比加权平均更有效

大多数情况,最大似然估计比矩估计更有效,但是矩估计显然更容易得到。

例6.21

克拉默——拉奥方差下界(最小方差无偏估计,MVUE)

Var_\theta(\hat{g}(X))\geq (g'(\theta))^2[nI(\theta)]^{-1}

其中I(\theta)=E(\frac{\partial\ln f(X;\theta)}{\partial \theta})^2为费舍尔信息函数

例6.22,23,25

相合性

样本量 n\rightarrow \infty

\hat{\theta}(X_1,X_2,\dots,X_n)\overset{P}{\rightarrow} \theta

则称\hat{\theta}(X_1,X_2,\dots,X_n)\theta的相合估计量。

例6.26,27

渐近正态性

Var(\hat{\theta}(X_1,X_2,\dots,X_n))=\sigma^2_n(\theta)

若当样本量 n\rightarrow \infty时有

\lim_{n\rightarrow \infty}P(\frac{\hat{\theta}(X_1,X_2,\dots,X_n)-\theta}{\sigma_n(\theta)}\leq x)=\Phi(x)

则称估计量\hat{\theta}(X_1,X_2,\dots,X_n)有渐近正态性

一般情况下,矩估计和最大似然估计都有渐近正态性

\sqrt{n}(\bar{X}_n-\mu)/ \sigma \xrightarrow{L}N(0,1)

\sqrt{n}(\bar{X}_n-\mu)/ S_n \xrightarrow{L}N(0,1)

\bar{X_n},S_n^2都分别是\mu,\sigma^2的相合估计

32.置信区间和置信系数

(X_1,X_2,\dots,X_n)是从总体中抽取出的一个简单随机样本,两个统计量满足

\hat{\theta_1}(X_1,X_2,\dots,X_n)<\hat{\theta_2}(X_1,X_2,\dots,X_n)

则给定一个小正数\alpha\in (0,1),若

P_\theta(\hat{\theta_1}(X_1,X_2,\dots,X_n)\leq\theta \leq \hat{\theta_2}(X_1,X_2,\dots,X_n))=1-\alpha,\forall \theta\in \Theta

称作参数\theta置信区间[\hat{\theta_1},\hat{\theta_2}]置信系数1-\alpha

\alpha越小(置信系数越高),置信区间越大(精度越低)

33.枢轴变量法

设感兴趣的参数为\theta

(1)找一个\theta的良好点估计T(X),一般为最大似然估计

(2)构造一个函数S(T,U,\theta)为枢轴变量,其中U=U(X)为统计量,使得他的分布F已知。

一般为正态分布,χ²分布,t分布,F分布

(3)a\leq S(T,U,\theta)\leq b

要能改写为:A\leq \theta \leq B

(4)取分布F\alpha/2位数 w_{\alpha/2} 和上1-\alpha/2位数 w_{1-\alpha/2}

P(w_{1-\alpha/2}\leq S(T,U,\theta)\leq w_{\alpha/2})=1-\alpha

(5)则置信系数为1-\alpha的置信区间为[A,B]

34.大样本方法

利用中心极限定理,来建立合适的枢轴变量S(T(X),U(X),\theta)

设事件A在每次试验中发生的概率为p,作n次独立试验,以Y_n记事件A发生的次数,求p的1-\alpha置信区间。当n充分大时,由中心极限定理,得一个枢轴变量:

\frac{Y_n-np}{\sqrt{np(1-p)}}\sim N(0,1)

即可得:

-u_{\alpha/2}\leq \frac{y_n-np}{\sqrt{np(1-p)}}\leq u_{\alpha/2}

解二次方程可得p的区间,称为得分区间。

p\in\frac{\hat{p}+\frac{u_{\alpha/2}^2}{2n}}{1+\frac{u_{\alpha/2}^2}{n}}\pm u_{\alpha/2}\frac{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}+\frac{u_{\alpha/2}^2}{4n^2}}}{1+\frac{u_{\alpha/2}^2}{n}}

其中右侧的\hat{p}=y_n/n

当n很大时,上式可简化为:

p\in\hat{p}\pm u_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

如果要求区间宽度为w(即误差界限为w/2)

可取        n=\frac{4u_{\alpha/2}^2\hat{p}(1-\hat{p})}{w^2}

例7.8

一般总体均值\mu的置信区间

\mu\in \bar{x}\pm \frac{s}{\sqrt{n}}u_{\alpha/2}

可见14的后面

35.假设检验概念

对样本所做出的统计假设进行检查的方法和过程称为假设检验

一般我们 认为正确 的命题称为原假设H_0

“对立假设”为备择假设H_1

两点假设:

H_0:\theta=\theta_0\leftrightarrow H_1:\theta=\theta_1

双侧假设:

H_0:\theta=\theta_0\leftrightarrow H_1:\theta\neq \theta_0

单侧假设:

H_0:\theta=\theta_0\leftrightarrow H_1:\theta>\theta_0

H_0:\theta=\theta_0\leftrightarrow H_1:\theta<\theta_0

接受域A,拒绝域D

\theta在A中则接收原假设(有一个可接受的范围),在D中则拒绝原假设

中间有临界值C

当然有范围就要有接受的程度,接受范围越小,精度越高,“更难接受”,概念见下:

功效函数:

设总体为F(x,\theta)\Psi是根据样本对假设所做的一个检验

\beta_{\Psi}(\theta)=P_{\theta}(在检验\PsiH_0被否定)

为检验的功效函数

检验水平:

\beta_{\Psi}(\theta)\leq \alpha,\forall \theta \in H_0

要让被拒绝的概率尽可能小,确保决策贴近事实,容错最大概率为\alpha

此时检验\Psi的水平为\alpha

决策事实
H_0成立H_1成立
不拒绝H_0正确第二类错误
拒绝H_0第一类错误正确

犯第一类错误的概率:

\alpha_{1\Psi}(\theta)=\left\{\begin{matrix} \beta_{\Psi}(\theta),\qquad \theta\in H_0\\ 0,\qquad\qquad\theta\in H_1 \end{matrix}\right.

犯第二类错误的概率:

\alpha_{2\Psi}(\theta)=\left\{\begin{matrix}0,\qquad \qquad\quad\theta\in H_0\\ 1- \beta_{\Psi}(\theta),\quad\theta\in H_1 \end{matrix}\right.

要减少犯第一类错误的概率,必然会增加犯第二类错误的概率。

如果仅考虑控制第一类错误的概率,而不涉及犯第二类错误概率所得到的检验,称为显著性检验

检验方法:

(1)求出未知参数\theta的一个较优的点估计\hat{\theta}=\hat{\theta}(X_1,X_2,\dots,X_n),如最大似然估计

(2)寻找一个检验统计量T=T(\hat{\theta},\theta_0)

使得\theta=\theta_0时,T的分布已知(如N(0,1),t_{n-1},F_{m-1,n-1}

从而查表得到这个分布的分位数,作为检验的临界值。

(3)根据备择假设实际意义来寻找合适的拒绝域。

(4)根据给出的样本值,计算检验统计量,若落在拒绝域中,则可拒绝原假设,反之不能拒绝(显著性检验下就是接受)

36.正态总体参数检验

真的和之前枢轴变量挺像的,感觉就是前一个是正向思维,这个是反证思维

直接放图,枢轴变量就是对应我们的检验统计量

比例p的检验见7

37.拟合优度检验

Z=\sum \frac{(O-E)^2}{E}=\sum_{i=1}^{k}\frac{(np_i-n_i)^2}{np_i}=(\sum_{i=1}^{k}\frac{n_i^2}{np_i})-n

皮尔逊χ²检验

如果原假设H_0成立,那么当样本量趋于无穷时,Z的分布趋于自由度为k-1的χ²分布,即\chi^2_{k-1}

例9.1

列联表检验

见例9.8

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2274673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

el-table自定义按钮控制扩展expand

需求&#xff1a;自定义按钮实现表格扩展内容的展开和收起&#xff0c;实现如下&#xff1a; 将type“expand”的表格列的宽度设置为width"1"&#xff0c;让该操作列不展示出来&#xff0c;然后通过ref动态调用组件的内部方法toggleRowExpansion(row, row.expanded)控…

大语言模型训练的数据集从哪里来?

继续上篇文章的内容说说大语言模型预训练的数据集从哪里来以及为什么互联网上的数据已经被耗尽这个说法并不专业&#xff0c;再谈谈大语言模型预训练数据集的优化思路。 1. GPT2使用的数据集是WebText&#xff0c;该数据集大概40GB&#xff0c;由OpenAI创建&#xff0c;主要内…

【C++习题】22.随机链表的复制

文章目录 题目&#xff1a;138. 随机链表的复制 - 力扣&#xff08;LeetCode&#xff09;代码&#xff1a; 题目&#xff1a;138. 随机链表的复制 - 力扣&#xff08;LeetCode&#xff09; 链接&#x1f517;&#xff1a;138. 随机链表的复制 - 力扣&#xff08;LeetCode&…

C# 或 .NetCore 如何使用 NPOI 导出图片到 Excel 文件

今天在本文中&#xff0c;我们将尝试使用NPOI库将图像插入到 Excel 文件的特定位置。请将以下逻辑添加到您的写作方法中&#xff0c;在 Excel 文件中添加图像&#xff08;JPEG、PNG&#xff09;,我已经有一个示例 jpeg 文件 - Read-write-excel-npoi.jpg &#xff0c;我们将尝试…

Photon最新版本PUN 2.29 PREE,在无网的局域网下,无法连接自己搭建的本地服务器

1.图1为官方解答 2.就是加上这一段段代码&#xff1a;PhotonNetwork.NetworkingClient.SerializationProtocol SerializationProtocol.GpBinaryV16; 完美解决 unity 商店最新PUN 2 插件 不能连接 &#xff08;环境为&#xff1a;本地局域网 无外网情况 &#xff09; …

Python 爬虫验证码识别

在我们进行爬虫的过程中&#xff0c;经常会碰到有些网站会时不时弹出来验证码识别。我们该如何解决呢&#xff1f;这里分享 2 种我尝试过的方法。 0.验证码示例 1.OpenCV pytesseract 使用 Python 中的 OpenCV 库进行图像预处理&#xff08;边缘保留滤波、灰度化、二值化、…

【Rust自学】10.7. 生命周期 Pt.3:输入输出生命周期与3规则

喜欢的话别忘了点赞、收藏加关注哦&#xff0c;对接下来的教程有兴趣的可以关注专栏。谢谢喵&#xff01;(&#xff65;ω&#xff65;) 10.7.1. 深入理解生命周期 1.指定生命周期参数的方式依赖于函数所做的事情 以上一篇文章的代码为例子&#xff1a; fn longest<a&g…

创建并配置华为云虚拟私有云

目录 私有云 创建虚拟私有云 私有云 私有云是一种云计算模式&#xff0c;它将云服务部署在企业或组织内部的私有基础设施上&#xff0c;仅供该企业或组织内部使用&#xff0c;不对外提供服务.私有云的主要特点包括&#xff1a; 私密性&#xff1a;私有云的资源&#xff08;如…

子父组件传值

Angular 2 及以上版本中的父子组件通信方式 在 Angular 2 及以上版本中&#xff0c;父子组件通信主要通过以下几种方式实现&#xff1a; 一、使用Input()进行父向子通信 父组件通过属性绑定的方式将数据传递给子组件&#xff0c;子组件使用Input()装饰器来接收这些数据。 二…

wireshark排除私接小路由

1.wireshark打开&#xff0c;发现了可疑地址&#xff0c;合法的地址段DHCP是192.168.100.0段的&#xff0c;打开后查看发现可疑地址段&#xff0c;分别是&#xff0c;192.168.0.1 192.168.1.174 192.168.1.1。查找到它对应的MAC地址。 ip.src192.168.1.1 2.通过show fdb p…

机器学习实战——决策树:从原理到应用的深度解析

✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连✨ ​​​ ​​​ ​​ 决策树&#xff08;Decision Tree&#xff09;是一种简单而直观的分类与回归模型&#xff0c;在机器学习中广泛应用。它的…

2025年01月09日Github流行趋势

1. 项目名称&#xff1a;khoj 项目地址url&#xff1a;https://github.com/khoj-ai/khoj项目语言&#xff1a;Python历史star数&#xff1a;22750今日star数&#xff1a;1272项目维护者&#xff1a;debanjum, sabaimran, MythicalCow, aam-at, eltociear项目简介&#xff1a;你…

用python实现烟花代码,完整代码拿走不谢

有时候用python实现一些有趣的代码&#xff0c;既有趣&#xff0c;又能提升知识 使用Python实现动态烟花代码 效果如下&#xff1a; 不废话&#xff0c;直接上代码&#xff1a; import pygame from random import randint, uniform, choice import mathvector pygame.math…

Python机器学习笔记(十八、交互特征与多项式特征)

添加原始数据的交互特征&#xff08;interaction feature&#xff09;和多项式特征&#xff08;polynomial feature&#xff09;可以丰富特征表示&#xff0c;特别是对于线性模型。这种特征工程可以用统计建模和许多实际的机器学习应用中。 上一次学习&#xff1a;线性模型对w…

数据结构——栈的实现

今天&#xff0c;我们来写一下关于栈的博文。 1.首先我们先了解一下什么是栈&#xff1f; 一&#xff1a;概念&#xff1a; 栈&#xff1a;一种特殊的线性表&#xff0c;其只允许在固定的一端进行插入和删除元素操作。 进行数据插入和删除操作的一端称为栈顶&#xff0c;另…

电脑提示directx错误导致玩不了游戏怎么办?dx出错的解决方法

想必大家都有过这样的崩溃瞬间&#xff1a;满心欢喜打开心仪的游戏&#xff0c;准备在虚拟世界里大杀四方或者畅游冒险&#xff0c;结果屏幕上突然弹出个 DirectX 错误的提示框&#xff0c;紧接着游戏闪退&#xff0c;一切美好戛然而止。DirectX 作为 Windows 系统下游戏运行的…

python学opencv|读取图像(二十九)使用cv2.getRotationMatrix2D()函数旋转缩放图像

【1】引言 前序已经学习了如何平移图像&#xff0c;相关文章链接为&#xff1a; python学opencv|读取图像&#xff08;二十七&#xff09;使用cv2.warpAffine&#xff08;&#xff09;函数平移图像-CSDN博客 在此基础上&#xff0c;我们尝试旋转图像的同时缩放图像。 【2】…

MySQL表的增删查改(下)——Update(更新),Delete(删除)

文章目录 Update将孙悟空同学的数学成绩修改为80分将曹孟德同学的数学成绩变更为 60 分&#xff0c;语文成绩变更为 70 分将总成绩倒数前三的 3 位同学的数学成绩加上 30 分将所有同学的语文成绩更新为原来的 2 倍 Delete删除数据删除孙悟空同学的考试成绩删除整张表数据 截断表…

Virgo:增强慢思考推理能力的多模态大语言模型

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

聚类系列 (二)——HDBSCAN算法详解

在进行组会汇报的时候&#xff0c;为了引出本研究动机&#xff08;论文尚未发表&#xff0c;暂不介绍&#xff09;&#xff0c;需要对DBSCAN、OPTICS、和HDBSCAN算法等进行详细介绍。在查询相关资料的时候&#xff0c;发现网络上对于DBSCAN算法的介绍非常多与细致&#xff0c;但…