机器学习笔记之狄利克雷过程(六)预测任务求解

news2024/11/24 12:28:19

机器学习笔记之狄利克雷过程——预测任务求解

  • 引言
    • 回顾:基于狄利克雷过程的预测过程
    • 预测任务的求解过程

引言

上一节引出了基于狄利克雷过程的预测任务,本节将对该预测任务进行求解。

回顾:基于狄利克雷过程的预测过程

在已知隐变量样本集合 θ = { θ ( i ) } i = 1 N \theta = \{\theta^{(i)}\}_{i=1}^N θ={θ(i)}i=1N的条件下,关于一个陌生样本 θ ^ \hat {\theta} θ^后验概率分布 P ( θ ^ ∣ θ ) \mathcal P(\hat \theta \mid \theta) P(θ^θ)可表示为:
P ( θ ^ ∣ θ ) = ∑ G P ( θ ^ ∣ G ) ⋅ P ( G ∣ θ ) \mathcal P(\hat \theta \mid \theta) = \sum_{\mathcal G} \mathcal P(\hat \theta \mid \mathcal G) \cdot \mathcal P(\mathcal G \mid \theta) P(θ^θ)=GP(θ^G)P(Gθ)
其中 P ( G ∣ θ ) \mathcal P(\mathcal G \mid \theta) P(Gθ)是指随机测度 G \mathcal G G后验概率分布;而 P ( θ ^ ∣ G ) \mathcal P(\hat \theta \mid \mathcal G) P(θ^G)表示关于陌生隐变量样本的预测分布

这个预测分布最终会得到一个 θ \theta θ具体数值的概率分布。但实际上,我们对预测出的 θ \theta θ数值并不关心,我们更关心的是哪些 θ ( i ) \theta^{(i)} θ(i)样本,它们的 θ \theta θ数值相等
因为一旦 θ ( i ) = θ ( j ) ( i ≠ j ; θ ( i ) , θ ( j ) ∈ θ ) \theta^{(i)} = \theta^{(j)}(i \neq j;\theta^{(i)},\theta^{(j)} \in \theta) θ(i)=θ(j)(i=j;θ(i),θ(j)θ)这就意味着对应的 θ ( i ) ⇒ x ( i ) , θ ( j ) ⇒ x ( j ) \theta^{(i)}\Rightarrow x^{(i)},\theta^{(j)} \Rightarrow x^{(j)} θ(i)x(i),θ(j)x(j)属于同一类别。但 θ ( i ) = θ ( j ) = ? \theta^{(i)} = \theta^{(j)} = ? θ(i)=θ(j)=?这个值我们并不关心。

假设每个真实样本均隐含地存在一个聚类标签 Z = { z ( i ) } i = 1 N \mathcal Z = \{z^{(i)}\}_{i=1}^N Z={z(i)}i=1N,那么最终的将预测过程转化为: P ( z ^ ∣ Z ) \mathcal P(\hat z \mid \mathcal Z) P(z^Z)
关于真实样本 x ^ \hat x x^最终被划分到了哪个具体类别——才是真正关心的信息,而 Z \mathcal Z Z则表示数据集合中样本点对应的标签结果。

预测任务的求解过程

关于预测任务的转化结果表达如下:
P ( z ^ = m ∣ Z ) Z = { z ( 1 ) , z ( 2 ) , ⋯   , z ( N ) } \mathcal P(\hat z = m \mid \mathcal Z) \quad \mathcal Z = \{z^{(1)},z^{(2)},\cdots,z^{(N)}\} P(z^=mZ)Z={z(1),z(2),,z(N)}
其中 z ^ \hat z z^是对应陌生样本隐含标签;而 m m m则表示这个离散标签可选择的某个结果。首先,通过贝叶斯定理,可以将上式表示为如下形式:
P ( z ^ = m ∣ Z ) = P ( z ^ = m , Z ) P ( Z ) \mathcal P(\hat z = m \mid \mathcal Z) = \frac{\mathcal P(\hat z = m,\mathcal Z)}{\mathcal P(\mathcal Z)} P(z^=mZ)=P(Z)P(z^=m,Z)

其次将狄利克雷过程引入进来。但由于狄利克雷过程中可能包含无穷多个随机变量 θ 1 , θ 2 , ⋯   , θ ∞ \theta_1,\theta_2,\cdots,\theta_{\infty} θ1,θ2,,θ(它的随机变量数量由 α \alpha α决定)。关于对狄利克雷过程中随机变量的积分是复杂的。这里退而求其次,首先引入一个狄利克雷分布
P ( G ) = DP ( α , H ) = P [ G ( a 1 ) , G ( a 2 ) , ⋯   , G ( a D ) ] \mathcal P(\mathcal G) = \text{DP}(\alpha,\mathcal H)= \mathcal P[\mathcal G(a_1),\mathcal G(a_2),\cdots,\mathcal G(a_{\mathcal D})] P(G)=DP(α,H)=P[G(a1),G(a2),,G(aD)]
上式 P ( G ) \mathcal P(\mathcal G) P(G)明显是随机测度 G \mathcal G G的先验分布,而随机测度 G \mathcal G G就是通过狄利克雷过程 DP ( α , H ) \text{DP}(\alpha,\mathcal H) DP(α,H)生成的,因而 P ( G ) = DP ( α , H ) \mathcal P(\mathcal G) = \text{DP}(\alpha,\mathcal H) P(G)=DP(α,H)

G ( a 1 ) , ⋯   , G ( a D ) \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D}) G(a1),,G(aD)分别表示随机测度 G \mathcal G G的的样本空间被划分成 D \mathcal D D个区域,各个区域原子数量的结果。根据狄利克雷过程的核心性质,可以将上式转化为:
P [ G ( a 1 ) , G ( a 2 ) , ⋯   , G ( a D ) ] = Dir [ α H ( a 1 ) , α H ( a 2 ) , ⋯   , α H ( a D ) ] \mathcal P[\mathcal G(a_1),\mathcal G(a_2),\cdots,\mathcal G(a_{\mathcal D})] = \text{Dir}[\alpha \mathcal H(a_1),\alpha \mathcal H(a_2),\cdots,\alpha \mathcal H(a_{\mathcal D})] P[G(a1),G(a2),,G(aD)]=Dir[αH(a1),αH(a2),,αH(aD)]
这里不妨设基本测度 H \mathcal H H是一个均匀分布,则有:
{ H ( a 1 ) = H ( a 2 ) = ⋯ = H ( a D ) = 1 D ∑ d = 1 D H ( a d ) = 1 Dir [ α H ( a 1 ) , α H ( a 2 ) , ⋯   , α H ( a D ) ] = Dir ( α D , α D , ⋯   , α D ⏟ D 个 ) \begin{cases} \mathcal H(a_1) = \mathcal H(a_2)= \cdots = \mathcal H(a_{\mathcal D}) = \frac{1}{\mathcal D} \quad \sum_{d=1}^{\mathcal D} \mathcal H(a_d) = 1 \\ \text{Dir}[\alpha \mathcal H(a_1),\alpha \mathcal H(a_2),\cdots,\alpha \mathcal H(a_{\mathcal D})] = \text{Dir} \left(\underbrace{\frac{\alpha}{\mathcal D},\frac{\alpha}{\mathcal D},\cdots,\frac{\alpha}{\mathcal D}}_{\mathcal D个}\right) \end{cases} H(a1)=H(a2)==H(aD)=D1d=1DH(ad)=1Dir[αH(a1),αH(a2),,αH(aD)]=Dir D Dα,Dα,,Dα
至此,将狄利克雷分布引入到 P ( z ^ = m ∣ Z ) \mathcal P(\hat z = m \mid \mathcal Z) P(z^=mZ)中:
P ( z ^ = m ∣ Z ) = P ( z ^ = m , Z ) P ( Z ) = ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) P [ z ^ = m , Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] ⋅ P [ G ( a 1 ) , ⋯   , G ( a D ) ] ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) P [ Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] ⋅ P [ G ( a 1 ) , ⋯   , G ( a D ) ] \begin{aligned} \mathcal P(\hat z = m \mid \mathcal Z) & = \frac{\mathcal P(\hat z = m,\mathcal Z)}{\mathcal P(\mathcal Z)} \\ & = \frac{\sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \mathcal P[\hat z = m,\mathcal Z \mid \mathcal G(a_1),\cdots, \mathcal G(a_{\mathcal D})] \cdot \mathcal P[\mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})]}{\sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \mathcal P[\mathcal Z \mid \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})] \cdot \mathcal P[\mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})]} \\ \end{aligned} P(z^=mZ)=P(Z)P(z^=m,Z)=G(a1),,G(aD)P[ZG(a1),,G(aD)]P[G(a1),,G(aD)]G(a1),,G(aD)P[z^=m,ZG(a1),,G(aD)]P[G(a1),,G(aD)]
再将狄利克雷分布代入,有:
P ( z ^ = m ∣ Z ) = ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) P [ z ^ = m , Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] ⋅ Dir ( α D , α D , ⋯   , α D ) ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) P [ Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] ⋅ Dir ( α D , α D , ⋯   , α D ) \mathcal P(\hat z = m \mid \mathcal Z) = \frac{\sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \mathcal P[\hat z = m,\mathcal Z \mid \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})] \cdot \text{Dir}\left(\frac{\alpha}{\mathcal D},\frac{\alpha}{\mathcal D},\cdots,\frac{\alpha}{\mathcal D}\right)}{\sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \mathcal P[\mathcal Z \mid \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})] \cdot \text{Dir}\left(\frac{\alpha}{\mathcal D},\frac{\alpha}{\mathcal D},\cdots,\frac{\alpha}{\mathcal D}\right)} P(z^=mZ)=G(a1),,G(aD)P[ZG(a1),,G(aD)]Dir(Dα,Dα,,Dα)G(a1),,G(aD)P[z^=m,ZG(a1),,G(aD)]Dir(Dα,Dα,,Dα)
通过观察,分子分母非常相似,先从求解分子开始:
∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) P [ z ^ = m , Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] ⋅ Dir ( α D , α D , ⋯   , α D ) \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \mathcal P[\hat z = m,\mathcal Z \mid \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})] \cdot \text{Dir}\left(\frac{\alpha}{\mathcal D},\frac{\alpha}{\mathcal D},\cdots,\frac{\alpha}{\mathcal D}\right) G(a1),,G(aD)P[z^=m,ZG(a1),,G(aD)]Dir(Dα,Dα,,Dα)
其中 P [ z ^ = m , Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] \mathcal P[\hat z = m,\mathcal Z \mid \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})] P[z^=m,ZG(a1),,G(aD)]表示关于 z ^ , Z \hat z,\mathcal Z z^,Z似然分布,是一个多项式分布。根据指数族分布的共轭性质,积分内的乘积结果同样是狄利克雷分布。将积分号内各项的概率密度函数表示出来:
该项本质上是关于后验分布的推导过程

  • 分子用符号 I n u m e r \mathcal I_{numer} Inumer表示。
  • 其中 z ^ , Z \hat z,\mathcal Z z^,Z表示聚类标签的具体分布,并且它们的分布与随机测度 G \mathcal G G的离散数量相同。假设 z ^ , Z \hat z,\mathcal Z z^,Z的离散随机变量是 z 1 , ⋯   , z D z_1,\cdots,z_{\mathcal D} z1,,zD.
    I n u m e r = ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) ( ( ∑ d = 1 D z d ) ! z 1 ! ⋯ z D ! ∏ d = 1 D G ( a d ) z d ) ⋅ ( Γ [ α ∑ d = 1 D 1 D ] ∏ d = 1 D Γ ( α ∑ d = 1 D 1 D ) ∏ d = 1 D G ( a d ) α D − 1 ) \mathcal I_{numer} = \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \left(\frac{\left(\sum_{d=1}^{\mathcal D} z_d\right)!}{z_1! \cdots z_{\mathcal D}!} \prod_{d=1}^{\mathcal D} \mathcal G(a_d)^{z_d}\right) \cdot \left(\frac{\Gamma \left[\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D}\right]}{\prod_{d=1}^{\mathcal D}\Gamma(\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D})}\prod_{d=1}^{\mathcal D}\mathcal G(a_d)^{\frac{\alpha}{\mathcal D} - 1}\right) Inumer=G(a1),,G(aD) z1!zD!(d=1Dzd)!d=1DG(ad)zd d=1DΓ(αd=1DD1)Γ[αd=1DD1]d=1DG(ad)Dα1

概率密度积分的角度观察:

  • 由于多项式分布是狄利克雷分布的共轭先验,根据贝叶斯定理,分子积分内的项必然与狄利克雷分布之间存在常数的系数关系:
    这里假设这个常数项是 C = P ( z ^ , Z ) \mathcal C = \mathcal P(\hat z,\mathcal Z) C=P(z^,Z),对应的后验狄利克雷分布记作 Dir p o s t \text{Dir}_{post} Dirpost.
    C ⋅ Dir p o s t = P [ z ^ = m , Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] ⋅ Dir ( α D , α D , ⋯   , α D ) ⇒ Dir p o s t ∝ P [ z ^ = m , Z ∣ G ( a 1 ) , ⋯   , G ( a D ) ] ⋅ Dir ( α D , α D , ⋯   , α D ) ⇒ I n u m e r = ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) C ⋅ Dir p o s t ∝ ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) Dir p o s t \begin{aligned} & \mathcal C \cdot \text{Dir}_{post} = \mathcal P[\hat z = m,\mathcal Z \mid \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})] \cdot \text{Dir}\left(\frac{\alpha}{\mathcal D},\frac{\alpha}{\mathcal D},\cdots,\frac{\alpha}{\mathcal D}\right) \\ & \Rightarrow \text{Dir}_{post} \propto \mathcal P[\hat z = m,\mathcal Z \mid \mathcal G(a_1),\cdots,\mathcal G(a_{\mathcal D})] \cdot \text{Dir}\left(\frac{\alpha}{\mathcal D},\frac{\alpha}{\mathcal D},\cdots,\frac{\alpha}{\mathcal D}\right) \\ & \Rightarrow \mathcal I_{numer} = \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \mathcal C \cdot \text{Dir}_{post} \propto \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \text{Dir}_{post} \end{aligned} CDirpost=P[z^=m,ZG(a1),,G(aD)]Dir(Dα,Dα,,Dα)DirpostP[z^=m,ZG(a1),,G(aD)]Dir(Dα,Dα,,Dα)Inumer=G(a1),,G(aD)CDirpostG(a1),,G(aD)Dirpost
  • 针对上式第二步, ∝ \propto 左右两侧的概率分布分别对各自的随机变量进行积分
    1 = ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) Dir p o s t ∝ ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) ( ( ∑ d = 1 D z d ) ! z 1 ! ⋯ z D ! ∏ d = 1 D G ( a d ) z d ) ⋅ ( Γ [ α ∑ d = 1 D 1 D ] ∏ d = 1 D Γ ( α ∑ d = 1 D 1 D ) ∏ d = 1 D G ( a d ) α D − 1 ) = { ( ∑ d = 1 D z d ) ! z 1 ! ⋯ z D ! ⋅ Γ [ α ∑ d = 1 D 1 D ] ∏ d = 1 D Γ ( α ∑ d = 1 D 1 D ) } ⏟ 前项 ⋅ ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) [ ∏ d = 1 D G ( a d ) z d + α D − 1 ] ⏟ 后项 \begin{aligned} 1 = \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \text{Dir}_{post} & \propto \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \left(\frac{\left(\sum_{d=1}^{\mathcal D} z_d\right)!}{z_1! \cdots z_{\mathcal D}!} \prod_{d=1}^{\mathcal D} \mathcal G(a_d)^{z_d}\right) \cdot \left(\frac{\Gamma \left[\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D}\right]}{\prod_{d=1}^{\mathcal D}\Gamma(\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D})}\prod_{d=1}^{\mathcal D}\mathcal G(a_d)^{\frac{\alpha}{\mathcal D} - 1}\right) \\ & = \underbrace{\left\{\frac{\left(\sum_{d=1}^{\mathcal D} z_d\right)!}{z_1! \cdots z_{\mathcal D}!} \cdot \frac{\Gamma \left[\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D}\right]}{\prod_{d=1}^{\mathcal D}\Gamma(\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D})}\right\}}_{前项} \cdot \underbrace{\sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \left[\prod_{d=1}^{\mathcal D}\mathcal G(a_d)^{z_d + \frac{\alpha}{\mathcal D} - 1}\right]}_{后项} \end{aligned} 1=G(a1),,G(aD)DirpostG(a1),,G(aD) z1!zD!(d=1Dzd)!d=1DG(ad)zd d=1DΓ(αd=1DD1)Γ[αd=1DD1]d=1DG(ad)Dα1 =前项 z1!zD!(d=1Dzd)!d=1DΓ(αd=1DD1)Γ[αd=1DD1] 后项 G(a1),,G(aD)[d=1DG(ad)zd+Dα1]
    关于后项 ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) [ ∏ d = 1 D G ( a d ) z d + α D − 1 ] \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \left[\prod_{d=1}^{\mathcal D}\mathcal G(a_d)^{z_d + \frac{\alpha}{\mathcal D} - 1}\right] G(a1),,G(aD)[d=1DG(ad)zd+Dα1]可以近似地看作前项的倒数
    • 之所以是近似,是因为 1 1 1和前项X后项之间仅是 ∝ \propto 关系,而不是 = = =关系。
    • Γ \Gamma Γ函数是一个以 exp ⁡ \exp exp为底的指数函数,将连乘项直接代入到 Γ \Gamma Γ函数中。并且 ∑ d = 1 D 1 D = 1 \sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D} = 1 d=1DD1=1直接消掉了。
    • ∑ d = 1 D \sum_{d=1}^{\mathcal D} d=1D本身就表示多项式分布的随机变量集合,这里直接使用 Z \mathcal Z Z进行表示。
      ∑ G ( a 1 ) , ⋯   , ∑ G ( a D ) [ ∏ d = 1 D G ( a d ) z d + α D − 1 ] ∝ z 1 ! ⋯ z D ! ( ∑ d = 1 D z d ) ! ⋅ ∏ d = 1 D Γ ( α ∑ d = 1 D 1 D ) Γ [ α ∑ d = 1 D 1 D ] = ∏ d = 1 D Γ ( α + z d ) Γ [ α + Z ] \begin{aligned} \sum_{\mathcal G(a_1)},\cdots,\sum_{\mathcal G(a_{\mathcal D})} \left[\prod_{d=1}^{\mathcal D}\mathcal G(a_d)^{z_d + \frac{\alpha}{\mathcal D} - 1}\right] & \propto \frac{z_1 !\cdots z_{\mathcal D}!}{\left(\sum_{d=1}^{\mathcal D} z_d\right)!} \cdot \frac{\prod_{d=1}^{\mathcal D} \Gamma \left(\alpha \sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D}\right)}{\Gamma \left[\alpha \sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D}\right]} \\ & = \frac{\prod_{d=1}^{\mathcal D} \Gamma \left(\alpha + z_d\right)}{\Gamma \left[\alpha + \mathcal Z\right]} \end{aligned} G(a1),,G(aD)[d=1DG(ad)zd+Dα1](d=1Dzd)!z1!zD!Γ[αd=1DD1]d=1DΓ(αd=1DD1)=Γ[α+Z]d=1DΓ(α+zd)

最终整理,可以得到关于分子 I n u m e r \mathcal I_{numer} Inumer表示如下:
I n u m e r = { ( ∑ d = 1 D z d ) ! z 1 ! ⋯ z D ! ⋅ Γ [ α ∑ d = 1 D 1 D ] ∏ d = 1 D Γ ( α ∑ d = 1 D 1 D ) } ⋅ ∏ d = 1 D Γ ( α + z d ) Γ [ α + Z ] \mathcal I_{numer} = \left\{\frac{\left(\sum_{d=1}^{\mathcal D} z_d\right)!}{z_1! \cdots z_{\mathcal D}!} \cdot \frac{\Gamma \left[\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D}\right]}{\prod_{d=1}^{\mathcal D}\Gamma(\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D})}\right\} \cdot \frac{\prod_{d=1}^{\mathcal D} \Gamma \left(\alpha + z_d\right)}{\Gamma \left[\alpha + \mathcal Z\right]} Inumer= z1!zD!(d=1Dzd)!d=1DΓ(αd=1DD1)Γ[αd=1DD1] Γ[α+Z]d=1DΓ(α+zd)
但需要做几点说明:

  • 虽然 ( ∑ d = 1 D z d ) ! z 1 ! ⋯ z D ! \frac{\left(\sum_{d=1}^{\mathcal D} z_d\right)!}{z_1! \cdots z_{\mathcal D}!} z1!zD!(d=1Dzd)!描述的是多项式分布的系数,但 z 1 , ⋯   , z D z_1,\cdots,z_{\mathcal D} z1,,zD分别表示统计样本属于各个划分的数量,这种统计方式在聚类任务中是不合理的。
    例如某样本分布及对应划分如下图所示:
    样本分布及其划分示例
    上述2组,每组4个样本分布完全相同,两种划分方式的多项式分布系数均相同,均等于6;但从聚类角度观察,它们是差异极大的两种聚类。因而对 I n u m e r \mathcal I_{numer} Inumer表示时,删除多项式分布系数的影响。
  • 关于狄利克雷分布的系数 Γ [ α ∑ d = 1 D 1 D ] ∏ d = 1 D Γ ( α ∑ d = 1 D 1 D ) \frac{\Gamma \left[\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D}\right]}{\prod_{d=1}^{\mathcal D}\Gamma(\alpha\sum_{d=1}^{\mathcal D} \frac{1}{\mathcal D})} d=1DΓ(αd=1DD1)Γ[αd=1DD1],无论是分子还是分母,关于先验分布均是从同一个狄利克雷过程中生成的。这意味着划分空间数量 D \mathcal D D是固定的。分子分母项可以同时消掉该部分系数。

最终,可以将分子 I n u m e r \mathcal I_{numer} Inumer表示为:
I n u m e r ⇒ ∏ d = 1 D Γ ( α + z d ) Γ [ α + Z ] \mathcal I_{numer} \Rightarrow \frac{\prod_{d=1}^{\mathcal D} \Gamma \left(\alpha + z_d\right)}{\Gamma \left[\alpha + \mathcal Z\right]} InumerΓ[α+Z]d=1DΓ(α+zd)

相关参考:
徐亦达机器学习:Dirichlet-Process-part 7

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/403760.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows 环境安装Scala详情

为了进一步学习Spark,必须先学习Scala 编程语言。首先开始Scala 环境搭建。温馨提示:本文是基于Windows 11 安装Scala 2.13.1 版本第一步:确保本机已经正确安装JDK1.8 环境第二步:Scala 官网下载我们所属scala版本文件。Scala 官网…

JavaScript(WebAPI)

目录 1.什么是Web API? 2.DOM和DOM树 3.获取元素 4.事件 5.操作元素 获取/修改元素内容 1.innerText 2. innerHTML 获取/修改元素属性 获取/修改表单元素属性 获取/修改样式属性 1.修改内联样式 2.修改元素应用的CSS类名 6.操作节点 新增节点 删除节点 7.案例…

Vue3的composition API—setup函数, ref函数,reactive函数

1、Setup 函数 1.setup 是vue3中的一个配置项 2、setup是所有组件所需要的数据和方法都需要配置到setup中的 3、setup两种返回值: 若返回一个对象 若返回一个渲染函数 mian.js文件 注意:尽量不与Vue2混用 setup中无法访问vue2中的配置 不能是async函数…

Optional--Java8新特性最佳实践

Optional是在 Java8中引入的新特性之一。使用Optional类包装数据,可以避免经典的空检查和一些try-catch代码块。也能够通过链式方法调用,写出更流畅的函数式编程的代码。另一方面,滥用Optional也会导致性能低下和代码混乱。过往项目业务中有大…

【Linux】旋转锁 | 读写锁

在之前的线程学习中,用到的锁都是挂起等待锁,如果申请不到锁,那就会在锁中等待; 自旋锁则不大相似 文章目录1.自旋锁1.1 概念1.2 接口1.2.1 pthread_spin_init/destroy1.2.2 pthread_spin_lock1.2.3 pthread_spin_unlock2.读写锁…

VIO优化中不客观自由度 (gauge freedom) 的处理 (gauge handle)

文章目录1. 不可观的解释2. 几种不同的gauge handle处理方式2.1. free gauge方式2.2. fix gauge方式2.3. prior gauge方式2.4. g2o tutorial方式3.不同方式的协方差矩阵1. 不可观的解释 这篇论文 中对VIO的4-DOF不可观的定义如下,可以看到这种不可观就是如果对最后…

gerrit操作和jinkens编译合入代码

gerrit 先 查看自己的push 找到后添加reviewer 填写邮箱开头就可以出来 记得1 然后send 让人review 编译不过,gerrit上查看 1.是不是checkstyle问题 2.编译不过,去jinkens查看 先retrigger重新编译 如果发现多次编译失败 则要看下console output 查…

【ONE·Data || 顺序表】

总言 数据结构基础:顺序表模拟实现。    文章目录总言1、顺序表各接口功能实现描述1.1、如何创建一个顺序表?1.2、如何初始化顺序表:SLInit1.3、顺序表的尾插、头插1.3.1、顺序表尾插1.0:SLPushBack1.3.2、顺序表头插1.0&#x…

网络连接的三种模式

文章目录前言一、三种连接模式介绍二、三种网络连接模式的区别前言 在进行虚拟机配置时,网络连接分为三种模式:桥接模式,NAT模式,主机模式 一、三种连接模式介绍 张三、李四、王五在同一个网段,所以他们之间可以相互…

数据结构---双链表

专栏:数据结构 个人主页:HaiFan. 专栏简介:从零开始,数据结构!! 双链表前言双链表各接口的实现为要插入的值开辟一块空间BuyLN初始化LNInit和销毁LNDestory打印链表中的值LNPrint尾插LNPushBack和尾删LNPop…

vue2+elementUI完成添加学生删除学生案列

效果图&#xff1a; 点击添加学生按钮&#xff0c;弹出Dialog,收集用户信息&#xff1a; el-table中自定义复选框&#xff0c;选中一行&#xff0c;可以点击删除 代码区域&#xff1a;就一个HTML文件 <!DOCTYPE html> <html lang"en"> <head>&…

Flume基操

Flume概述 Flume 定义 Flume 是 Cloudera 提供的一个高可用的&#xff0c;高可靠的&#xff0c;分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构&#xff0c;灵活简单。 Flume最主要的作用就是&#xff0c;实时读取服务器本地磁盘的数据&#xff0c;将数据写入到…

带恒温冷藏功能的便携式自动采样器——可用于毒情监测

污水采样在验毒的工作流程中是怎样进行的呢&#xff1f; 污水采样&#xff1a;每个季度采样一次。例如在某市48家污水处理厂54个进水口采取水样&#xff0c;用便携式水质自动采样器连续采样7天&#xff0c;一天采样12次成为一个混合样。也就是说&#xff0c;一次采样的话&…

如何在 VS Code 中安装运行、编写C语言程序

1.下载 安装VS Code 去官网下载&#xff1a;https://code.visualstudio.com/Download 直接下载&#xff0c;安装即可。 2.安装VS code中2个插件 打开软件运行&#xff0c;在扩展商店中分别搜索安装 C/C 和 code runner 插件 3.下载mingb64 官网下载 https://sourceforge…

消息队列MQ用来做什么的,市场上主流的四大MQ如何选择?RabbitMQ带你HelloWorld!

文章目录MQ用来做什么的MQ会有什么样的麻烦MQ消息队列模式分类MQ消息队列常用协议市场主流四大MQRabbitMQ项目开发RabbitMQ中的组成部分MQ用来做什么的 省流 &#xff1a;系统解耦、异步调用、流量削峰 系统解耦 首先举例下面这个场景&#xff0c;现有ABCDE五个系统&#xff…

小黑子—Java从入门到入土过程:第二章

Java零基础入门2.0Java系列第二章1. 注释和关键字2. 字面量3. 变量3.1 基本用法3.2 使用方式3.3 注意事项4. 变量练习5. 计算机中的数据存储5.1 计算机的存储规则5.2 进制5.3 进制间转换二进制转十八进制转十十六进制转十十进制转其他进制6. 数据类型7. 定义变量的练习8. 标识符…

MATLAB——将直接型转化为并联型和级联型

题目1(IIR)&#xff1a; 已知一个系统的传递函数为&#xff1a; H&#xff08;z&#xff09;8−4z−111z−2−2z−31−1.25z−10.75z−2−0.125z−3H&#xff08;z&#xff09;\frac{8-4z^{-1}11z^{-2}-2z^{-3}}{1-1.25z^{-1}0.75z^{-2}-0.125z^{-3}}H&#xff08;z&#xff09…

Leedcode 1137. 第 N 个泰波那契数

泰波那契序列 Tn 定义如下&#xff1a; T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 Tn Tn1 Tn2 给你整数 n&#xff0c;请返回第 n 个泰波那契数 Tn 的值。 示例 1&#xff1a; 输入&#xff1a;n 4 输出&#xff1a;4 解释&#xff1a; T_3 0 1 1 2 T_4 1 …

2.线性表的顺序表示

数据结构很重要&#xff01; 数据结构很重要&#xff01;&#xff01;&#xff01; 数据结构很重要&#xff01;&#xff01;&#xff01;&#xff01; 思考 1.线性表的顺序表示内容有哪些&#xff1f;&#xff08;What&#xff09; 2.为什么要学线性表的顺序表示? ? (Why)…

POI 操作Excel的单元格样式超过64000的异常问题解决

文章目录POI 操作Excel的单元格样式超过64000的异常问题解决问题描述问题原因问题分析和解决简单的Excel文件生成Demo最终的解决方案POI 操作Excel的单元格样式超过64000的异常问题解决 问题描述 在用POI 生成Excel文件时&#xff0c;如果自定义的单元格的样式超过64000行&am…