1 高斯混合模型
- 总体分布是由K个高斯分布的组成的混合分布
1.1 一些记号
xj | 第j个观测数据 |
K | 模型中高斯模型的数量 |
αk | 观测数据属于第k个子模型的概率 |
第k个子模型的高斯分布密度函数 (也就是一个高斯分布的密度函数 | |
第j个观测数据属于第k个子模型的概率 |
1.2 高斯混合模型的概率分布
1.3 参数学习(EM算法)
- 初始化模型参数{θk}={μk,σk},{αk}
- 不断地迭代,直至收敛
- E-step:根据当前参数,计算每个数据j来自各个子模型的可能性
- M-step:计算新一轮迭代的模型参数
- E-step:根据当前参数,计算每个数据j来自各个子模型的可能性