补充一个聚类算法:高斯混合模型
假设有一组需要根据它们的相似性分组到几个部分或簇中的数据点。在机器学习中,这被称为聚类。有几种可用的聚类方法:
- K均值聚类
- 分层聚类
- 高斯混合模型
在这篇文章中,我们将讨论高斯混合模型。
文章目录
-
- 正态或高斯分布
- 期望最大化(EM)算法
- 期望最大化 (EM) 算法
- 估计步骤(E步)
- 高斯混合模型的实现
- 确定最佳类数
正态或高斯分布
在现实生活中,许多数据集可以用高斯分布(单变量或多变量)进行建模。因此,假设群集来自不同的高斯分布是非常自然和直观的。换句话说,它试图将数据集建模为几个高斯分布的混合。这是这个模型的核心思想。
在一维中,高斯分布的概率密度函数如下:
’
其中