1 sklearn各方法比较
方法名称 | 参数 | 使用场景 |
---|---|---|
K-means | 簇的数量 | 非常大的样本数 中等簇数 簇大小需要均匀 |
Affinity Propagation | 阻尼系数 样本偏好 | 样本数不能多 簇大小不均 |
MeanShift | 带宽 | 样本数不能多 簇大小均匀 |
谱聚类 | 簇的数量 | 中等样本数 小簇数 簇大小均匀 |
层次聚类 | 簇的数量或距离阈值 | 大样本数 大簇数 |
DBSCAN | 邻域大小 | 非常大的样本数 中等簇数 簇大小不均 |
HDBSCAN | 最小簇成员数、最小点数 | 大样本数 中等簇数 簇大小不均 |
OPTICS | 最小簇成员数 | 非常大的样本数 大簇数 簇大小不均 |