目录
1.轮廓系数(Silhouette Coefficient)
1.1 为什么轮廓系数可以评价聚类效果的好坏?
1.2 平均轮廓系数
2. 其他聚类质量函数
2.1方差比准则(Variance Ratio Criterion, VRC)
2.2 戴维斯-博尔丁指数(Davies-Bouldin指数,DB指数)
评价聚类结果效果的指标通常有:误差平方和(Sum of the Squared Errors, SSE),轮廓系数(Silhouette Coefficient)和CH指标(Calinski-Harabaz)。
1.轮廓系数(Silhouette Coefficient)
轮廓系数,是用于评价聚类效果好坏的一种指标。可以理解为描述聚类后各个类别的轮廓清晰度的指标。其包含有两种因素——内聚度和分离度。
内聚度可以理解为反映一个样本点与类内元素的紧密程度。
分离度可以理解为反映一个样本点与类外元素的紧密程度。
1.1 为什么轮廓系数可以评价聚类效果的好坏?
1.2 平均轮廓系数
2. 其他聚类质量函数
2.1方差比准则(Variance Ratio Criterion, VRC)
2.2 戴维斯-博尔丁指数(Davies-Bouldin指数,DB指数)