本篇的思维导图:
DBSCAN模型
DBSCAN(全称为Density-Based Spatial Clustering of Applications with Noise)是一种以密度为基础的空间聚类算法,可以用密度的概念剔除不属于任一类别的噪声点。该算法将簇定义为密度相连的点的最大集合,将具有足够密度的区域划分为簇,并可以发现任意形状的簇。
DBSCAN算法的基本原理
下面通过一个简单案例讲解DBSCAN算法的原理。设定画圆半径为1,圆内最小样本点数为3,算法步骤如下图所示:
KMeans算法与DBSCAN算法的对比
KMeans算法和DBSCA