根据到给点样本的距离,来聚类。
1.曼哈顿距离、
2.欧几里得距离
直线距离
3.切比雪夫距离
4.闵氏距离
5.余弦相似度
对数据大小/长度等不关注,只关注相似度。
6.汉明距离 二进制距离
二、密度聚类 DBSCAN
前提是样本是根据紧密程度分布的。
先用超参数生成核心对象
三、层次聚类
合并距离最近的两个样本点。关键是求距离。
四、高斯混合分布聚类:数据重合,均值或方差至少有一个是不同的。
五、总结
六、性能度量
1.利用真实值
2.不利用外部真实值
根据到给点样本的距离,来聚类。
1.曼哈顿距离、
2.欧几里得距离
直线距离
3.切比雪夫距离
4.闵氏距离
5.余弦相似度
对数据大小/长度等不关注,只关注相似度。
6.汉明距离 二进制距离
二、密度聚类 DBSCAN
前提是样本是根据紧密程度分布的。
先用超参数生成核心对象
三、层次聚类
合并距离最近的两个样本点。关键是求距离。
四、高斯混合分布聚类:数据重合,均值或方差至少有一个是不同的。
五、总结
六、性能度量
1.利用真实值
2.不利用外部真实值
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2121334.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!