自然断点法
自然断点法有两个称呼,一个就是直接英文名称,叫做“Natural Breaks”,这就不解释了,还有一个称呼就是ArcGIS里面用的,叫做“Jenks”,主要是来源于它的创造者:乔治·弗雷德里克·詹克斯(George Frederick Jenks)教授:
自然断点法运用了聚类的思维,它的核心思想与聚类一样:使每一组内部的相似性最大,而外部组与组之间的相异性最大。但是与聚类不一样的地方,聚类是不会关注每一类中的要素数量和范围的,而自然断点法在于它还会兼顾每一组之间的要素的范围和个数尽量相近。
自然断点法的意义在于,詹克斯教授认为任何数列之间,都存在一些自然(非人为设定的)的转折点和断点,这些自然的断点,都是具有统计学意义的,用这些转折点可以把研究的对象分成性质相似的群组,因此,自然断点本身就是分级的良好界限。
案例
2.1 ArcGIS
在ArcGIS里面,提供了一种非常好用,也是最常用的分类方法,就是所谓的自然断点法:
自然断点法可以根据你选择的级别进行划分,是最省时省力的方法。
2.2 Python实现自然断点法
Python中实现自然断点法的包:jenkspy
下载地址-jenkspy 0.3.3
在cmd中利用pip命令安装jenkspy包:
pip install jenkspy
参考
1、CSDN-探索性数据分析:自然断点法算法原理及Python实现