1、分辨率局限
louvain算法存在的问题:分辨率局限。就是说当通过优化模块度来发现社区结构时,网络在存在一个固有的分辨率局限,导致一些规模较小但是结构显著的社区淹没在大的社区中,无法被识别到。
造成这个问题的根本原因是模块度的定义依赖网络的全局属性----网络边的总权重
本质来说,社区结构是网络中的局部结构,社区内部的节点仅与网络中的部分节点有关,因此不应该受网络中全部节点的影响
分辨率局限的问题对基于模块度的优化的社区发现算法提出了严重的质疑。
2、模块度不能识别较小规模社区的原因分析:
也就是说当某些社区较小时,其内部的边的权重之和也较小,则模块度的取值可能是负的,就会被分配到一个更粗力度的层次上,因此就被淹没了
其实跟密度聚类算法相似,如果用一个统一的超参数来进行聚类划分的话,那么密度较小的子类,就划分不出来了,就被淹没了
3、如何优化呢?答:多分辨率密度模块度
多分辨率的优点,通过设置不同的分辨率可以得到不同粒度的社区,得到的社区更丰富,挖掘出异常社区的概率越大