Leiden算法简介：Python实现网络分区

Leiden算法详解：Python实现网络分区

- 1. Leiden算法简介
- 2. Python代码实战
- 3. 分组结果解读
- - level=0：初步分组
  - level=1：细分小组
- 4. 为什么会这样分组？
- 5. Leiden算法的工作原理
- 6. 实际应用
- 7. 给初学者的建议
- 8. 总结

大家好！今天我们来深入了解Leiden算法，这是一个用于网络分区的强大工具。我们将使用Python来实现这个算法，并通过一个实际的例子来展示它的工作原理。

1. Leiden算法简介

Leiden算法是一种用于社区检测的算法，它可以帮助我们在复杂的网络中找到紧密相连的群体。想象你要给一个大班级的学生分组，希望每个小组内的同学关系都很好，Leiden算法就是来解决这类问题的。

2. Python代码实战

让我们用Python来实际操作一下！我们将创建一个同学关系网络，然后使用Leiden算法来进行分组。

import networkx as nx
from graspologic.partition import hierarchical_leiden

# 创建同学关系图
G = nx.Graph()
students = [
    "张三", "李四", "王五", "赵六", "孙七", "周八", "吴九", "郑十", 
    "钱十一", "朱十二", "陈十三", "林十四", "黄十五", "杨十六", "刘十七", 
    "何十八", "高十九", "马二十", "范二一", "程二二"
]
G.add_nodes_from(students)

# 添加同学关系
relationships = [
    ("张三", "李四"), ("张三", "王五"), ("李四", "赵六"), ("王五", "孙七"),
    ("赵六", "周八"), ("孙七", "吴九"), ("周八", "郑十"), ("吴九", "钱十一"),
    ("郑十", "朱十二"), ("钱十一", "张三"), ("朱十二", "李四"), ("陈十三", "林十四"),
    ("黄十五", "杨十六"), ("刘十七", "何十八"), ("高十九", "马二十"), ("范二一", "程二二"),
    ("张三", "陈十三"), ("李四", "黄十五"), ("王五", "刘十七"), ("赵六", "高十九"),
    ("孙七", "范二一"), ("周八", "林十四"), ("吴九", "杨十六"), ("郑十", "何十八"),
    ("钱十一", "马二十"), ("朱十二", "程二二")
]
G.add_edges_from(relationships)

# 使用Leiden算法进行分组
result = hierarchical_leiden(
    graph=G,
    max_cluster_size=5,  # 每组最多5人
    extra_forced_iterations=3  # 多尝试三次，看看有没有更好的分法
)

# 打印完整的分组结果
print("完整的分组结果：")
for cluster in result:
    print(cluster)

# 整理并打印最终分组
final_groups = {}
for cluster in result:
    if cluster.is_final_cluster:
        if cluster.cluster not in final_groups:
            final_groups[cluster.cluster] = []
        final_groups[cluster.cluster].append(cluster.node)

print("\n最终分组结果：")
for group_num, members in final_groups.items():
    print(f"第{group_num + 1}组：{', '.join(members)}")

3. 分组结果解读

运行上面的代码，我们得到了以下结果：

完整的分组结果：
HierarchicalCluster(node='李四', cluster=0, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='黄十五', cluster=0, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='吴九', cluster=0, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='杨十六', cluster=0, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='王五', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='朱十二', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='孙七', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='刘十七', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='范二一', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='郑十', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='何十八', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='程二二', cluster=1, parent_cluster=None, level=0, is_final_cluster=False)
HierarchicalCluster(node='张三', cluster=2, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='陈十三', cluster=2, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='周八', cluster=2, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='林十四', cluster=2, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='钱十一', cluster=3, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='赵六', cluster=3, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='高十九', cluster=3, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='马二十', cluster=3, parent_cluster=None, level=0, is_final_cluster=True)
HierarchicalCluster(node='王五', cluster=4, parent_cluster=1, level=1, is_final_cluster=True)
HierarchicalCluster(node='刘十七', cluster=4, parent_cluster=1, level=1, is_final_cluster=True)
HierarchicalCluster(node='孙七', cluster=5, parent_cluster=1, level=1, is_final_cluster=True)
HierarchicalCluster(node='范二一', cluster=5, parent_cluster=1, level=1, is_final_cluster=True)
HierarchicalCluster(node='朱十二', cluster=6, parent_cluster=1, level=1, is_final_cluster=True)
HierarchicalCluster(node='程二二', cluster=6, parent_cluster=1, level=1, is_final_cluster=True)
HierarchicalCluster(node='郑十', cluster=7, parent_cluster=1, level=1, is_final_cluster=True)
HierarchicalCluster(node='何十八', cluster=7, parent_cluster=1, level=1, is_final_cluster=True)

最终分组结果：
第1组：李四, 黄十五, 吴九, 杨十六
第3组：张三, 陈十三, 周八, 林十四
第4组：钱十一, 赵六, 高十九, 马二十
第5组：王五, 刘十七
第6组：孙七, 范二一
第7组：朱十二, 程二二
第8组：郑十, 何十八

让我们来解读这个结果：