[社区发现]networkx.algorithms.community模块

253 阅读2分钟

NetworkX的algorithms.community模块提供了多种可直接调用的社区发现算法,

以下是当前版本(以NetworkX 2.8+为例)中主要的算法及其分类:


1. 非重叠社区检测算法

算法名称函数/类核心思想
Girvan-Newmangirvan_newman()基于边介数中心性,逐步移除高介数边以分裂社区(层次聚类)。
Louvain方法louvain_communities()模块度最大化,通过局部优化和聚合迭代(需安装python-louvain库)。
标签传播 (LPA)label_propagation_communities()节点根据邻居标签动态更新自身标签,直至收敛(适合大规模网络)。
贪婪模块度优化greedy_modularity_communities()逐步合并社区使模块度增益最大,基于Newman的快速算法。
Kernighan-Lin分割kernighan_lin_bisection()通过交换节点对优化分割质量,适用于二分图。

2. 重叠社区检测算法

算法名称函数/类核心特点
k-Clique渗透k_clique_communities()通过共享k−1节点的k-clique链定义社区(如用户所述)。
Clique渗透 (CPM)clique_communities()类似k-clique,但允许不同k值的clique扩展。

3. 其他辅助工具

功能函数/类用途
模块度计算modularity()评估社区划分质量。
社区结构生成器LFR_benchmark_graph()生成具有已知社区结构的测试网络(需安装networkx.generators.community)。

代码示例:调用不同算法

import networkx as nx
from networkx.algorithms import community

# 创建一个示例图
G = nx.karate_club_graph()  # 空手道俱乐部社交网络

# 使用Girvan-Newman算法(返回生成器,按层次分裂)
gn_communities = next(community.girvan_newman(G))
print("Girvan-Newman社区:", gn_communities)

# 使用Louvain方法(需安装python-louvain)
louvain_coms = community.louvain_communities(G, resolution=1.0)
print("Louvain社区:", louvain_coms)

# 使用标签传播
lpa_coms = list(community.label_propagation_communities(G))
print("标签传播社区:", lpa_coms)

# 使用k=3的Clique渗透
k3_clique_coms = list(community.k_clique_communities(G, 3))
print("k=3的Clique社区:", k3_clique_coms)

注意事项

  1. 依赖库:部分算法(如Louvain)需要额外安装库(例如pip install python-louvain)。

  2. 返回值类型:不同算法返回结果形式不同(如生成器、列表、集合)。

  3. 适用场景

    • 稀疏图:标签传播、Louvain效率较高。
    • 小规模图:Girvan-Newman、k-clique适用。
    • 重叠社区:优先选择k-clique或Clique渗透。