社交网络的特征可以从多个维度进行分析,涵盖整体结构、个体行为、群体动态、时间演化以及内容属性等方面。
以下是详细的分类和特征列举:
1. 结构特征(整体网络属性)
-
密度(Density) :网络中实际存在的边数与可能的最大边数之比,反映连接的紧密程度。
-
平均度(Average Degree) :所有节点的边数(一级连接数)的平均值。
-
度分布(Degree Distribution) :节点一级连接度的概率分布,如是否符合幂律分布(无标度网络)。
-
聚类系数(Clustering Coefficient) :衡量节点邻居之间是否相互连接(例如“朋友的朋友是否是朋友”)。
-
网络直径(Diameter) :网络中任意两节点间最短路径的最大长度。
-
连通性(Connectivity) :网络是否全连通,或存在孤立子图(如巨连通分量占比)。
-
同配性(Assortativity) :相似节点(如高连接度的节点)是否倾向于彼此连接。
-
中心性指标:
- 度中心性(Degree Centrality) :节点直接连接的数量。
- 紧密中心性(Closeness Centrality) :节点到其他节点的平均最短距离。
- 中介中心性(Betweenness Centrality) :节点作为“桥梁”的重要性,位于最短路径的次数。
- 特征向量中心性(Eigenvector Centrality) :节点连接的重要性(如PageRank)。
2. 个体特征(节点属性)
- 度(Degree) :节点的直接连接数(有向网络中分为入度和出度)。
- 结构洞(Structural Holes) :节点在连接不同群体时的中介作用(如Burt的结构洞理论)。
- 嵌入性(Embeddedness) :节点间连接的稳固性(如共同邻居数量)。
- 三元闭包(Triadic Closure) :节点是否促成“共同朋友”间连接(如Granovetter的强弱关系理论)。
3. 群体特征(子图或社区属性)
- 社区结构(Community Structure) :通过模块度(Modularity)衡量群体内部连接的紧密程度。
- 派系(Clique) :完全互连的节点子集(如3人互为好友)。
- 核心-边缘结构(Core-Periphery) :网络核心密集连接,边缘稀疏。
- k-core/k-plex:满足特定连接条件的子图(如k-core要求每个节点至少连接k个其他节点)。
4. 动态特征(时间演化)
- 网络演化:节点和边的增减速率(如用户增长、关系变化)。
- 信息传播:如病毒传播模型(SIR)、级联效应或信息扩散速度。
- 稳定性:网络结构随时间变化的鲁棒性(如抗攻击能力)。
- 趋势分析:用户行为或话题热度的时序变化。
5. 内容特征(用户生成内容)
- 情感极性:用户发文的情绪倾向(正面/负面)。
- 主题分布:通过LDA等模型提取内容主题。
- 信息质量:虚假信息、谣言或垃圾内容的比例。
- 流行度指标:内容的点赞、转发、评论量等。
6. 其他维度
- 权重(Weight) :边的强度(如互动频率)。
- 方向性(Directionality) :有向边(如关注与被关注)。
- 多维网络:结合多种关系(如社交+兴趣网络)或属性(如用户性别、年龄)。
应用场景
- 推荐系统:利用中心性、社区结构识别关键用户。
- 舆情监控:通过动态特征检测突发事件。
- 社群发现:基于模块度划分兴趣群体。
这些特征可结合使用,例如分析高中介中心性的用户如何推动信息在紧密社区间的传播,或通过动态网络演化预测用户流失。实际应用中需根据具体问题选择合适的特征组合。