信息传播模型:线性阈值模型 and 独立级联模型
信息传播模型刻画了网络节点的状态(通常表述为激活状态)在何种情况下可以影响其邻居节点的状态,从而建模信息在网络中的实际传播过程,确定节点影响力。独立级联模型和线性阈值模型是最为常用的两类影响力传播模型。为方便描述,不妨设 <> 表示给定的有向网络1, 是网络节点集合 是网络有向边集, 表示由节点 指向节点 的连边, 表示节点 的出邻居节点集合, 表示节点 的入邻居节点集合, 表示在 时刻网络中处于激活状态的节点集合,规定 。
独立级联模型
在独立级联模型2中,信息在网络中的传播过程可以描述为:在 时刻,设置处于激活状态的节点集合 ,在之后的任意 时刻,任意一个在 时刻被激活的节点 以概率 成功激活其邻居节点中处于未激活状态的节点 ,每次激活尝试是相互独立的,当某一时刻 网络中不再有新的节点被激活时,信息传播过程结束,此时网络中处于激活状态的节点占比 衡量了节点 的信息传播能力。
线性阈值模型
在线性阈值模型3中,每条有向边 都有一个权重 与之对应, 衡量了节点 对节点 的影响程度,每个节点 都有都有一个影响阈值 与之对应,权重和阈值在信息传播过程中是不变的,信息传播过程为:在 时刻,设置处于激活状态的节点集合 ,在之后的任意 时刻,对任意一个处于未激活状态的节点 计算该节点入邻居中所有激活节点对该节点的影响程度之和 ,若 则激活失败,否则,激活成功,当时刻 网络中不再有新的节点被激活时,信息传播过程结束,此时网络中处于激活状态的节点占比 衡量了节点 的信息传播能力。
SIR模型
信息传播模型的单次模拟结果往往具有偶然性,需要利用模型多次模拟完整的信息传播过程,记模拟次数为 ,第 次模拟结束时,网络中处于激活状态的节点占比记为 ,则节点的信息传播能力应为 。影响力传播模型对节点影响力的刻画较为准确,对节点影响力的区分能力强,得到该领域研究学者的普遍认可,但由于模拟实际信息传播的过程复杂度非常高,对于节点数为 的网络,单次信息传播模拟的复杂度高达 ,因此只能应用在小规模网络的节点影响力排序中。影响力传播模型的主要作用在于能够对特定网络生成节点影响力排序的基准数据,以便对其他节点影响力测度方法的优劣进行评估。SIR模型是独立级联模型的一个特例,被广泛应用于现有的高影响力节点发现研究中,在SIR模型中,对任意 ,概率 是固定的。
Reference
Footnotes
-
无向网络可以看作每条边都是双向的有向网络。 ↩
-
Goldenberg, J., Libai, B., Muller, E., 2001. Talk of the Network: A Complex Systems Look at the Underlying Process of Word-of-Mouth. Marketing Letters 12, 211–223. doi.org/10.1023/A:1… ↩
-
Granovetter, M., 1978. Threshold models of collective behavior. American Journal of Sociology 83, 1420–1443. doi.org/10.1086/226… ↩