社交网络的形成与价值——文献阅读

146 阅读2分钟

文献一:人们的交友决策?

背景

STRATEGIC NETWORK FORMATION 讨论的是作为一个网络中的个体如何策略性地决定是否要和他人建立连接。

互动环节: 大家眼中会出于什么目的去交友呢?

e.g 小毛刚刚加入抖音的社交DA团队,一脸茫然,他看到坐在办公室一隅的小郑,并开始考虑要不要主动认识小郑,并和他交个朋友呢?他会考虑以下几个问题

  1. 小郑本身值不值得喜欢?
  1. 和小郑成为朋友对于自己有没有什么好处?
  1. 小郑的朋友有哪些?可不可以通过他和更多的人成为朋友?

同样的,小郑面对新同学小毛的搭讪同样也会从以上几个角度去思考问题。如果他们真的成为了朋友,就会改变现有的网络结构,进而影响接下来其他人的交友决定。用经济学的术语来说,就是外部性

模型

参数:

DijD_{ij} : 用于描述现有的网络关系,当 i 和 j 是朋友时Dij=1D_{ij}=1 ,当 i 和 j 不是朋友时Dij=0D_{ij}=0

XiX_i : 用于描述个人特征:e.g 性别、年龄、学习成绩、是否喜欢篮球...;

假设:

  1. 我们假设社交网络的形成是渐进式的,即单期,用户i和用户j相遇并决定是不是需要成为朋友,假设我们的网络内共有N个用户,则需要N(N+1)2\frac{N(N+1)}2 期来形成最终的社交网络;
  1. 用户在t期内的效用函数是一致的;
  1. 用户的效用函数满足以下形式,其中分别对应概述中描述的三点U12=β0+β1x2(x1x2)Ω(x1x2)+α1f22+α2f222+α31g12=2+α41g12=3+δC12+ϵ12U_{12}=\beta_{0}+\beta_{1}^{\prime} x_{2}-\left(x_{1}-x_{2}\right)^{\prime} \Omega\left(x_{1}-x_{2}\right)+\alpha_{1} f_{22}+\alpha_{2} f_{22}^{2}+\alpha_{3} 1_{g 12=2}+\alpha_{4} 1_{g 12=3}+\delta C_{12}+\epsilon_{12}

    1. direct preferences
    2. disutility associated with differences in the characteristics between the two potential partners
    3. network effect: 对方的好友数以及和对方属于几度好友
  1. 第t期,用户i和用户j是否要结为朋友,从效用函数的角度出发需要满足以下条件,Dt,ij=1 if Ui(jX,C,Dt1,t)0, and Ui(jX,C,Dt1,t)0D_{t, i j}=1 \text { if } U_{i}\left(j \mid \mathbf{X}, \mathbf{C}, \mathbf{D}_{t-1}, t\right) \geq 0, \text { and } U_{i}\left(j \mid \mathbf{X}, \mathbf{C}, \mathbf{D}_{t-1}, t\right) \geq 0

互动环节: 在一个婚恋市场中,这个条件可以被放宽成什么呢?

Dataset:

本文拿到了一个高中669个学生之间的朋友关系数据,以及他们的一些人口共统计学特征,包括年龄、性别、学习成绩、对于体育的参与程度、以及参与的课程

求解:

我们可以得到一个很复杂的似然函数,通过MCMC得到了以下的参数估计

互动环节: 这些参数估计可以得出什么结论?

文献二:强弱社交关系的价值

背景:

大量文献都论证了基于社交关系的推荐方法能够为冷启问题提供很大的帮助,进而极大地提高预测准确性。其直觉是,通过信任和影响,用户更有可能对其社交网络中的“朋友”所消费的物品产生亲和力。但之前很少有人关注到强关系和弱关系之间的重要区别。

  • 社会学的相关研究发现:弱社交关系在扩张社交网络上有着重大重用

    • Granovetter introduces different types of social ties (strong, weak, and absent), and concludes that weak ties are actually the most important reason for new information or innovations to spread over social networks.
    • Granovetter reports that many job seekers find out useful information about new jobs through personal contacts. Perhaps surprisingly, many of those personal contacts are acquaintances (weak ties) as opposed to close friends (strong ties)

本文通过将强弱社交关系引入The Bayesian Personalized Ranking (BPR)框架得到了一个预测准确度更高的模型。

Read if interested: www.cnblogs.com/pinard/p/91… for BPR

模型

直观想法:聚类

对于强弱社交关系的划分,比较直接的想法是是依赖聚类。将网络划分为几个子图。如果u和v属于同一个子图,那么它就被归为强联系;否则为弱联系。尽管我们有许多这样的社区检测聚类算法,但并没有统一的黄金标准,同时如果产生一个 "坏 "的划分,并交给推荐系统作为输入,那么推荐系统将很难恢复。换句话说,推荐的质量将取决于外在的社区检测算法,而推荐系统本身没有控制权,这是不可取的。

替代方案:node-similarly metrics

Strength(u,v)=defNuNvNuNv(Jaccard)\operatorname{Strength}(u, v)=\operatorname{def} \frac{\left|\mathcal{N}_{u} \cap \mathcal{N}_{v}\right|}{\left|\mathcal{N}_{u} \cup \mathcal{N}_{v}\right|} (Jaccard)

给定两位用户u和v, 他们的Jaccard系数等于随机抽取的u关系对中的一条恰好也属于v关系对中的概率。这种node-similarly metrics是出于以下考虑:

  • 纽带强度部分地由局部的网络结构决定;
  • 两个用户之间的联系越强,他们的朋友就越重合;
  • 与互动频率不同,节点相似性指标是网络的内在因素,不需要额外的计算。

判断关系强弱的临界值可以被当作变量纳入模型中去学习

强弱关系在 Bayesian Personalized Ranking中的应用

Consumed Items.

Joint-Tie-Consumed (JTC) Items.

Strong-Tie-Consumed (STC) Items.

Weak-Tie-Consumed (WTC) Items.

Non-Consumed Items.

互动环节: how to order?

互动环节: 对于抖音端内的视频消费上强弱关系有无继续挖掘发挥潜力的空间?