Wellness Representation of Users in Social Media:

198 阅读2分钟

小知识,大挑战!本文正在参与“      程序员必备小知识      ”创作活动

本文同时参与 「掘力星计划」      ,赢取创作大礼包,挑战创作激励金

意义介绍:

社交媒体的日益流行鼓励健康消费者在社交网络上分享、探索和验证健康和健康信息,社交网络提供了丰富的患者生成健康数据 (PGWD) 存储库。虽然数据驱动的医疗保健已经吸引了学术界和工业界通过个性化医疗改善医疗服务的大量关注,但对收获和利用社交网络上可用的 PGWD 的研究有限。最近,表征学习已被广​​泛应用于许多应用程序中来学习用户的低维嵌入。然而,现有的表征学习方法并不直接适用于 PGWD,因为其领域性质具有观察数据的纵向性、不完整性和稀疏性以及患者群体的异质性。为了解决这些问题,我们提出了一种直接从用户的纵向数据中学习嵌入的方法,而不是基于向量的表示。特别是,我们同时学习了低维潜在空间以及健康空间中用户的时间演变。所提出的方法考虑了两种类型的健康先验知识:(1)健康属性的时间进展; (2) 患者群体中健康属性的异质性。我们的方法可以很好地扩展到使用并行随机梯度下降的大型数据集。我们进行了广泛的实验来评估我们的框架在解决健康领域的三个主要任务方面:属性预测、成功预测和社区检测。两个真实世界数据集的实验结果证明了我们的方法在学习有效用户表示方面的能力。

主要贡献: 我们为社交网络中可用的纵向健康数据提出了一种表示学习方法。 具体来说,我们将纵向 PGWD 分解为健康潜在空间和该空间中用户的时间进展。

我们利用同质群体内的一致性以及异质群体之间的区别来学习用于嵌入用户的共享和个性化潜在空间。

我们在学习过程中结合了健康数据的时间进展先验,以解决因数据缺失和稀疏而引起的问题。