AdaSIR:通过重要性重采样学习推荐用于隐式反馈

428 阅读1分钟
论文题目: Learning Recommenders for Implicit Feedback with Importance Resampling[1]^{[1]}
论文来源: WWW2022
论文代码: AdaSIR
一、Motivation

问题:捕捉用户的隐式反馈可以有效地帮助模型学习更好的用户表示,但是因为曝光给用户的item是很少的,所以会遭遇缺乏负样本的问题。 已有的负采样方法:静态的(均匀采样、流行度采样)效果不好,自适应的(two-parts:embedding相似度,对抗生成式负采样)消耗时间。 提出一种基于重要性重采样的自适应采样方法(效果好并且高效)。

First, how do these samplers approximate the softmax distribution? Second, what is the probability of each item being sampled? The probability can play an important part in correcting the bias of the sampling distribution from softmax.

二、Method Overview

image.png 如上图所示,该模型主要包含两个部分,第一部分是通过流行度采样或者随机采样采样一部分数据;第二部分是通过构建一个池化池子,每次有放回的重采样采样一部分数据放入池子中。

image.png

image.png

三、Performance

image.png

实验结果表明了该方法的优越性,其在三个数据集上都有一定程度的提升。

image.png

上述实验表明其在效率上与baseline相比也有比较好的可比较性。

四、References

[1] Chen, Jin, et al. "Learning Recommenders for Implicit Feedback with Importance Resampling." Proceedings of the ACM Web Conference 2022. 2022.