Page-level Optimization of e-Commerce Item Recommendations 论文阅读

157 阅读5分钟

Page-level Optimization of e-Commerce Item Recommendations

一,背景

原文链接:arxiv.org/abs/2108.05…
论文来源:recSys2021
论文简介:论文研究的场景是“产品详情页”(item details pages, IDP),在产品详情的下面,用户也可以看到很多推荐模块(槽位),每个模块内展示一些相关推荐item。以往的算法聚焦在槽位内部的产品推荐,其背后可能有很复杂的推荐算法。本文主要研究推荐模块(槽位)的页面级优化问题。由于槽位的出现及顺序往往服务于客户策划和静态配置、忽略了个性化的机会。因此,该论文提出,以“网页页面”为优化单元,综合考虑用户偏好还有top-down展示的modules之间的关系,展示最符合用户购买意图的模块组合,吸引用户发生点击和购买行为,提高电商系统详情页的推荐效率。其提到的推荐场景和主页推荐、结算页推荐很相似,基本框架如下图: image.png

二,相关工作

相关工作就是在一个页面上进行模块选择并把他们排序的问题。工业界已经有一些解法,相关方法如:

  1. 建模成一个point-wise的问题。这种方法因为没有考虑到模块之间的关系,很容易得到次优解。
  2. 组合推荐。每种展示组合成为一种候选,从中选择最优展示组合。这种比较费资源,复杂度也相应提高。
  3. 作者提出,可以将页面优化问题转化为一个序列排序问题。RNN比较适合这个场景,因为页面的设计是top-down结构,用户也都是从上到下浏览。因此,文章提出了一个两阶段的RNN模型(简写为TRNN),该模型对用户点击(ctr)和购买(ptr)概率进行建模。同时,线上推理时,为解决组合复杂性高的问题,通过贪心选取,保证了每个模块的选择都是基于前序模块展现下的最优结果;通过定向搜索,保证了模块展示的多样性、避免陷入局部最优。

三,模型

image.png

3.1 数据获取

1. 基于汤普森采样,生成训练样本
文中提到训练模型需要用数据,但由于槽位的现状是依赖固定配置,因此论文需要使用explore数据来作为训练样本。但若是随机流量,可能对业务指标产生影响产生负向影响,因此使用了汤普森采样来产生训练样本。汤普森采样的具体做法是维护了beta分布的两个超参,来平衡探索和利用的关系。
image.png 其中,r服从beta分布,其两个超参α,β\alpha, \beta由用户历史点击量和浏览量进行一定缩放得到。

2. 根据用户购买意图,为点击样本加权
基本思路即将用户的点击、购买行为按时间关系排排队,并按购买截断生成session。每个session中的点击行为按照和购买行为发生时间的先后关系赋权。这样模型预估时,能够更加考虑用户购买意图。 image.png

3. 修正槽位位置偏置
同一个物料处于不同的位置,用户可能有不同的点击概率。因此,使用了一个基于位置的点击模型来消除槽位位置偏置。(为此还进行了随机替换槽位的流量实验,基于实验数据进行了槽位偏置的建模)因此,用户点击某模块的概率可以被拆分成: image.png
但由于P(yc=1m)P(y_c=1|m)很难计算出来,因此,将这种方式转化成各位置相对于1位置的点击倾向性。并且基于这个倾向性,在训练时将IPS乘在loss中。 image.png

3.2 两阶段模型

image.png 模型整体结构如上图,分成了两个阶段,细拆来看并不复杂:
阶段1是将hero item和已经产生的推荐模块作为页面环境信息(x),输入一个LSTM。
阶段2是将LSTM产出的结果和当前模块信息作融合,最后经过MLP产出预估值。整体的结构可以简述为,模型参考了页面已有的模块信息,对当前模块的点击或购买行为进行预估,隐形的考虑了modules之间的关系。如下: image.png

3.3 定向搜索

这里没有太明白。先把原文粘贴上来吧
image.png image.png

四,离线指标

  1. TRNN、TRNN + IPS vs baseline image.png

  2. 模型加入用户个性化特征 image.png

  3. 多任务、多任务loss使用自适应loss调权 image.png

五,在线指标

  1. 四中提到的三种模型,进行线上实验时的AB指标 image.png
  2. 上文中提到使用汤普森采样得到的数据来训练模型,相比于随机流量,也取得了AB指标的提升;另外是,由于很多候选modules可能属于同一类群,那么作者提到,对于同一类modules设计策略不让他们顺次展现(丰富展现多样性),相对于纯汤普森采样,也能带来AB指标提升
    image.png
  3. 上文中提到使用定向搜索,也取得了AB指标的提升
    image.png