Leaving No One Behind: A Multi-Scenario Multi-Task Meta Learning Approach

399 阅读3分钟

Leaving No One Behind: A Multi-Scenario Multi-Task Meta Learning Approach for Advertiser Modeling

一,背景

像淘宝和亚马逊这种电商平台上,广告主扮演着很重要的角色。然而以往对他们的研究并不多。 电商平台会提供多种营销场景(搜索赞助、直播广告、展示广告等),同时广告主也会有涉及诸多任务(预估收入、支出、点击和活跃率等)。因此,本文面临的业务背景是大型推荐系统内的多场景+多任务的推荐。 image.png

二,方案

针对这种多场景+多任务的推荐,本文给出一个解决方案M2M。整体来讲是 MMoE + Dynamic weight。通过一个元单元,有效的根据不同场景,自适应的调整参数(和之前读的文章APG有些相似)。

三,框架

image.png

框架基本包括三部分:

  • step 1: 骨干网络。这里是把输入特征做成统一表示,等同于MMoE中的share bottom部分。这里主要是学习和广告主相关的特征与任务的表征。
  • step 2: 元学习机制。为了有效地端到端结合多场景多任务,提出了一种元学习机制。该机制中包括了元注意力模块和元塔模块。分别用于捕获不同场景-任务相关性,增强场景-任务特征表示。
  • step 3: 利用多任务联合泊松损失对模型进行端到端优化。

3.1 骨干网络 backbone network

在backbone network中,shared bottom embedding,transformer layer, expert view都是传统常用的结构;
task view这里,作者讲到是受到MRAN(没读过)启发,用到task encoding的原因是引入任务的一些先验信息,影响特征信息的权重表达,有点“锚点”的意味。 image.png

3.2 元学习机制 meta learning mechanism

image.png

  • 首先,M2M实现了通用模块Meta Unit。这个模块根据“场景”特征,动态生成权重,再reshape成一个MLP。
  • 在整合多个expert的输出时,用Meta Unit代替普通MLP实现Attention决定各expert的权重,让“场景”特征主导多目标的信息整合;
  • 在整合后的expert信息向上传递时,用Meta Unit代替普通MLP实现Residual Network,让“场景”特征控制信息传递。
  1. meta unit 的公式推导: image.png

  2. meta attention module: 给定场景相关信息的情况下,建立不同模式的注意得分模型 image.png

  3. meta tower module: 由于特定任务的特征模式可能因场景的不同而不同,简单的共享前馈网络不足以捕获不同场景的信息。为了模拟这种多样性,我们引入了meta残塔模块 image.png image.png

四,实验

4.1 数据

image.png 预估了5个场景下的多个任务(PV、点击、活跃率、支出、GMV)

4.2 离线实验指标:

SMAPE、NMAE
image.png image.png image.png

4.3 消融实验

image.png image.png

4.4 在线实验指标

image.png

附录

  1. 动态权重:推荐算法的新范式 blog.csdn.net/Kaiyuan_sjt…
  2. APG论文 juejin.cn/post/718405…
  3. M2M论文解读 zhuanlan.zhihu.com/p/496820123
  4. M2M论文解读 zhuanlan.zhihu.com/p/464583935