| 协调过滤 CF | 根据用户的历史,生成 用户-物品 的共现矩阵,利用用户相似性和物品相似性进行推荐 | 简单,直接 | 泛化、处理稀疏矩阵能力差,具有热点效应 |
| 矩阵分解 MF | 将协同算法的共现矩阵分解为用户矩阵和物品矩阵,利用用户隐向量 和 物品隐向量的内积进行排序 | 泛化、处理稀疏矩阵能力增强 | 除了用户历史行为难以利用用户、物品和上下文等特征 |
| 逻辑回归 LR | 将推荐问题转化为类似CTR 二分类问题,将用户、物品和上下文等不同特征转化为特征向量,归1后后输入逻辑回归模型得到CTR 预估,再根据CTR预估排序 | 融合多种不同特征 | 不具备特征组合能力,表达能力查 |
| 因子分解机模型 FM | 在LR的基础上,在模型中加入二阶特征交叉部分,为每一位特征训练得到相应的隐向量,通过尹隐向量间的内积运算得到交叉特征权重 | 相比LR,具备二阶交叉能力,表达力强 | 组合爆炸,不能扩张到3阶交叉 |
| 因子分解机模型 FMM | 在FM的基础上,加入特征域概念,使每个特征在与不同域的特征交叉时采用不同隐向量 | 相比FM比,加强特征交叉能力,表达力加强 | 开销O(n平方),变大 |
| 梯度提升决策树 + 逻辑回归 GBDT + LR | 在利用GBDT“自动化”特征组合,将原始特征向量转化为离散型特征向量,并输入逻辑回归,得到CTR预估 | 特征工程模型化,使得模型具备了更高阶特征组合能力 | GBDT 无法进行完全并行训练,更新所需的训练时长较长 |
| 大规模分段线性模型 LS-PLM | 样本进行“分片”,在每个分片内LR,将每个样本分片的概率与LR得分进行加权平均,得到最终的预估值 | 模型结构类似三层神经网络,具备了较强的表达能力 | 相对深度学习模型简单,有进一步提高的空间 |