深度学习推荐模型综合对比,发展时间线及论文

179 阅读6分钟

深度学习推荐模型综合对比

通过表格梳理各个经典深度学习推荐模型的核心思想、特点以及局限性。通过对比各模型在「思想层面的传承与突破」,帮助构建深度学习推荐系统的发展脉络。

模型名称基本原理(思想)特点局限性
协同过滤根据用户的历史行为生成「用户-物品」共现矩阵,利用用户相似性物品相似性进行推荐原理简单,直接,应用广泛泛化能力差,处理稀疏矩阵的能力差,推荐结果的头部效应较明显
矩阵分解将协同过滤算法中的共现矩阵分解为用户矩阵和物品矩阵,利用用户隐向量和物品「隐向量」的内积进行排序并推荐相较协同过滤,泛化能力有所加强,对稀疏矩阵的处理能力有所增强除了用户历史行为数据,难以利用其他用户、物品特征及上下文特征
逻辑回归将推荐问题转换成类似CTR预估的「二分类」问题,将用户、物品、上下文等不同特征转换成特征向量,输入逻辑回归模型,得到CTR预估值,再按照预估的CTR进行排序并推荐能够融合多种类型的不同特征不具备特征组合的能力,表达能力较差
FM
因子分解机
逻辑回归的基础上,加入「二阶特征交叉」部分,为每一维特征训练得到相应特征隐向量,通过隐向量间的内积运算得到交叉特征权重相比逻辑回归,具备了二阶特征交叉能力,模型的表达能力增强由于组合爆炸问题的限制,模型不易扩展到三阶特征交叉阶段
FFM在FM模型的基础上,加入“特征域”的概念,使每个特征在与不同域的特征交叉时采用不同的隐向量相比FM模型,进一步加强特征交叉的能力模型的训练开销达到O(n2)O(n^2)量级,训练开销较大
AutoRec基于自编码器,对用户或者物品进行编码,利用自编码器的泛化能力进行推荐单隐层神经网络结构简单,可实现快速训练和部署表达能力较差
DeepCrossing利用“Embedding层+多隐层+输出层”的经典深度学习框架,完成特征的「自动深度交叉」经典深度学习推荐模型框架利用全连接隐层进行特征交叉,针对性不强
NeuralCF将传统的矩阵分解中用户向量和物品向量的点积操作,换成由神经网络代替的「互操作」表达能力加强版的矩阵分解模型只使用了用户和物品的ID特征,没有加入更多其他特征
Two-Towers
双塔模型
由用户塔和物品塔组成,用户塔融合所有用户特征生成用户Embedding,物品塔融合所有物品特征生成物品Embedding,通过点积或神经网络融合两塔得到Embedding并得到最终得分模型结构简单,便于工程化实现与线上部署,应用广泛用户特征和物品特征无法进行特征交叉,无法融入其他特征,比如上下文特征
Wide&Deep利用Wide部分加强模型的记忆能力,利用Deep部分加强模型的泛化能力开创了组合模型的构造方式,对深度学习推荐模型的后续发展具有重大影响Wide部分需要人工筛选特征组合
Deep&Cross用Cross网络替代Wide&Deep模型中的Wide部分解决了Wide&Deep模型人工组合特征的问题Cross网络的复杂度较高
DeepFM在Wide&Deep模型的基础上,用FM替代原来的线性Wide部分加强了Wide部分的特征交叉能力与经典的Wide&Deep模型相比,结构差别不明显
NFM神经网络代替FM中二阶隐向量交叉的操作相比FM,NFM的表达能力和特征交叉能力更强与PNN模型的结构非常相似
AFM基于FM,在二阶隐向量交叉的基础上对每个交叉结果加入了「注意力」得分,并使用注意力网络学习注意力得分不同交叉特征的重要性不同没有在计算注意力得分的过程中引入候选物品的影响
DIN在传统深度学习推荐模型的基础上引入「注意力」机制,并利用「用户历史行为」物品和目标广告物品的相关性计算注意力得分根据目标广告物品的不同,进行更有针对性的推荐并没有充分利用除历史行为以外的其他特征
DIEN将序列模型与深度学习推荐模型结合,使用序列模型模拟用户的「兴趣进化过程」序列模型增强了系统对用户兴趣变迁的表达能力,使推荐系统开始考虑时间相关的行为序列中包含的有价值信息序列模型的训练复杂,线上服务的延迟较长,需要进行工程上的优化
TransAct基于Transformer构建的序列推荐模型,将用户行为分成长期兴趣和实时兴趣部分长期兴趣部分「天级」更新(离线),实时兴趣部分「实时」预估(在线),兼顾模型优化和工程部署的要求模型结构复杂,不同结构的更新频率不同、部署方式不同,工程实现难度较大
DRN将「强化学习」的思路应用于推荐系统,进行推荐模型的线上实时学习和更新模型对数据实时性的利用能力大大加强线上部分较复杂,工程实现难度较大

推荐模型发展时间线

image.png

部分论文原文

模型名称论文
协同过滤
矩阵分解
逻辑回归
FM因子分解机
FFM[1701.04099] Field-aware Factorization Machines in a Real-world Online Advertising System
AutoRec[2007.07224] AutoRec: An Automated Recommender System
Deep Crossing
NeuralCF[1708.05031] Neural Collaborative Filtering
Two-Towers-
Wide&Deep[1606.07792] Wide & Deep Learning for Recommender Systems
Deep&Cross[1708.05123] Deep & Cross Network for Ad Click Predictions
DeepFM[1703.04247] DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
NFM[1708.05027] Neural Factorization Machines for Sparse Predictive Analytics
AFM[1708.04617] Attentional Factorization Machines: Learning the Weight of Feature Interactions via Attention Networks
DIN[1706.06978] Deep Interest Network for Click-Through Rate Prediction
DIEN[1809.03672] Deep Interest Evolution Network for Click-Through Rate Prediction
TransAct[2306.00248] TransAct: Transformer-based Realtime User Action Model for Recommendation at Pinterest

Reference

《深度学习推荐系统2.0》王喆