本项目来源于深度学习乐园。如果你想要完整项目资料包,点击这里下载: pan.baidu.com/s/1-vA1Gce4…
1. 模型架构
本项目采用的是DeepFM模型,其结构结合了FM(因子分解机)与深度神经网络(DNN),实现了低阶与高阶特征交互的有效建模。模型分为以下几层:
1.1 FM部分(因子分解机层)
FM层主要用于建模稀疏特征的低阶交互,其数学公式如下:
- 一阶部分(线性模型):
- 其中,wi是线性权重,xi是输入特征。
- 二阶部分(特征交互部分):
- 其中,vi 和 vj 是特征嵌入向量,表示特征间的隐式交互,⟨vi,vj⟩ 是向量的内积,用于捕捉特征之间的低阶关系。
1.2 DNN部分(深度神经网络层)
DNN部分用于捕捉高阶特征交互。输入特征首先通过嵌入层映射为低维稠密向量,然后输入深度神经网络。DNN部分的计算公式如下:
- 第一层全连接层:
- 其中,W1和 b1 是第一层的权重矩阵和偏置,x是输入的嵌入向量,ReLU是激活函数。
- 第二层全连接层:
- 类似地,W2和 b2 是第二层的权重矩阵和偏置。
- 输出层:
- 其中,σ是sigmoid激活函数,用于二分类预测。
1.3 DeepFM的融合
DeepFM模型将FM部分和DNN部分的输出进行融合,最终的输出为:
通过同时训练这三部分,模型能够同时捕捉到低阶和高阶特征交互。
2.1 训练流程
模型的训练流程包括以下步骤:
- 数据准备:对输入特征进行嵌入,并将稀疏特征转化为低维嵌入向量,同时将连续特征归一化。
- 前向传播:通过FM层和DNN层分别对低阶和高阶特征进行建模,并将两部分的结果结合起来,计算最终输出。
- 损失函数:使用二元交叉熵损失函数:
- 其中,yi是真实标签,yi^是模型预测的概率。
- 优化器:模型使用Adam优化器来更新参数,调整学习率以获得最佳收敛效果。
2.2 评估指标
- AUC(Area Under Curve) :AUC用于评估模型的分类能力。AUC值越接近1,表示模型的分类性能越好。模型通过回调函数监控验证集上的AUC,以确定模型性能并进行早停或调整学习率。
- 关于深度实战社区 我们是一个深度学习领域的独立工作室。团队成员有:中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等,曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝,拥有2篇国家级人工智能发明专利。 社区特色:深度实战算法创新 获取全部完整项目数据集、代码、视频教程,请点击下方名片