腾讯/字节核心业务,岗位需求量大
核心内容:
-
推荐系统全链路
- 召回/粗排/精排/重排
- 多目标优化(CTR/CVR/时长)
- 冷启动与探索利用
-
深度学习推荐模型
- DIN、DIEN、DCN系列
- 序列建模(GRU4Rec、SASRec)
- 图神经网络应用
-
大模型在推荐中的应用
- LLM做推荐的新范式
- User/Item Embedding生成
- Prompt-based推荐
-
广告算法
- eCPM计算与出价策略
- 强化学习在广告中的应用
- 反作弊技术
3.1 推荐系统基础 (1-15题)
- 推荐系统的召回、粗排、精排、重排分别是干什么的?
- 为什么要分这么多层?直接精排不行吗?
- 协同过滤(Collaborative Filtering)是什么?User-based和Item-based有什么区别?
- 矩阵分解(Matrix Factorization)怎么做推荐?SVD和ALS有什么区别?
- 什么是冷启动问题?新用户、新物品怎么推荐?
- 内容推荐(Content-based)和协同过滤各有什么优缺点?
- 什么是探索与利用(Exploration vs Exploitation)?怎么平衡?
- 推荐系统里的EE问题怎么解决?ε-greedy、UCB、Thompson Sampling有什么区别?
- 什么是召回率(Recall)和精确率(Precision)?推荐系统更看重哪个?
- 推荐系统怎么做AB测试?线上指标有哪些?
- 什么是漏斗转化?从曝光到点击到转化怎么优化?
- 推荐系统的多样性(Diversity)怎么衡量?怎么避免推荐结果太单一?
- 什么是信息茧房?推荐系统怎么平衡个性化和多样性?
- 推荐系统的实时性怎么保证?用户刚点了一个视频,下一刷能推相似的吗?
- 什么是位置偏差(Position Bias)?越靠前的推荐位置点击率越高怎么办?
3.2 深度学习推荐模型 (16-35题)
- Wide & Deep模型的思想是什么?Wide部分和Deep部分各记什么?
- DeepFM相比Wide & Deep有什么改进?FM层是怎么工作的?
- DIN(Deep Interest Network)是怎么建模用户兴趣的?Attention机制怎么用?
- DIEN(Deep Interest Evolution Network)比DIN强在哪?怎么建模兴趣演化?
- DCN(Deep & Cross Network)的Cross层是干什么的?怎么做特征交叉?
- xDeepFM的CIN(Compressed Interaction Network)有什么特点?
- AutoInt模型怎么用Multi-Head Attention做特征交叉?
- 什么是NFM(Neural Factorization Machine)?怎么结合FM和DNN?
- AFM(Attentional Factorization Machine)的Attention在哪里?
- FiBiNET的双线性交互(Bilinear Interaction)是什么?
- 推荐模型里的Embedding层是干什么的?怎么训练Embedding?
- 类别特征怎么处理?One-hot编码、Entity Embedding哪个更好?
- 连续特征怎么离散化?分桶(Bucketing)有什么技巧?
- 特征交叉为什么重要?手工交叉和自动交叉有什么区别?
- 推荐模型的Negative Sampling怎么做?随机负采样够吗?
- 什么是曝光去偏(Exposure Debiasing)?怎么处理没曝光的物品?
- Batch Normalization在推荐模型里怎么用?和CV领域有什么不同?
- Dropout在推荐模型里有用吗?过拟合怎么防?
- 推荐模型的损失函数怎么选?Cross Entropy、MSE、Focal Loss有什么区别?
- 多目标学习怎么做?点击、收藏、转化能一起优化吗?
3.3 序列推荐与用户建模 (36-50题)
- 什么是序列推荐?和传统推荐有什么区别?
- GRU4Rec是怎么用RNN做推荐的?为什么要用GRU?
- Caser(Convolutional Sequence Embedding)怎么用CNN建模序列?
- SASRec(Self-Attentive Sequential Recommendation)的Transformer怎么用?
- BERT4Rec和SASRec有什么区别?双向和单向建模各有什么优缺点?
- 用户的短期兴趣和长期兴趣怎么建模?
- Session-based推荐是什么?和User-based推荐有什么区别?
- 用户画像(User Profile)包括哪些?怎么构建?
- 什么是实时用户兴趣?怎么捕捉用户的即时意图?
- 用户行为序列很长怎么办?怎么筛选关键行为?
- 什么是目标注意力(Target Attention)?DIN里是怎么用的?
- 用户的负反馈(不感兴趣、踩)怎么利用?
- 用户行为序列里的噪声怎么过滤?误点怎么处理?
- 多行为推荐(点击、购买、收藏)怎么做?不同行为的权重怎么定?
- 跨域推荐(Cross-domain Recommendation)是什么?怎么迁移知识?
3.4 图神经网络推荐 (51-60题)
- 图神经网络(GNN)怎么用在推荐系统里?
- LightGCN相比传统GCN做了什么简化?为什么推荐场景不需要特征变换?
- PinSage是怎么在大规模图上做推荐的?Pinterest的实践经验是什么?
- 社交推荐(Social Recommendation)怎么利用社交关系图?
- 知识图谱怎么增强推荐?实体和关系怎么建模?
- 异构图(Heterogeneous Graph)在推荐里怎么用?User、Item、Tag怎么连接?
- 图采样(Graph Sampling)怎么做?怎么在大图上高效训练?
- 随机游走(Random Walk)在推荐里有什么用?Node2Vec怎么生成Embedding?
- 图卷积(Graph Convolution)的聚合方式有哪些?Mean、Sum、Attention哪个更好?
- GNN推荐模型的Over-smoothing问题是什么?怎么解决?
3.5 大模型在推荐中的应用 (61-75题)
- 大模型能直接做推荐吗?和传统推荐模型有什么区别?
- LLM做推荐的范式有哪些?Prompt-based、Embedding-based、Fine-tuning?
- 怎么用大模型生成推荐理由?解释性推荐怎么做?
- 大模型能理解用户的隐式偏好吗?怎么从对话中挖掘兴趣?
- 怎么用LLM做冷启动?新用户对话几轮就能推荐吗?
- 大模型的Embedding能直接用在推荐里吗?效果怎么样?
- 怎么用大模型做个性化重排序?
- 大模型做推荐的成本怎么控制?推理太慢怎么办?
- 推荐系统怎么结合大模型的常识推理能力?
- ChatRec、RecLLM这些工作有什么启发?
- 大模型能做多轮对话式推荐吗?怎么维护对话上下文?
- 怎么用大模型生成推荐的训练数据?Data Augmentation怎么做?
- 大模型能做A/B测试的自动分析吗?
- 推荐系统的Prompt怎么设计?怎么把用户历史行为融入Prompt?
- 大模型时代,推荐算法工程师还需要什么技能?
3.6 广告算法与实时竞价 (76-80题)
- 广告推荐和内容推荐有什么区别?eCPM是怎么计算的?
- CTR预估和CVR预估有什么区别?转化率怎么建模?
- 什么是全链路预估?从点击到转化的多阶段怎么建模?
- 实时竞价(RTB)是怎么工作的?出价策略怎么优化?
- 强化学习在广告算法里怎么用?长期收益怎么建模?