2025秋招AI热题：推荐与搜索算法TOP80

飞哥的AI笔记

2025-10-08 289 阅读6分钟

腾讯/字节核心业务，岗位需求量大

核心内容：

推荐系统全链路
- 召回/粗排/精排/重排
- 多目标优化（CTR/CVR/时长）
- 冷启动与探索利用
深度学习推荐模型
- DIN、DIEN、DCN系列
- 序列建模（GRU4Rec、SASRec）
- 图神经网络应用
大模型在推荐中的应用
- LLM做推荐的新范式
- User/Item Embedding生成
- Prompt-based推荐
广告算法
- eCPM计算与出价策略
- 强化学习在广告中的应用
- 反作弊技术

3.1 推荐系统基础 (1-15题)

推荐系统的召回、粗排、精排、重排分别是干什么的？
为什么要分这么多层？直接精排不行吗？
协同过滤（Collaborative Filtering）是什么？User-based和Item-based有什么区别？
矩阵分解（Matrix Factorization）怎么做推荐？SVD和ALS有什么区别？
什么是冷启动问题？新用户、新物品怎么推荐？
内容推荐（Content-based）和协同过滤各有什么优缺点？
什么是探索与利用（Exploration vs Exploitation）？怎么平衡？
推荐系统里的EE问题怎么解决？ε-greedy、UCB、Thompson Sampling有什么区别？
什么是召回率（Recall）和精确率（Precision）？推荐系统更看重哪个？
推荐系统怎么做AB测试？线上指标有哪些？
什么是漏斗转化？从曝光到点击到转化怎么优化？
推荐系统的多样性（Diversity）怎么衡量？怎么避免推荐结果太单一？
什么是信息茧房？推荐系统怎么平衡个性化和多样性？
推荐系统的实时性怎么保证？用户刚点了一个视频，下一刷能推相似的吗？
什么是位置偏差（Position Bias）？越靠前的推荐位置点击率越高怎么办？

3.2 深度学习推荐模型 (16-35题)

Wide & Deep模型的思想是什么？Wide部分和Deep部分各记什么？
DeepFM相比Wide & Deep有什么改进？FM层是怎么工作的？
DIN（Deep Interest Network）是怎么建模用户兴趣的？Attention机制怎么用？
DIEN（Deep Interest Evolution Network）比DIN强在哪？怎么建模兴趣演化？
DCN（Deep & Cross Network）的Cross层是干什么的？怎么做特征交叉？
xDeepFM的CIN（Compressed Interaction Network）有什么特点？
AutoInt模型怎么用Multi-Head Attention做特征交叉？
什么是NFM（Neural Factorization Machine）？怎么结合FM和DNN？
AFM（Attentional Factorization Machine）的Attention在哪里？
FiBiNET的双线性交互（Bilinear Interaction）是什么？
推荐模型里的Embedding层是干什么的？怎么训练Embedding？
类别特征怎么处理？One-hot编码、Entity Embedding哪个更好？
连续特征怎么离散化？分桶（Bucketing）有什么技巧？
特征交叉为什么重要？手工交叉和自动交叉有什么区别？
推荐模型的Negative Sampling怎么做？随机负采样够吗？
什么是曝光去偏（Exposure Debiasing）？怎么处理没曝光的物品？
Batch Normalization在推荐模型里怎么用？和CV领域有什么不同？
Dropout在推荐模型里有用吗？过拟合怎么防？
推荐模型的损失函数怎么选？Cross Entropy、MSE、Focal Loss有什么区别？
多目标学习怎么做？点击、收藏、转化能一起优化吗？

3.3 序列推荐与用户建模 (36-50题)

什么是序列推荐？和传统推荐有什么区别？
GRU4Rec是怎么用RNN做推荐的？为什么要用GRU？
Caser（Convolutional Sequence Embedding）怎么用CNN建模序列？
SASRec（Self-Attentive Sequential Recommendation）的Transformer怎么用？
BERT4Rec和SASRec有什么区别？双向和单向建模各有什么优缺点？
用户的短期兴趣和长期兴趣怎么建模？
Session-based推荐是什么？和User-based推荐有什么区别？
用户画像（User Profile）包括哪些？怎么构建？
什么是实时用户兴趣？怎么捕捉用户的即时意图？
用户行为序列很长怎么办？怎么筛选关键行为？
什么是目标注意力（Target Attention）？DIN里是怎么用的？
用户的负反馈（不感兴趣、踩）怎么利用？
用户行为序列里的噪声怎么过滤？误点怎么处理？
多行为推荐（点击、购买、收藏）怎么做？不同行为的权重怎么定？
跨域推荐（Cross-domain Recommendation）是什么？怎么迁移知识？

3.4 图神经网络推荐 (51-60题)

图神经网络（GNN）怎么用在推荐系统里？
LightGCN相比传统GCN做了什么简化？为什么推荐场景不需要特征变换？
PinSage是怎么在大规模图上做推荐的？Pinterest的实践经验是什么？
社交推荐（Social Recommendation）怎么利用社交关系图？
知识图谱怎么增强推荐？实体和关系怎么建模？
异构图（Heterogeneous Graph）在推荐里怎么用？User、Item、Tag怎么连接？
图采样（Graph Sampling）怎么做？怎么在大图上高效训练？
随机游走（Random Walk）在推荐里有什么用？Node2Vec怎么生成Embedding？
图卷积（Graph Convolution）的聚合方式有哪些？Mean、Sum、Attention哪个更好？
GNN推荐模型的Over-smoothing问题是什么？怎么解决？

3.5 大模型在推荐中的应用 (61-75题)

大模型能直接做推荐吗？和传统推荐模型有什么区别？
LLM做推荐的范式有哪些？Prompt-based、Embedding-based、Fine-tuning？
怎么用大模型生成推荐理由？解释性推荐怎么做？
大模型能理解用户的隐式偏好吗？怎么从对话中挖掘兴趣？
怎么用LLM做冷启动？新用户对话几轮就能推荐吗？
大模型的Embedding能直接用在推荐里吗？效果怎么样？
怎么用大模型做个性化重排序？
大模型做推荐的成本怎么控制？推理太慢怎么办？
推荐系统怎么结合大模型的常识推理能力？
ChatRec、RecLLM这些工作有什么启发？
大模型能做多轮对话式推荐吗？怎么维护对话上下文？
怎么用大模型生成推荐的训练数据？Data Augmentation怎么做？
大模型能做A/B测试的自动分析吗？
推荐系统的Prompt怎么设计？怎么把用户历史行为融入Prompt？
大模型时代，推荐算法工程师还需要什么技能？

3.6 广告算法与实时竞价 (76-80题)

广告推荐和内容推荐有什么区别？eCPM是怎么计算的？
CTR预估和CVR预估有什么区别？转化率怎么建模？
什么是全链路预估？从点击到转化的多阶段怎么建模？
实时竞价（RTB）是怎么工作的？出价策略怎么优化？
强化学习在广告算法里怎么用？长期收益怎么建模？