2025秋招AI热题:推荐与搜索算法TOP80

257 阅读6分钟

腾讯/字节核心业务,岗位需求量大

核心内容

  1. 推荐系统全链路

    • 召回/粗排/精排/重排
    • 多目标优化(CTR/CVR/时长)
    • 冷启动与探索利用
  2. 深度学习推荐模型

    • DIN、DIEN、DCN系列
    • 序列建模(GRU4Rec、SASRec)
    • 图神经网络应用
  3. 大模型在推荐中的应用

    • LLM做推荐的新范式
    • User/Item Embedding生成
    • Prompt-based推荐
  4. 广告算法

    • eCPM计算与出价策略
    • 强化学习在广告中的应用
    • 反作弊技术

3.1 推荐系统基础 (1-15题)

  1. 推荐系统的召回、粗排、精排、重排分别是干什么的?
  2. 为什么要分这么多层?直接精排不行吗?
  3. 协同过滤(Collaborative Filtering)是什么?User-based和Item-based有什么区别?
  4. 矩阵分解(Matrix Factorization)怎么做推荐?SVD和ALS有什么区别?
  5. 什么是冷启动问题?新用户、新物品怎么推荐?
  6. 内容推荐(Content-based)和协同过滤各有什么优缺点?
  7. 什么是探索与利用(Exploration vs Exploitation)?怎么平衡?
  8. 推荐系统里的EE问题怎么解决?ε-greedy、UCB、Thompson Sampling有什么区别?
  9. 什么是召回率(Recall)和精确率(Precision)?推荐系统更看重哪个?
  10. 推荐系统怎么做AB测试?线上指标有哪些?
  11. 什么是漏斗转化?从曝光到点击到转化怎么优化?
  12. 推荐系统的多样性(Diversity)怎么衡量?怎么避免推荐结果太单一?
  13. 什么是信息茧房?推荐系统怎么平衡个性化和多样性?
  14. 推荐系统的实时性怎么保证?用户刚点了一个视频,下一刷能推相似的吗?
  15. 什么是位置偏差(Position Bias)?越靠前的推荐位置点击率越高怎么办?

3.2 深度学习推荐模型 (16-35题)

  1. Wide & Deep模型的思想是什么?Wide部分和Deep部分各记什么?
  2. DeepFM相比Wide & Deep有什么改进?FM层是怎么工作的?
  3. DIN(Deep Interest Network)是怎么建模用户兴趣的?Attention机制怎么用?
  4. DIEN(Deep Interest Evolution Network)比DIN强在哪?怎么建模兴趣演化?
  5. DCN(Deep & Cross Network)的Cross层是干什么的?怎么做特征交叉?
  6. xDeepFM的CIN(Compressed Interaction Network)有什么特点?
  7. AutoInt模型怎么用Multi-Head Attention做特征交叉?
  8. 什么是NFM(Neural Factorization Machine)?怎么结合FM和DNN?
  9. AFM(Attentional Factorization Machine)的Attention在哪里?
  10. FiBiNET的双线性交互(Bilinear Interaction)是什么?
  11. 推荐模型里的Embedding层是干什么的?怎么训练Embedding?
  12. 类别特征怎么处理?One-hot编码、Entity Embedding哪个更好?
  13. 连续特征怎么离散化?分桶(Bucketing)有什么技巧?
  14. 特征交叉为什么重要?手工交叉和自动交叉有什么区别?
  15. 推荐模型的Negative Sampling怎么做?随机负采样够吗?
  16. 什么是曝光去偏(Exposure Debiasing)?怎么处理没曝光的物品?
  17. Batch Normalization在推荐模型里怎么用?和CV领域有什么不同?
  18. Dropout在推荐模型里有用吗?过拟合怎么防?
  19. 推荐模型的损失函数怎么选?Cross Entropy、MSE、Focal Loss有什么区别?
  20. 多目标学习怎么做?点击、收藏、转化能一起优化吗?

3.3 序列推荐与用户建模 (36-50题)

  1. 什么是序列推荐?和传统推荐有什么区别?
  2. GRU4Rec是怎么用RNN做推荐的?为什么要用GRU?
  3. Caser(Convolutional Sequence Embedding)怎么用CNN建模序列?
  4. SASRec(Self-Attentive Sequential Recommendation)的Transformer怎么用?
  5. BERT4Rec和SASRec有什么区别?双向和单向建模各有什么优缺点?
  6. 用户的短期兴趣和长期兴趣怎么建模?
  7. Session-based推荐是什么?和User-based推荐有什么区别?
  8. 用户画像(User Profile)包括哪些?怎么构建?
  9. 什么是实时用户兴趣?怎么捕捉用户的即时意图?
  10. 用户行为序列很长怎么办?怎么筛选关键行为?
  11. 什么是目标注意力(Target Attention)?DIN里是怎么用的?
  12. 用户的负反馈(不感兴趣、踩)怎么利用?
  13. 用户行为序列里的噪声怎么过滤?误点怎么处理?
  14. 多行为推荐(点击、购买、收藏)怎么做?不同行为的权重怎么定?
  15. 跨域推荐(Cross-domain Recommendation)是什么?怎么迁移知识?

3.4 图神经网络推荐 (51-60题)

  1. 图神经网络(GNN)怎么用在推荐系统里?
  2. LightGCN相比传统GCN做了什么简化?为什么推荐场景不需要特征变换?
  3. PinSage是怎么在大规模图上做推荐的?Pinterest的实践经验是什么?
  4. 社交推荐(Social Recommendation)怎么利用社交关系图?
  5. 知识图谱怎么增强推荐?实体和关系怎么建模?
  6. 异构图(Heterogeneous Graph)在推荐里怎么用?User、Item、Tag怎么连接?
  7. 图采样(Graph Sampling)怎么做?怎么在大图上高效训练?
  8. 随机游走(Random Walk)在推荐里有什么用?Node2Vec怎么生成Embedding?
  9. 图卷积(Graph Convolution)的聚合方式有哪些?Mean、Sum、Attention哪个更好?
  10. GNN推荐模型的Over-smoothing问题是什么?怎么解决?

3.5 大模型在推荐中的应用 (61-75题)

  1. 大模型能直接做推荐吗?和传统推荐模型有什么区别?
  2. LLM做推荐的范式有哪些?Prompt-based、Embedding-based、Fine-tuning?
  3. 怎么用大模型生成推荐理由?解释性推荐怎么做?
  4. 大模型能理解用户的隐式偏好吗?怎么从对话中挖掘兴趣?
  5. 怎么用LLM做冷启动?新用户对话几轮就能推荐吗?
  6. 大模型的Embedding能直接用在推荐里吗?效果怎么样?
  7. 怎么用大模型做个性化重排序?
  8. 大模型做推荐的成本怎么控制?推理太慢怎么办?
  9. 推荐系统怎么结合大模型的常识推理能力?
  10. ChatRec、RecLLM这些工作有什么启发?
  11. 大模型能做多轮对话式推荐吗?怎么维护对话上下文?
  12. 怎么用大模型生成推荐的训练数据?Data Augmentation怎么做?
  13. 大模型能做A/B测试的自动分析吗?
  14. 推荐系统的Prompt怎么设计?怎么把用户历史行为融入Prompt?
  15. 大模型时代,推荐算法工程师还需要什么技能?

3.6 广告算法与实时竞价 (76-80题)

  1. 广告推荐和内容推荐有什么区别?eCPM是怎么计算的?
  2. CTR预估和CVR预估有什么区别?转化率怎么建模?
  3. 什么是全链路预估?从点击到转化的多阶段怎么建模?
  4. 实时竞价(RTB)是怎么工作的?出价策略怎么优化?
  5. 强化学习在广告算法里怎么用?长期收益怎么建模?