阶段1:夯实基础(2-3个月)
目标:掌握AI工程师的“生存底线”技能,能通过中小厂技术面。
1.1 数学与算法基础
-
重点: 只学面试高频考点,拒绝“学院派”学究式推导
- 线性代数: 矩阵分解(SVD)、张量运算(einsum)、梯度计算(链式法则)
- 概率统计: 贝叶斯定理、极大似然估计、KL散度、交叉熵
- 最优化: 梯度下降变种(AdamW、LAMB)、学习率调度(Cosine Annealing)
-
学习资源:
- 《深度学习》花书第2、5、6章(重点读公式+图解,跳过证明)
- 《百面机器学习》第1-4章(刷透逻辑回归、SVM、树模型题目)
1.2 深度学习与PyTorch
-
核心任务:
- 用PyTorch手写常用模型(MLP、CNN、LSTM),禁止调库
- 掌握张量操作(view、permute、einsum),理解计算图机制
- Debug能力: 会用PyTorch的autograd.grad检查梯度异常
-
实战:
- Kaggle入门赛: Titanic、House Prices(用PyTorch实现全连接网络,禁止用Scikit-learn)
- 代码库: pytorch-handbook(重点看
chapter2
)
1.3 Transformer与预训练模型
-
必学:
- 手撕Transformer结构: 实现Multi-Head Attention、Positional Encoding(参考The Annotated Transformer)
- HuggingFace生态: 掌握
AutoModel
、Trainer
、Pipeline
的用法 - 微调实战: 用BERT在CLUE榜单任务(如AFQMC)上微调,达到80%+准确率
-
关键产出:
- GitHub仓库: 包含手写Transformer代码+微调示例(Star数≥50可写进简历)
阶段2:垂直领域突破(3-4个月)
目标:选择一个高薪细分方向,打造差异化竞争力(推荐NLP/CV/多模态)。 以NLP为例(薪资最高赛道之一):
2.1 核心技术栈
-
领域模型:
- 预训练模型变种: RoBERTa、ALBERT、DeBERTa(重点理解改进点)
- 高效微调技术: LoRA、Adapter、P-tuning(节省显存+提升效果)
- 解码策略: Beam Search、Top-k Sampling、Temperature Scaling
-
企业级技能:
- 模型压缩: 知识蒸馏(DistilBERT)、量化(QAT、PTQ)
- 推理优化: ONNX Runtime、TensorRT部署,实现QPS提升≥3倍
- 检索增强(RAG): 掌握稠密检索(DPR)、向量数据库(Milvus/Pinecone)
2.2 硬核实战项目
-
项目1:RAG系统优化
-
目标: 构建低延迟、高召回率的问答系统
-
技术点:
- 用BERT+Faiss实现向量检索,优化索引分片和量化参数
- 对比BM25 vs 稠密检索的召回率/延迟差异
- 实现HyDE(Hypothetical Document Embeddings)提升检索效果
-
产出:
- 开源代码 + 技术博客(重点写性能优化技巧,引流至简历)
-
-
项目2:大模型微调与部署
-
目标: 在消费级GPU(如RTX 3090)上微调LLaMA-2-7B
-
技术点:
- 用QLoRA技术节省显存
- 用vLLM加速推理,实现动态批处理
- 用Prometheus+Grafana监控服务性能
-
产出:
- 部署文档 + 性能Benchmark对比(显存占用、吞吐量)
-
2.3 竞赛与论文
-
Kaggle/天池:
- 参加NLP相关比赛(如情感分析、实体识别),排名前10%
- 关键技巧: 善用HuggingFace模型库+集成学习(Ensemble)
-
论文速成:
- 捷径: 复现顶会论文(如ACL、EMNLP)并改进(改数据/改损失函数)
- 工具: 用Latex模板(如acl-article-template)快速排版
阶段3:求职冲刺(2-3个月)
目标:用企业认可的证据链(实习+项目+八股文)拿下高薪Offer
3.1 大厂实习(必选项!)
-
投递策略:
- 优先级: 字节AI Lab > 腾讯优图 > 阿里达摩院 > 美团/快手AI团队
- 内推渠道: 北航校友群、导师资源、LinkedIn冷戳技术Leader
-
实习目标:
- 参与真实业务: 搜索推荐、广告算法、对话系统(避免打杂)
- 争取转正: 入职第一天就明确转正HC和考核标准
3.2 面试八股文(背诵清单)
-
算法题:
- LeetCode: 高频100题(重点:动态规划、二叉树、链表)
- 刷题技巧: 用PyTorch实现反向传播(面试官可能要求手写)
-
深度学习:
- 《百面深度学习》: 重点背Transformer、BERT、优化算法章节
- 手推公式: LayerNorm反向传播、Multi-Head Attention复杂度
-
系统设计:
- 高频题: 设计一个推荐系统/实时风控系统(参考《机器学习系统设计》)
3.3 薪资谈判技巧
-
举证逻辑:
- 论文/专利: “我在ACL发表1篇论文,提出XX方法提升RAG召回率15%”
- 项目收益: “我的模型优化使公司GPU成本下降40%”
- 竞赛排名: “Kaggle全球Top 50,掌握XX技术组合”
-
话术模板:
- “我对比过市场薪资,我的产出对标阿里P6,期望年薪50w+”