AI工程师9个月学习计划[计划由deepseek制定]

从零成长为初级AI工程师

2025-03-22 21 阅读4分钟

阶段1：夯实基础（2-3个月）

目标：掌握AI工程师的“生存底线”技能，能通过中小厂技术面。

1.1 数学与算法基础

重点： 只学面试高频考点，拒绝“学院派”学究式推导
- 线性代数： 矩阵分解（SVD）、张量运算（einsum）、梯度计算（链式法则）
- 概率统计： 贝叶斯定理、极大似然估计、KL散度、交叉熵
- 最优化： 梯度下降变种（AdamW、LAMB）、学习率调度（Cosine Annealing）
学习资源：
- 《深度学习》花书第2、5、6章（重点读公式+图解，跳过证明）
- 《百面机器学习》第1-4章（刷透逻辑回归、SVM、树模型题目）

1.2 深度学习与PyTorch

核心任务：
- 用PyTorch手写常用模型（MLP、CNN、LSTM），禁止调库
- 掌握张量操作（view、permute、einsum），理解计算图机制
- Debug能力： 会用PyTorch的autograd.grad检查梯度异常
实战：
- Kaggle入门赛： Titanic、House Prices（用PyTorch实现全连接网络，禁止用Scikit-learn）
- 代码库： pytorch-handbook（重点看chapter2）

1.3 Transformer与预训练模型

必学：
- 手撕Transformer结构： 实现Multi-Head Attention、Positional Encoding（参考The Annotated Transformer）
- HuggingFace生态： 掌握AutoModel、Trainer、Pipeline的用法
- 微调实战： 用BERT在CLUE榜单任务（如AFQMC）上微调，达到80%+准确率
关键产出：
- GitHub仓库： 包含手写Transformer代码+微调示例（Star数≥50可写进简历）

阶段2：垂直领域突破（3-4个月）

目标：选择一个高薪细分方向，打造差异化竞争力（推荐NLP/CV/多模态）。 以NLP为例（薪资最高赛道之一）：

2.1 核心技术栈

领域模型：
- 预训练模型变种： RoBERTa、ALBERT、DeBERTa（重点理解改进点）
- 高效微调技术： LoRA、Adapter、P-tuning（节省显存+提升效果）
- 解码策略： Beam Search、Top-k Sampling、Temperature Scaling
企业级技能：
- 模型压缩： 知识蒸馏（DistilBERT）、量化（QAT、PTQ）
- 推理优化： ONNX Runtime、TensorRT部署，实现QPS提升≥3倍
- 检索增强（RAG）： 掌握稠密检索（DPR）、向量数据库（Milvus/Pinecone）

2.2 硬核实战项目

项目1：RAG系统优化
- 目标： 构建低延迟、高召回率的问答系统
- 技术点：
  - 用BERT+Faiss实现向量检索，优化索引分片和量化参数
  - 对比BM25 vs 稠密检索的召回率/延迟差异
  - 实现HyDE（Hypothetical Document Embeddings）提升检索效果
- 产出：
  - 开源代码 + 技术博客（重点写性能优化技巧，引流至简历）
项目2：大模型微调与部署
- 目标： 在消费级GPU（如RTX 3090）上微调LLaMA-2-7B
- 技术点：
  - 用QLoRA技术节省显存
  - 用vLLM加速推理，实现动态批处理
  - 用Prometheus+Grafana监控服务性能
- 产出：
  - 部署文档 + 性能Benchmark对比（显存占用、吞吐量）

2.3 竞赛与论文

Kaggle/天池：
- 参加NLP相关比赛（如情感分析、实体识别），排名前10%
- 关键技巧： 善用HuggingFace模型库+集成学习（Ensemble）
论文速成：
- 捷径： 复现顶会论文（如ACL、EMNLP）并改进（改数据/改损失函数）
- 工具： 用Latex模板（如acl-article-template）快速排版

阶段3：求职冲刺（2-3个月）

目标：用企业认可的证据链（实习+项目+八股文）拿下高薪Offer

3.1 大厂实习（必选项！）

投递策略：
- 优先级： 字节AI Lab > 腾讯优图 > 阿里达摩院 > 美团/快手AI团队
- 内推渠道： 北航校友群、导师资源、LinkedIn冷戳技术Leader
实习目标：
- 参与真实业务： 搜索推荐、广告算法、对话系统（避免打杂）
- 争取转正： 入职第一天就明确转正HC和考核标准

3.2 面试八股文（背诵清单）

算法题：
- LeetCode： 高频100题（重点：动态规划、二叉树、链表）
- 刷题技巧： 用PyTorch实现反向传播（面试官可能要求手写）
深度学习：
- 《百面深度学习》： 重点背Transformer、BERT、优化算法章节
- 手推公式： LayerNorm反向传播、Multi-Head Attention复杂度
系统设计：
- 高频题： 设计一个推荐系统/实时风控系统（参考《机器学习系统设计》）

3.3 薪资谈判技巧

举证逻辑：
- 论文/专利： “我在ACL发表1篇论文，提出XX方法提升RAG召回率15%”
- 项目收益： “我的模型优化使公司GPU成本下降40%”
- 竞赛排名： “Kaggle全球Top 50，掌握XX技术组合”
话术模板：
- “我对比过市场薪资，我的产出对标阿里P6，期望年薪50w+”