AI工程师9个月学习计划[计划由deepseek制定]

阶段1:夯实基础(2-3个月)

目标:掌握AI工程师的“生存底线”技能,能通过中小厂技术面。

1.1 数学与算法基础

  • 重点: 只学面试高频考点,拒绝“学院派”学究式推导

    • 线性代数: 矩阵分解(SVD)、张量运算(einsum)、梯度计算(链式法则)
    • 概率统计: 贝叶斯定理、极大似然估计、KL散度、交叉熵
    • 最优化: 梯度下降变种(AdamW、LAMB)、学习率调度(Cosine Annealing)
  • 学习资源:

    • 《深度学习》花书第2、5、6章(重点读公式+图解,跳过证明)
    • 《百面机器学习》第1-4章(刷透逻辑回归、SVM、树模型题目)

1.2 深度学习与PyTorch

  • 核心任务:

    • 用PyTorch手写常用模型(MLP、CNN、LSTM),禁止调库
    • 掌握张量操作(view、permute、einsum),理解计算图机制
    • Debug能力: 会用PyTorch的autograd.grad检查梯度异常
  • 实战:

    • Kaggle入门赛: Titanic、House Prices(用PyTorch实现全连接网络,禁止用Scikit-learn)
    • 代码库: pytorch-handbook(重点看chapter2

1.3 Transformer与预训练模型

  • 必学:

    • 手撕Transformer结构: 实现Multi-Head Attention、Positional Encoding(参考The Annotated Transformer
    • HuggingFace生态: 掌握AutoModelTrainerPipeline的用法
    • 微调实战: 用BERT在CLUE榜单任务(如AFQMC)上微调,达到80%+准确率
  • 关键产出:

    • GitHub仓库: 包含手写Transformer代码+微调示例(Star数≥50可写进简历)

阶段2:垂直领域突破(3-4个月)

目标:选择一个高薪细分方向,打造差异化竞争力(推荐NLP/CV/多模态)。 以NLP为例(薪资最高赛道之一):

2.1 核心技术栈

  • 领域模型:

    • 预训练模型变种: RoBERTa、ALBERT、DeBERTa(重点理解改进点)
    • 高效微调技术: LoRA、Adapter、P-tuning(节省显存+提升效果)
    • 解码策略: Beam Search、Top-k Sampling、Temperature Scaling
  • 企业级技能:

    • 模型压缩: 知识蒸馏(DistilBERT)、量化(QAT、PTQ)
    • 推理优化: ONNX Runtime、TensorRT部署,实现QPS提升≥3倍
    • 检索增强(RAG): 掌握稠密检索(DPR)、向量数据库(Milvus/Pinecone)

2.2 硬核实战项目

  • 项目1:RAG系统优化

    • 目标: 构建低延迟、高召回率的问答系统

    • 技术点:

      • 用BERT+Faiss实现向量检索,优化索引分片和量化参数
      • 对比BM25 vs 稠密检索的召回率/延迟差异
      • 实现HyDE(Hypothetical Document Embeddings)提升检索效果
    • 产出:

      • 开源代码 + 技术博客(重点写性能优化技巧,引流至简历)
  • 项目2:大模型微调与部署

    • 目标: 在消费级GPU(如RTX 3090)上微调LLaMA-2-7B

    • 技术点:

      • 用QLoRA技术节省显存
      • 用vLLM加速推理,实现动态批处理
      • 用Prometheus+Grafana监控服务性能
    • 产出:

      • 部署文档 + 性能Benchmark对比(显存占用、吞吐量)

2.3 竞赛与论文

  • Kaggle/天池:

    • 参加NLP相关比赛(如情感分析、实体识别),排名前10%
    • 关键技巧: 善用HuggingFace模型库+集成学习(Ensemble)
  • 论文速成:

    • 捷径: 复现顶会论文(如ACL、EMNLP)并改进(改数据/改损失函数)
    • 工具: 用Latex模板(如acl-article-template)快速排版

阶段3:求职冲刺(2-3个月)

目标:用企业认可的证据链(实习+项目+八股文)拿下高薪Offer

3.1 大厂实习(必选项!)

  • 投递策略:

    • 优先级: 字节AI Lab > 腾讯优图 > 阿里达摩院 > 美团/快手AI团队
    • 内推渠道: 北航校友群、导师资源、LinkedIn冷戳技术Leader
  • 实习目标:

    • 参与真实业务: 搜索推荐、广告算法、对话系统(避免打杂)
    • 争取转正: 入职第一天就明确转正HC和考核标准

3.2 面试八股文(背诵清单)

  • 算法题:

    • LeetCode: 高频100题(重点:动态规划、二叉树、链表)
    • 刷题技巧: 用PyTorch实现反向传播(面试官可能要求手写)
  • 深度学习:

    • 《百面深度学习》: 重点背Transformer、BERT、优化算法章节
    • 手推公式: LayerNorm反向传播、Multi-Head Attention复杂度
  • 系统设计:

    • 高频题: 设计一个推荐系统/实时风控系统(参考《机器学习系统设计》)

3.3 薪资谈判技巧

  • 举证逻辑:

    • 论文/专利: “我在ACL发表1篇论文,提出XX方法提升RAG召回率15%”
    • 项目收益: “我的模型优化使公司GPU成本下降40%”
    • 竞赛排名: “Kaggle全球Top 50,掌握XX技术组合”
  • 话术模板:

    • “我对比过市场薪资,我的产出对标阿里P6,期望年薪50w+”