🎯 从零开始 → 掌握 Python / 数学 / 机器学习 / 深度学习 → 能独立完成 AI 项目 → 拥有作品集进入 AI 行业。
🧭 AI 工程师 / 数据科学家 12 个月学习路线图
🩵 第 1–2 个月:编程与数学基础(打底期)
🎯 目标:
- 掌握 Python 数据分析必备库
- 理解机器学习所需数学(线性代数、概率、微积分)
📘 学习内容:
Python 基础
- 数据类型、循环、函数、类
NumPy(矩阵运算)Pandas(数据清洗与操作)Matplotlib / Seaborn(可视化)
数学基础
- 线性代数:矩阵乘法、特征值
- 概率统计:分布、期望、方差
- 微积分:导数、梯度下降的原理
🧪 实战项目:
- 使用 Pandas 分析一个开放数据集(如 COVID 或股票)
- 可视化全球疫情趋势 / 股票涨跌曲线
📚 推荐资源:
- 《Python 编程:从入门到实践》
- 3Blue1Brown《线性代数本质》
- Kaggle Python 入门课程
💚 第 3–4 个月:机器学习核心(AI 基石)
🎯 目标:
- 理解并掌握主流机器学习算法
- 会用 Scikit-learn 实现模型训练与调参
📘 学习内容:
- 监督学习:线性回归、逻辑回归、决策树、随机森林、SVM
- 无监督学习:KMeans、PCA
- 模型评估:混淆矩阵、ROC、AUC
- 特征工程:缺失值处理、标准化、编码
🧪 实战项目:
| 项目 | 说明 |
|---|---|
| 🏠 房价预测 | 用回归模型预测房价 |
| 💳 信用卡欺诈检测 | 分类问题,训练准确模型 |
| 🧍♂️ 客户分群 | 用 KMeans 聚类找出客户类型 |
📚 推荐资源:
- 《机器学习实战》(Python版)
- 吴恩达《Machine Learning》(Coursera)
- Kaggle Competitions(练实战)
💙 第 5–6 个月:深度学习入门
🎯 目标:
- 理解神经网络结构与训练原理
- 能用 PyTorch / TensorFlow 训练模型
📘 学习内容:
- 感知机、前向 / 反向传播
- CNN(卷积神经网络)→ 图像识别
- RNN / LSTM → 序列数据
- 过拟合、正则化、优化器
🧪 实战项目:
| 类型 | 示例 |
|---|---|
| CV | 猫狗分类、手写数字识别 (MNIST) |
| NLP | 影评情感分析 |
| 时间序列 | 股票预测(LSTM) |
📚 推荐资源:
- 《动手学深度学习》d2l.ai
- 吴恩达《Deep Learning Specialization》
- PyTorch 官方教程
💛 第 7–8 个月:AI 实战与工程化
🎯 目标:
- 掌握模型部署、API 化、云部署
- 能做完整 AI 应用项目
📘 学习内容:
- 模型保存与部署(
joblib、torch.save) - 使用 FastAPI / Flask 构建 AI 接口
- Docker 容器化与部署
- MLOps 基础:MLflow、Weights & Biases
🧪 实战项目:
- 部署一个情感分析 API
- 用 Flask + Vue3 做 “AI 图像识别 Web 应用”
- 使用 Docker + Hugging Face Space 部署模型
📚 推荐资源:
- FastAPI 官方文档
- Docker 从入门到实践
- Hugging Face 教程(transformers + spaces)
🩷 第 9–10 个月:大模型与 NLP 应用
🎯 目标:
- 理解 Transformer 架构
- 学会使用与微调 LLM(GPT / LLaMA)
- 能开发自己的智能问答或知识库系统
📘 学习内容:
- Transformer、BERT、GPT 基本原理
- Prompt Engineering(提示词工程)
- RAG(检索增强生成)技术
- LangChain、OpenAI API、Hugging Face Hub
🧪 实战项目:
| 项目 | 描述 |
|---|---|
| 🧠 智能问答系统 | 用 LangChain + OpenAI 构建 FAQ 助手 |
| 🧾 文本摘要模型 | 对新闻文本自动生成摘要 |
| 🧍♀️ 私有知识库聊天助手 | 上传PDF + 向量数据库(Chroma / FAISS) |
📚 推荐资源:
- LangChain 官方文档
- OpenAI 官方 API 教程
- 《Transformers for Natural Language Processing》
❤️ 第 11–12 个月:高级与作品集冲刺
🎯 目标:
- 具备完整的 AI 系统设计能力
- 拥有至少 2 个展示级项目(GitHub / Kaggle)
📘 学习内容:
- 模型优化:量化、剪枝、蒸馏
- 模型监控与更新(MLOps)
- 数据科学实践(A/B 测试、商业分析)
- 学习阅读论文(ResNet、BERT、GPT)
🧪 毕业项目建议:
| 类型 | 示例 |
|---|---|
| AI 工程方向 | AI 聊天助手 / 图像识别平台 / 自动摘要工具 |
| 数据科学方向 | 用户流失预测 / 销售趋势分析 / 推荐系统 |
| 综合项目 | 用 LangChain + FastAPI 构建 AI Web 应用 |
📚 推荐资源:
- Papers with Code
- Arxiv-Sanity
- Fast.ai 高级课程
🏁 输出成果(学习闭环)
| 阶段 | 输出成果 |
|---|---|
| 第 2 月 | Python + 数学学习笔记 |
| 第 4 月 | 2 个 ML 项目(Kaggle) |
| 第 6 月 | 1 个深度学习项目 |
| 第 8 月 | 部署上线一个模型 API |
| 第 10 月 | 完成一个 LLM 应用 |
| 第 12 月 | 作品集网站 + 简历 + GitHub Portfolio |
🌱 附加建议
-
每天学习 1–2 小时,坚持比速度重要。
-
每周写一次 “学习总结笔记”。
-
尝试做 Kaggle 比赛(能极大提升实战能力)。
-
找一个开源项目(Hugging Face / d2l.ai)参与贡献。