rohitg00/ai-engineering-from-scratch ：435节课 · 20个阶段 · 320小时从零构建你的AI工程体系

GitHub Daily · 第040期 · 早间篇

435节课 · 20个阶段 · 320小时

从零构建你的AI工程体系

rohitg00/ai-engineering-from-scratch — MIT #3

你有没有这样的困惑：看了很多AI教程，但始终感觉知识是散的——今天学个Transformer论文，明天看个RAG教程，后天跑个Agent Demo，学完回头一看，还是不会自己搭建一套完整的AI系统。

这个问题不是你的错。大多数AI学习资源本身就是碎片化的——一篇论文这里，一篇微调教程那里，一个炫酷的Agent Demo又在那里。散落的知识点之间缺乏一条主线。

而今天 GitHub Trending 上这个爆火的项目，ai-engineering-from-scratch，就是来解决这个问题的。作者 Rohit Ghumare（正是第026期 agentmemory 的作者）花了大量精力，从数学基础到自主多智能体集群，用 435节课、20个阶段、约320小时的系统化课程，给你画出了一条从"AI API调用者"升级为"AI工程师"的完整路线图。

更硬核的是：每节课都要求你从零手写实现——在接触 PyTorch 之前，你必须先用纯 Python 写出反向传播；在使用任何 Agent 框架之前，你必须先自己写一个完整的 Agent 循环。

项目速览

项目名称ai-engineering-from-scratch

作者Rohit Ghumare（@rohitg00）

Stars19,476 ⭐（今日 +3,154 🔥）

Forks3,117

课程规模435节课 · 20个阶段 · ~320小时

编程语言Python · TypeScript · Rust · Julia

开源协议MIT（完全免费，可商用）

官网aiengineeringfromscratch.com

产出378个Skills + 99个Prompts

GitHubgithub.com/rohitg00/ai-engineering-from-scratch

它能解决什么问题？

痛点一：AI知识碎片化，学了等于没学

调查显示：84%的学生已经在使用AI工具，但只有18%觉得准备好在专业环境中真正应用。原因很简单——大多数学习资源散落在各处：一篇Transformer论文、一个微调帖子、一个Agent Demo，没有一条主线把它们串起来。这个项目提供了从数学基础到多智能体集群的完整学习主干（spine），让所有知识点都有了归属。

痛点二：只会调包，不懂原理

用 PyTorch 的几行代码就能训练一个神经网络，但你真知道 loss.backward() 内部发生了什么吗？这个项目的核心方法论是**"Build It first, Use It later"**——每节课先用原始数学和代码从零实现，再用 PyTorch/sklearn 等框架复现。当框架出现时，你已经知道它在做什么了。

痛点三：学了不会用，缺乏交付能力

传统的学习路径到"理解概念"就结束了，但这个项目强制每节课产出一个可复用工具：Prompt、Skill、Agent 或 MCP Server。学完线性代数，你拥有一个变换可视化 Prompt；学完 RAG，你拥有一个检索评估 Skill；学完 Agent 循环，你拥有一个完整的 Agent Skill。435节课结束后，你得到的不只是知识，而是一个真实的AI工程工具箱。

痛点四：不知道从哪里开始学

面对435节课可能会被吓到，但项目提供了智能起点定位。内置的 /find-your-level Agent 技能通过10个问题评估你的知识水平，直接映射到合适的起始阶段，并生成带时间估算的个性化路径。你不需要从头学起——会ML的从Phase 3开始，只想学Agent的从Phase 14起步。

核心亮点

一、20阶段全景路线图：从数学到多智能体集群

这不是一个"教你用LangChain搭个聊天机器人"的教程，而是一条从底层数学到前沿AI工程的完整技术栈。每个阶段都是后续的基石：

Phase 0-2

🔧 环境搭建 + 🧮 数学基础 + 📊 ML基础

22节数学课（线性代数/微积分/概率/信息论）+ 18节ML课（回归/SVM/集成/特征工程），所有数学概念都映射到代码实体——比如学习链式法则后，你会直接用它构建反向传播的 Value 类。

Phase 3-6

🧠 深度学习核心 + 👁️ 计算机视觉 + 📝 NLP + 🎤 语音

从零构建神经网络框架（反向传播/优化器/正则化全手写），然后覆盖CV（28课从CNN到3D高斯泼溅）、NLP（29课从Word2Vec到RAG评估）、语音（17课含Whisper架构与微调）。

Phase 7-9

⚡ Transformers + 🎨 生成式AI + 🎮 强化学习

14课深入Transformer：自注意力从零、多头注意力、RoPE位置编码、MoE混合专家、Flash Attention推理优化，最后从零构建一个完整Transformer。生成式AI覆盖DDPM扩散模型到Stable Diffusion。RL覆盖Q-Learning到PPO再到RLHF奖励建模。

Phase 10-11 ⭐ 核心

🚀 LLMs 从零构建 + 🏭 LLM 工程化

**这是整个课程最重磅的两阶段。**Phase 10（22课）带你从分词语料走完整条LLM链路：BPE分词器 → 数据管线 → 预训练Mini GPT（124M）→ SFT指令微调 → RLHF/DPO对齐 → 量化(INT8/GPTQ/AWQ/GGUF) → 推测解码 → DeepSeek-V3架构走读。Phase 11（17课）教你把LLM投入生产：提示工程 → RAG/高级RAG → LoRA/QLoRA微调 → 函数调用 → MCP协议 → LangGraph状态机 → 生产部署。

Phase 12-14 ⭐ 核心

🌐 多模态 + 🔌 工具协议 + 🤖 Agent工程（42课）

Phase 12（25课）覆盖CLIP/BLIP-2/LLaVA/Qwen-VL到计算机使用Agent。Phase 13（23课）深入MCP协议：从构建MCP Server/Client到OAuth 2.1安全认证、A2A协议、LLM路由层。Phase 14是整个课程课时最多的阶段（42课），从零构建Agent循环、ReWOO规划、Reflexion自反思、MemGPT虚拟上下文记忆、混合记忆系统，再到LangGraph/AutoGen/CrewAI框架对比、SWE-bench/GAIA基准评测、12节课构建Agent Workbench。

Phase 15-19

🛡️ 自主系统 + 多智能体 + 生产部署 + 安全 + 顶点项目

Phase 15（22课）覆盖Claude Code自动模式、长周期Agent、递归自我改进、2026安全栈（RSP v3.0/预备框架）。Phase 16（25课）深入多Agent心智社会、A2A协议、群体优化。Phase 17（28课）覆盖vLLM推理内部、推测解码、GPU自动扩展、FinOps。Phase 18（30课）覆盖红队测试、越狱防御、差分隐私、EU AI Act合规。Phase 19提供17个顶点项目：终端编码Agent、自主研究Agent、多Agent软件工程团队、推测解码推理服务器等。

二、每节课的六步闭环学习法

435节课中的每一节都严格遵循相同的结构，这不是随便写写的README——项目有LESSON_TEMPLATE.md模板文件和CI自动化审计来确保每节课的一致性：

1****Motto — 一句话抓住核心直觉。比如"反向传播就是链式法则在计算图上的优雅应用"。
2****Problem — 为什么忽略这个概念会成为瓶颈。把你拉入真实工程困境。
3****Concept — 心智模型和图解理解。这个阶段不涉及代码，先建立直觉。
4****Build It — 从原始数学和代码手写实现。使用Python/TypeScript/Rust/Julia，禁止调用高层API。
5****Use It — 将"从零构建"的版本映射到PyTorch/JAX/Scikit-Learn等生产框架。
6****Ship It — 将可复用产物导出到全局 outputs/ 目录，形成你的AI工程工具箱。

三、378个Skills + 99个Prompts：学完直接带走一个工具箱

这是这个项目最与众不同的地方。学完不只有知识，更有可以直接安装使用的工具：

# 一键安装所有378个Skills到你的Claude/Cursor/Codex中 npx skills add rohitg00/ai-engineering-from-scratch # 只安装Agent循环这一个Skill npx skills add rohitg00/ai-engineering-from-scratch --skill agent-loop # 安装整个Phase 14（Agent工程）的全部Skills npx skills add rohitg00/ai-engineering-from-scratch --phase 14 # 高级：使用Python脚本离线安装，支持按标签筛选 python3 scripts/install_skills.py ~/.claude/skills --tag rag

四、面向多角色的分层学习路径

不需要学完所有435节课。项目根据你的背景提供了不同的进入点和路径：

你的背景	推荐起始阶段	预计时间

编程和AI新手

Phase 0 — 环境搭建

~306小时


会Python，ML新手

Phase 1 — 数学基础

~270小时


会ML，深度学习新手

Phase 3 — 深度学习核心

~200小时


会深度学习，想学LLM+Agent

Phase 10 — LLMs从零

~100小时


高级工程师，只要Agent工程

Phase 14 — Agent工程

~60小时

五、工程化程度极高：CI审计 + 脚本化质量保障

这不是一个随意堆放Markdown文件的仓库。项目有完整的工程质量体系：audit_lessons.py检查每节课的目录结构、文档完整性、quiz schema；lesson_run.py对所有代码做语法检查，甚至支持 --execute 实际运行验证；CI流水线在每次PR时自动重建catalog.json并运行审计。10条审计规则（L001-L010）确保课程规范性。

六、覆盖AI工程前沿：从DeepSeek-V3到EU AI Act

课程内容的时效性令人印象深刻，不仅包含经典论文（Attention Is All You Need → Phase 7, DPO → Phase 10, ReAct → Phase 14），更覆盖了2025-2026年的最新进展：DeepSeek-V3架构走读（含DualPipe并行、NSA稀疏注意力）、推测解码与EAGLE-3、差分注意力V2、MCP协议（含OAuth 2.1认证）、A2A Agent间协议、Anthropic RSP v3.0安全框架、EU AI Act合规要求。

实战场景展示

场景一：前端开发者转型AI工程师（8周路线）

Week 1-2：LLM基础 + 提示工程（学会和模型高效对话）；Week 3-4：RAG实现（用LangChain快速上手知识检索）；Week 5-6：Agent开发（从ReAct循环开始，自己写一个Agent）；Week 7-8：部署实战（vLLM + FastAPI 搭建推理服务）。全程代码驱动，每步都有可运行示例。

场景二：从零构建一个Mini GPT

Phase 10的核心挑战——构建一个124M参数的GPT模型并完成预训练。过程包括：用BPE算法从零写分词器（Python+Rust双实现）→ 构建训练数据管线 → 实现自注意力+多头注意力 → 分布式训练（FSDP/DeepSpeed）→ SFT指令微调 → RLHF对齐。做完这个，你对LLM的每一个组件都有第一手理解。

场景三：团队内部AI培训体系搭建

项目是MIT协议，明确鼓励团队和学校Fork改编。你可以基于20个阶段设计团队培训方案：新人走Phase 0→1→2→3路线，有经验的工程师直接进入Phase 10→11→14。每节课产出的Skills和Prompts可以直接整合到团队的AI工具链中。scaffold_workbench.py脚本还能一键为你的仓库生成Agent Workbench脚手架。

上手指南

**前置条件：**会写代码（任何语言均可，Python有帮助），有一颗想理解AI底层原理的心。

方式一：在线阅读（零配置）

直接访问 aiengineeringfromscratch.com，浏览所有已完成的课程。无需克隆、无需本地环境。

方式二：本地克隆运行

# 克隆仓库 git clone github.com/rohitg00/ai… cd ai-engineering-from-scratch # 安装依赖 pip install -r requirements.txt # 运行第一节课的示例代码 python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

方式三：智能定位起点（推荐）

如果你使用 Claude Code、Cursor、Codex 等支持 Skills 的 Agent，直接在对话中输入：

# 10题定位测验，映射到你的起始阶段，生成个性化路径+时间估算 /find-your-level # 对指定阶段进行8题自测，获得反馈和复习建议 /check-understanding 3

安装全部Skills到你的AI编程Agent

# 一键安装所有378个Skills npx skills add rohitg00/ai-engineering-from-scratch # 或使用Python脚本（支持离线、按标签、按阶段筛选） python3 scripts/install_skills.py ~/.claude/skills --phase 14 python3 scripts/install_skills.py ~/.claude/skills --tag rag python3 scripts/install_skills.py ~/.claude/skills --layout flat

客观评价

✅ 优势

• 体系完整：从数学到多智能体集群，20阶段形成系统知识框架，告别碎片化学习

• 强调从零实现：Build It first的核心哲学让学习者真正理解底层原理

• 每课有产出：378个Skills + 99个Prompts形成个人AI工程工具箱

• 工程化程度高：模板/审计脚本/CI/CD/术语表/网站一应俱全

• MIT开源：完全免费，团队可Fork改编作为内部培训体系

• 时效性强：覆盖DeepSeek-V3、推测解码、MCP协议等2025-2026最新技术

⚠️ 需注意

• 学习成本高：总时长约320小时，不适合只想快速调用API的用户

• 仍在建设中：许多Phase还未完全完成，内容可能持续变化

• 覆盖面过广：需要主动根据自己的目标裁剪路线，避免"什么都学一点"

• 高阶门槛：LLM预训练、分布式训练、多智能体等部分需要较强的工程和数学背景

📋 今日总结

❶ ai-engineering-from-scratch是目前GitHub上最系统化的AI工程课程，435节课、20个阶段、320小时，覆盖从线性代数到自主多智能体集群的全部技术栈。

❷ 核心方法论"Build It first, Use It later"——每个算法都从原始数学和代码手写实现，再引入PyTorch等框架，杜绝"只会调包"。

❸ 每节课产出可复用工具（Prompt/Skill/Agent/MCP Server），学完直接带走378个Skills和99个Prompts的专业工具箱。

❹ Phase 10（LLMs从零）和Phase 14（Agent工程42课）是最核心的两个阶段，分别覆盖预训练全链路和多智能体工程。

❺ 内置/find-your-level智能定位 + 多角色学习路径（新手306h / 转Agent方向60h），不需从头学完所有435节课。

❻ MIT开源，团队可Fork改编，已有scaffold_workbench.py脚本支持快速搭建培训体系。

GitHub Daily · 第040期 · 2026年5月26日
项目地址：github.com/rohitg00/ai-engineering-from-scratch

rohitg00/ai-engineering-from-scratch ：435节课 · 20个阶段 · 320小时 从零构建你的AI工程体系 — MIT开源 ｜Github Daily