GitHub Daily · 第040期 · 早间篇
435节课 · 20个阶段 · 320小时
从零构建你的AI工程体系
rohitg00/ai-engineering-from-scratch — MIT #3
你有没有这样的困惑:看了很多AI教程,但始终感觉知识是散的——今天学个Transformer论文,明天看个RAG教程,后天跑个Agent Demo,学完回头一看,还是不会自己搭建一套完整的AI系统。
这个问题不是你的错。大多数AI学习资源本身就是碎片化的——一篇论文这里,一篇微调教程那里,一个炫酷的Agent Demo又在那里。散落的知识点之间缺乏一条主线。
而今天 GitHub Trending 上这个爆火的项目,ai-engineering-from-scratch,就是来解决这个问题的。作者 Rohit Ghumare(正是第026期 agentmemory 的作者)花了大量精力,从数学基础到自主多智能体集群,用 435节课、20个阶段、约320小时的系统化课程,给你画出了一条从"AI API调用者"升级为"AI工程师"的完整路线图。
更硬核的是:每节课都要求你从零手写实现——在接触 PyTorch 之前,你必须先用纯 Python 写出反向传播;在使用任何 Agent 框架之前,你必须先自己写一个完整的 Agent 循环。
项目速览
项目名称ai-engineering-from-scratch
作者Rohit Ghumare(@rohitg00)
Stars19,476 ⭐(今日 +3,154 🔥)
Forks3,117
课程规模435节课 · 20个阶段 · ~320小时
编程语言Python · TypeScript · Rust · Julia
开源协议MIT(完全免费,可商用)
官网aiengineeringfromscratch.com
产出378个Skills + 99个Prompts
GitHubgithub.com/rohitg00/ai-engineering-from-scratch
它能解决什么问题?
痛点一:AI知识碎片化,学了等于没学
调查显示:84%的学生已经在使用AI工具,但只有18%觉得准备好在专业环境中真正应用。原因很简单——大多数学习资源散落在各处:一篇Transformer论文、一个微调帖子、一个Agent Demo,没有一条主线把它们串起来。这个项目提供了从数学基础到多智能体集群的完整学习主干(spine),让所有知识点都有了归属。
痛点二:只会调包,不懂原理
用 PyTorch 的几行代码就能训练一个神经网络,但你真知道 loss.backward() 内部发生了什么吗?这个项目的核心方法论是**"Build It first, Use It later"**——每节课先用原始数学和代码从零实现,再用 PyTorch/sklearn 等框架复现。当框架出现时,你已经知道它在做什么了。
痛点三:学了不会用,缺乏交付能力
传统的学习路径到"理解概念"就结束了,但这个项目强制每节课产出一个可复用工具:Prompt、Skill、Agent 或 MCP Server。学完线性代数,你拥有一个变换可视化 Prompt;学完 RAG,你拥有一个检索评估 Skill;学完 Agent 循环,你拥有一个完整的 Agent Skill。435节课结束后,你得到的不只是知识,而是一个真实的AI工程工具箱。
痛点四:不知道从哪里开始学
面对435节课可能会被吓到,但项目提供了智能起点定位。内置的 /find-your-level Agent 技能通过10个问题评估你的知识水平,直接映射到合适的起始阶段,并生成带时间估算的个性化路径。你不需要从头学起——会ML的从Phase 3开始,只想学Agent的从Phase 14起步。
核心亮点
一、20阶段全景路线图:从数学到多智能体集群
这不是一个"教你用LangChain搭个聊天机器人"的教程,而是一条从底层数学到前沿AI工程的完整技术栈。每个阶段都是后续的基石:
Phase 0-2
🔧 环境搭建 + 🧮 数学基础 + 📊 ML基础
22节数学课(线性代数/微积分/概率/信息论)+ 18节ML课(回归/SVM/集成/特征工程),所有数学概念都映射到代码实体——比如学习链式法则后,你会直接用它构建反向传播的 Value 类。
Phase 3-6
🧠 深度学习核心 + 👁️ 计算机视觉 + 📝 NLP + 🎤 语音
从零构建神经网络框架(反向传播/优化器/正则化全手写),然后覆盖CV(28课从CNN到3D高斯泼溅)、NLP(29课从Word2Vec到RAG评估)、语音(17课含Whisper架构与微调)。
Phase 7-9
⚡ Transformers + 🎨 生成式AI + 🎮 强化学习
14课深入Transformer:自注意力从零、多头注意力、RoPE位置编码、MoE混合专家、Flash Attention推理优化,最后从零构建一个完整Transformer。生成式AI覆盖DDPM扩散模型到Stable Diffusion。RL覆盖Q-Learning到PPO再到RLHF奖励建模。
Phase 10-11 ⭐ 核心
🚀 LLMs 从零构建 + 🏭 LLM 工程化
**这是整个课程最重磅的两阶段。**Phase 10(22课)带你从分词语料走完整条LLM链路:BPE分词器 → 数据管线 → 预训练Mini GPT(124M)→ SFT指令微调 → RLHF/DPO对齐 → 量化(INT8/GPTQ/AWQ/GGUF) → 推测解码 → DeepSeek-V3架构走读。Phase 11(17课)教你把LLM投入生产:提示工程 → RAG/高级RAG → LoRA/QLoRA微调 → 函数调用 → MCP协议 → LangGraph状态机 → 生产部署。
Phase 12-14 ⭐ 核心
🌐 多模态 + 🔌 工具协议 + 🤖 Agent工程(42课)
Phase 12(25课)覆盖CLIP/BLIP-2/LLaVA/Qwen-VL到计算机使用Agent。Phase 13(23课)深入MCP协议:从构建MCP Server/Client到OAuth 2.1安全认证、A2A协议、LLM路由层。Phase 14是整个课程课时最多的阶段(42课),从零构建Agent循环、ReWOO规划、Reflexion自反思、MemGPT虚拟上下文记忆、混合记忆系统,再到LangGraph/AutoGen/CrewAI框架对比、SWE-bench/GAIA基准评测、12节课构建Agent Workbench。
Phase 15-19
🛡️ 自主系统 + 多智能体 + 生产部署 + 安全 + 顶点项目
Phase 15(22课)覆盖Claude Code自动模式、长周期Agent、递归自我改进、2026安全栈(RSP v3.0/预备框架)。Phase 16(25课)深入多Agent心智社会、A2A协议、群体优化。Phase 17(28课)覆盖vLLM推理内部、推测解码、GPU自动扩展、FinOps。Phase 18(30课)覆盖红队测试、越狱防御、差分隐私、EU AI Act合规。Phase 19提供17个顶点项目:终端编码Agent、自主研究Agent、多Agent软件工程团队、推测解码推理服务器等。
二、每节课的六步闭环学习法
435节课中的每一节都严格遵循相同的结构,这不是随便写写的README——项目有LESSON_TEMPLATE.md模板文件和CI自动化审计来确保每节课的一致性:
-
1****Motto — 一句话抓住核心直觉。比如"反向传播就是链式法则在计算图上的优雅应用"。
-
2****Problem — 为什么忽略这个概念会成为瓶颈。把你拉入真实工程困境。
-
3****Concept — 心智模型和图解理解。这个阶段不涉及代码,先建立直觉。
-
4****Build It — 从原始数学和代码手写实现。使用Python/TypeScript/Rust/Julia,禁止调用高层API。
-
5****Use It — 将"从零构建"的版本映射到PyTorch/JAX/Scikit-Learn等生产框架。
-
6****Ship It — 将可复用产物导出到全局 outputs/ 目录,形成你的AI工程工具箱。
三、378个Skills + 99个Prompts:学完直接带走一个工具箱
这是这个项目最与众不同的地方。学完不只有知识,更有可以直接安装使用的工具:
# 一键安装所有378个Skills到你的Claude/Cursor/Codex中 npx skills add rohitg00/ai-engineering-from-scratch # 只安装Agent循环这一个Skill npx skills add rohitg00/ai-engineering-from-scratch --skill agent-loop # 安装整个Phase 14(Agent工程)的全部Skills npx skills add rohitg00/ai-engineering-from-scratch --phase 14 # 高级:使用Python脚本离线安装,支持按标签筛选 python3 scripts/install_skills.py ~/.claude/skills --tag rag
四、面向多角色的分层学习路径
不需要学完所有435节课。项目根据你的背景提供了不同的进入点和路径:
| 你的背景 | 推荐起始阶段 | 预计时间 |
|---|---|---|
| 编程和AI新手 | ||
| Phase 0 — 环境搭建 | ||
| ~306小时 | ||
| 会Python,ML新手 | ||
| Phase 1 — 数学基础 | ||
| ~270小时 | ||
| 会ML,深度学习新手 | ||
| Phase 3 — 深度学习核心 | ||
| ~200小时 | ||
| 会深度学习,想学LLM+Agent | ||
| Phase 10 — LLMs从零 | ||
| ~100小时 | ||
| 高级工程师,只要Agent工程 | ||
| Phase 14 — Agent工程 | ||
| ~60小时 | ||
五、工程化程度极高:CI审计 + 脚本化质量保障
这不是一个随意堆放Markdown文件的仓库。项目有完整的工程质量体系:audit_lessons.py检查每节课的目录结构、文档完整性、quiz schema;lesson_run.py对所有代码做语法检查,甚至支持 --execute 实际运行验证;CI流水线在每次PR时自动重建catalog.json并运行审计。10条审计规则(L001-L010)确保课程规范性。
六、覆盖AI工程前沿:从DeepSeek-V3到EU AI Act
课程内容的时效性令人印象深刻,不仅包含经典论文(Attention Is All You Need → Phase 7, DPO → Phase 10, ReAct → Phase 14),更覆盖了2025-2026年的最新进展:DeepSeek-V3架构走读(含DualPipe并行、NSA稀疏注意力)、推测解码与EAGLE-3、差分注意力V2、MCP协议(含OAuth 2.1认证)、A2A Agent间协议、Anthropic RSP v3.0安全框架、EU AI Act合规要求。
实战场景展示
场景一:前端开发者转型AI工程师(8周路线)
Week 1-2:LLM基础 + 提示工程(学会和模型高效对话);Week 3-4:RAG实现(用LangChain快速上手知识检索);Week 5-6:Agent开发(从ReAct循环开始,自己写一个Agent);Week 7-8:部署实战(vLLM + FastAPI 搭建推理服务)。全程代码驱动,每步都有可运行示例。
场景二:从零构建一个Mini GPT
Phase 10的核心挑战——构建一个124M参数的GPT模型并完成预训练。过程包括:用BPE算法从零写分词器(Python+Rust双实现)→ 构建训练数据管线 → 实现自注意力+多头注意力 → 分布式训练(FSDP/DeepSpeed)→ SFT指令微调 → RLHF对齐。做完这个,你对LLM的每一个组件都有第一手理解。
场景三:团队内部AI培训体系搭建
项目是MIT协议,明确鼓励团队和学校Fork改编。你可以基于20个阶段设计团队培训方案:新人走Phase 0→1→2→3路线,有经验的工程师直接进入Phase 10→11→14。每节课产出的Skills和Prompts可以直接整合到团队的AI工具链中。scaffold_workbench.py脚本还能一键为你的仓库生成Agent Workbench脚手架。
上手指南
**前置条件:**会写代码(任何语言均可,Python有帮助),有一颗想理解AI底层原理的心。
方式一:在线阅读(零配置)
直接访问 aiengineeringfromscratch.com,浏览所有已完成的课程。无需克隆、无需本地环境。
方式二:本地克隆运行
# 克隆仓库 git clone github.com/rohitg00/ai… cd ai-engineering-from-scratch # 安装依赖 pip install -r requirements.txt # 运行第一节课的示例代码 python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py
方式三:智能定位起点(推荐)
如果你使用 Claude Code、Cursor、Codex 等支持 Skills 的 Agent,直接在对话中输入:
# 10题定位测验,映射到你的起始阶段,生成个性化路径+时间估算 /find-your-level # 对指定阶段进行8题自测,获得反馈和复习建议 /check-understanding 3
安装全部Skills到你的AI编程Agent
# 一键安装所有378个Skills npx skills add rohitg00/ai-engineering-from-scratch # 或使用Python脚本(支持离线、按标签、按阶段筛选) python3 scripts/install_skills.py ~/.claude/skills --phase 14 python3 scripts/install_skills.py ~/.claude/skills --tag rag python3 scripts/install_skills.py ~/.claude/skills --layout flat
客观评价
✅ 优势
• 体系完整:从数学到多智能体集群,20阶段形成系统知识框架,告别碎片化学习
• 强调从零实现:Build It first的核心哲学让学习者真正理解底层原理
• 每课有产出:378个Skills + 99个Prompts形成个人AI工程工具箱
• 工程化程度高:模板/审计脚本/CI/CD/术语表/网站一应俱全
• MIT开源:完全免费,团队可Fork改编作为内部培训体系
• 时效性强:覆盖DeepSeek-V3、推测解码、MCP协议等2025-2026最新技术
⚠️ 需注意
• 学习成本高:总时长约320小时,不适合只想快速调用API的用户
• 仍在建设中:许多Phase还未完全完成,内容可能持续变化
• 覆盖面过广:需要主动根据自己的目标裁剪路线,避免"什么都学一点"
• 高阶门槛:LLM预训练、分布式训练、多智能体等部分需要较强的工程和数学背景
📋 今日总结
❶ ai-engineering-from-scratch是目前GitHub上最系统化的AI工程课程,435节课、20个阶段、320小时,覆盖从线性代数到自主多智能体集群的全部技术栈。
❷ 核心方法论"Build It first, Use It later"——每个算法都从原始数学和代码手写实现,再引入PyTorch等框架,杜绝"只会调包"。
❸ 每节课产出可复用工具(Prompt/Skill/Agent/MCP Server),学完直接带走378个Skills和99个Prompts的专业工具箱。
❹ Phase 10(LLMs从零)和Phase 14(Agent工程42课)是最核心的两个阶段,分别覆盖预训练全链路和多智能体工程。
❺ 内置/find-your-level智能定位 + 多角色学习路径(新手306h / 转Agent方向60h),不需从头学完所有435节课。
❻ MIT开源,团队可Fork改编,已有scaffold_workbench.py脚本支持快速搭建培训体系。
GitHub Daily · 第040期 · 2026年5月26日
项目地址:github.com/rohitg00/ai-engineering-from-scratch