AI 工程师学习路径指南:从哪里开始学、学到什么程度、怎么证明自己学会了
本文整理自开源项目 AgentInterview,该项目持续更新 AI 面试题库和学习资源。
痛点:AI 学习路线太乱,不知道从哪里开始
如果你想成为 AI 工程师,可能经历过这些困惑:
- 网上教程一大堆,从 Python 基础到 Transformer 原理,学完要花半年
- 学了很多理论,但不知道能不能应付实际工作
- 面试时被问到"你做过什么 AI 项目",只能回答"我学过 XX 课程"
- 担心自己学的东西已经过时,或者方向不对
核心问题不是资源不够,而是缺少一张清晰的能力地图——帮你判断自己现在在哪、下一步该补什么、以及怎么验证自己真的学会了。
AI 工程师不是单一角色
"AI 工程师"这个词太宽泛了。实际招聘里,至少有 4 类方向:
| 方向 | 核心能力 | 典型岗位 | 入门难度 |
|---|---|---|---|
| AI 应用开发 | Prompt、RAG、Agent、API 集成 | AI 应用工程师、LLM 应用开发 | ⭐⭐ |
| AI 工程化 | 部署、评估、监控、成本控制 | AI 平台工程师、MLOps | ⭐⭐⭐ |
| 算法研发 | 模型微调、架构改进、论文复现 | 算法工程师、研究员 | ⭐⭐⭐⭐⭐ |
| AI 产品/解决方案 | 需求分析、方案设计、技术选型 | AI 产品经理、解决方案架构师 | ⭐⭐⭐ |
这份学习路径主要针对前两类——AI 应用开发和 AI 工程化,因为这是目前市场需求最大、也最适合大多数开发者切入的方向。
如果你目标是算法研发,建议直接走深度学习系统学习路线(花书 + 论文 + 复现),这份文档可能不够深。
四阶段学习路径
阶段 1:基础认知(2-4 周)
目标:建立能开始动手的最小知识集,而不是学完所有基础。
最小知识集
-
Python 基础(1 周)
- 写函数、类、模块
- 处理 JSON、文件 IO
- 使用 requests 调用 API
- 用 asyncio 写简单异步代码
验证方式:能写一个脚本,调用 OpenAI API 完成问答并保存结果。
-
深度学习概念入门(3-5 天)
- 什么是神经网络、层、参数
- 什么是训练、推理
- 什么是损失函数、梯度下降(概念层面)
- 什么是过拟合、正则化
推荐资源:3Blue1Brown 神经网络系列视频(直观理解)
-
Transformer 基础理解(3-5 天)
- Attention 机制的核心思想
- Encoder-Decoder 结构
- 为什么 Transformer 适合 NLP
不需要:手推公式、从零实现 Transformer
-
能调用 LLM API 完成简单任务
- 注册 OpenAI/Anthropic/国产大模型账号
- 理解 prompt、completion、token 概念
- 写一个最简单的问答脚本
阶段 2:应用开发(4-8 周)
目标:能独立做出可演示的 AI 应用。
核心技能
-
Prompt Engineering
- 系统提示词设计
- Few-shot prompting
- Chain of Thought
- 结构化输出(JSON Mode)
-
RAG 系统搭建
- 文档切片与向量化
- 向量数据库使用(Chroma、Pinecone)
- 检索与生成结合
- 处理检索失败的情况
-
Agent 基础
- ReAct 模式
- 工具调用(Function Calling)
- 简单的多步任务规划
验证项目
做一个完整的 RAG 应用,例如:
- 公司内部文档问答系统
- 个人知识库检索助手
- 特定领域的 FAQ 机器人
关键指标:能向别人演示并解释每个模块的作用。
阶段 3:工程能力(8-12 周)
目标:能把 demo 变成可运行的系统。
核心能力
-
评估体系
- 如何评估 RAG 系统的检索质量
- 如何评估生成结果的相关性
- 建立自动化测试集
-
部署与优化
- 容器化部署(Docker)
- API 服务封装(FastAPI)
- 响应时间优化
- 并发处理
-
监控与成本控制
- Token 使用量监控
- API 调用成本核算
- 错误日志与告警
- 用户反馈收集
验证项目
把阶段 2 的项目部署到生产环境:
- 有监控看板
- 有错误处理
- 有成本核算
- 有用户反馈机制
阶段 4:进阶方向(持续)
目标:形成自己的技术判断,能解决复杂问题。
可选方向
-
微调与定制
- LoRA 微调
- 领域适配
- 评估微调效果
-
复杂 Agent 设计
- 多 Agent 协作
- 长周期任务规划
- 人机协作流程
-
技术选型能力
- 什么时候用 RAG,什么时候用微调
- 什么时候自己部署,什么时候用 API
- 成本与效果的平衡
怎么证明自己学会了
学习过程中,建议建立以下"能力证明":
1. 项目作品集
- GitHub 上有 2-3 个完整的 AI 应用项目
- 每个项目有清晰的 README 和使用说明
- 最好有在线演示地址
2. 技术输出
- 写技术博客,记录学习过程和项目经验
- 在社区回答问题,帮助他人解决问题
- 参与开源项目贡献
3. 面试准备
- 能清晰解释自己做的项目
- 能回答常见的 AI 应用开发面试题
- 能现场写代码解决简单问题
AgentInterview 项目整理了 200+ AI 相关面试题库,包括:
- AI 基础概念题
- RAG 系统设计题
- Agent 架构题
- 工程实践题
建议在学习过程中对照题库自测,查漏补缺。
常见误区
❌ 误区 1:学完所有基础再开始做项目
现实:很多知识是在做的过程中补的。先做出一个能跑的东西,再逐步优化。
❌ 误区 2:只学理论不动手
现实:AI 应用开发是实践性很强的技能。看 10 篇教程不如自己做一个项目。
❌ 误区 3:盲目追新
现实:技术迭代快,但核心原理相对稳定。先把 RAG、Agent 等基础打牢,再跟进新技术。
❌ 误区 4:忽视工程能力
现实:能做出 demo 和能部署上线是两回事。工程能力决定你能不能把技术变成产品。
下一步行动
- 评估自己当前水平:对照四阶段,判断自己处在哪一阶段
- 选择一个验证项目:根据当前阶段,选择一个能验证能力的项目
- 开始动手:不要等"准备好",先做出一个能跑的东西
- 持续迭代:在做中学,在学中做
资源推荐
- 开源项目:AgentInterview - AI 面试题库与学习路径
- 实践社区:GitHub、Hugging Face、Reddit r/LocalLLaMA
- 持续学习:关注 AI 领域博客、论文、技术分享
📂 本文整理自开源项目 AgentInterview,持续更新中,欢迎 Star ⭐
🔍 关注公众号「开源情报局」获取更多优质开源项目推荐