我花了7天,从零手搓了一个 AI Agent 系统(附完整代码)
系列开篇 · 共8篇
大家好,欢迎来到小撒的私房菜,我是小撒。
去年这时候,我也是那种"看了很多 Agent 教程,但什么都没做出来"的人。
不是没有努力。我装过 LangChain,照着文档走,agent.run("帮我查天气") 确实跑通了。
但那之后呢?
我不知道里面发生了什么。一旦报错,我不知道从哪里改。一旦想加个功能,我不知道从哪里下手。
这种感觉很难受——你用了一个工具,但你不理解它。
后来我决定换个方法:不用任何框架,从最原始的方式把 Agent 做一遍。
这个系列是什么
《7天从零手搓 AI Agent》是一个完整的实战系列,共8篇:
- 本篇:为什么这样学,以及你能得到什么
- Day 1:你的第一个"会决策"的程序
- Day 2:给 Agent 装上真实工具
- Day 3:多工具,让 Agent 自己选
- Day 4:给 Agent 装上记忆
- Day 5:Agent Loop——最关键的一天
- Day 6:先规划,再执行
- Day 7:完整项目 + 下一步去哪里
每一篇都有:
- 完整可运行的代码
- 每一行为什么这样写
- 最常见的错误和解决方法
- 当天能跑出来的成果
先说清楚:这个系列适合谁
适合:
- 会 Python 基础(变量、函数、if/else、for 循环就够了)
- 有一个 OpenAI API Key,或者 DeepSeek / 月之暗面等国内服务
- 想真正理解 Agent 是怎么工作的,不只是调包
- 看了很多教程但还是没做出来的人
不太适合:
- 想学框架使用手册的人(这里先不用任何框架)
- 完全不懂 Python 的人(建议先学一周 Python 基础)
为什么先不用 LangChain
我知道你可能想问:现在都用 LangChain / AutoGen 了,为什么要手搓?
有个比喻:
学开车之前先了解发动机,这样你才知道为什么踩油门车会动。你不需要变成工程师,但你需要知道大概发生了什么。
LangChain 解决的问题,正是你手搓时会遇到的问题。
当你手搓过一遍,你会突然理解:
- 为什么 LangChain 有 Memory 模块
- 为什么 Tool 需要 description
- 为什么 Agent 有 max_iterations
- 为什么会有 ReAct、Plan-and-Execute 这些模式
这些不是设计者随便加的。是因为不加会出现具体的问题——而你会亲手遇到这些问题。
遇到了再解决,理解才是真理解。
之后你再去看 LangChain,会觉得"啊,原来它帮我封装了这个",而不是"这个参数是什么意思"。
你7天后能得到什么
一个真正运行的 Agent 系统,长这样:
=================================================
我的 AI Agent 系统 v1.0
=================================================
命令:
直接输入 → 对话模式(有记忆,自动使用工具)
/plan <任务> → 规划模式(先制定计划再执行)
/clear → 清除对话记忆
/quit → 退出
=================================================
你:最近有哪些 AI 领域的重要新闻?
[步骤 1/5]
[AI 思考]: {"type": "tool_call", "tool": "web_search", "params": {"query": "AI 人工智能最新新闻"}, "thought": "需要搜索最新 AI 新闻"}
[调用工具]: web_search
[工具结果]: 摘要:...
[步骤 2/5]
[AI 思考]: {"type": "final_answer", "content": "根据最新搜索结果..."}
[完成,共 2 步]
Agent:根据最新搜索结果,以下是 AI 领域近期重要动态:...
(对话记忆:2 条)
你:/plan 帮我调研 AI 编程工具的现状,写份简要报告
正在制定计划...
目标:调研 AI 编程工具现状
共 3 步:
步骤 1:搜索主流 AI 编程工具 (工具:web_search)
步骤 2:搜索用户评价和对比 (工具:web_search)
步骤 3:整合信息,撰写报告
确认执行?(y/n):
不是截图,是你自己跑出来的。
每一行代码你都知道为什么在那里。
技术准备
环境要求:
- Python 3.10 或以上(
python --version查看) - 一个 API Key
API Key 怎么获取:
如果在国内,推荐 DeepSeek(便宜,效果好,接口格式和 OpenAI 完全一样):
- 官网:platform.deepseek.com
- 注册后充值几块钱,跑完这个系列绰绰有余
OpenAI 官方也可以,gpt-4o-mini 很便宜,跑完7天大概花 $0.5 以内。
代码怎么拿:
这个系列所有代码都可以在文章里直接复制,也会在文末提供 GitHub 地址(完整项目结构,每天独立目录,下载即用)。
开始吧
下一篇是 Day 1:《让 AI 帮你"做决定"——你的第一个 Agent》
我们会用不到50行 Python,做出一个真正能"感知→思考→行动"的程序。
不是玩具。是后面所有东西的骨架。
这个系列每天更新一篇,建议收藏本文,后续在评论区更新目录链接。
全部代码开源,文末附 GitHub 地址。