我花了7天,从零手搓了一个 AI Agent 系统(附完整代码)

52 阅读4分钟

我花了7天,从零手搓了一个 AI Agent 系统(附完整代码)

系列开篇 · 共8篇


day0.png

大家好,欢迎来到小撒的私房菜,我是小撒。

去年这时候,我也是那种"看了很多 Agent 教程,但什么都没做出来"的人。

不是没有努力。我装过 LangChain,照着文档走,agent.run("帮我查天气") 确实跑通了。

但那之后呢?

我不知道里面发生了什么。一旦报错,我不知道从哪里改。一旦想加个功能,我不知道从哪里下手。

这种感觉很难受——你用了一个工具,但你不理解它。

后来我决定换个方法:不用任何框架,从最原始的方式把 Agent 做一遍。


这个系列是什么

《7天从零手搓 AI Agent》是一个完整的实战系列,共8篇:

  • 本篇:为什么这样学,以及你能得到什么
  • Day 1:你的第一个"会决策"的程序
  • Day 2:给 Agent 装上真实工具
  • Day 3:多工具,让 Agent 自己选
  • Day 4:给 Agent 装上记忆
  • Day 5:Agent Loop——最关键的一天
  • Day 6:先规划,再执行
  • Day 7:完整项目 + 下一步去哪里

每一篇都有:

  • 完整可运行的代码
  • 每一行为什么这样写
  • 最常见的错误和解决方法
  • 当天能跑出来的成果

先说清楚:这个系列适合谁

适合:

  • 会 Python 基础(变量、函数、if/else、for 循环就够了)
  • 有一个 OpenAI API Key,或者 DeepSeek / 月之暗面等国内服务
  • 想真正理解 Agent 是怎么工作的,不只是调包
  • 看了很多教程但还是没做出来的人

不太适合:

  • 想学框架使用手册的人(这里先不用任何框架)
  • 完全不懂 Python 的人(建议先学一周 Python 基础)

为什么先不用 LangChain

我知道你可能想问:现在都用 LangChain / AutoGen 了,为什么要手搓?

有个比喻:

学开车之前先了解发动机,这样你才知道为什么踩油门车会动。你不需要变成工程师,但你需要知道大概发生了什么

LangChain 解决的问题,正是你手搓时会遇到的问题。

当你手搓过一遍,你会突然理解:

  • 为什么 LangChain 有 Memory 模块
  • 为什么 Tool 需要 description
  • 为什么 Agent 有 max_iterations
  • 为什么会有 ReAct、Plan-and-Execute 这些模式

这些不是设计者随便加的。是因为不加会出现具体的问题——而你会亲手遇到这些问题。

遇到了再解决,理解才是真理解。

之后你再去看 LangChain,会觉得"啊,原来它帮我封装了这个",而不是"这个参数是什么意思"。


你7天后能得到什么

一个真正运行的 Agent 系统,长这样:

=================================================
    我的 AI Agent 系统 v1.0
=================================================
命令:
  直接输入     → 对话模式(有记忆,自动使用工具)
  /plan <任务> → 规划模式(先制定计划再执行)
  /clear       → 清除对话记忆
  /quit        → 退出
=================================================

你:最近有哪些 AI 领域的重要新闻?

[步骤 1/5]
[AI 思考]: {"type": "tool_call", "tool": "web_search", "params": {"query": "AI 人工智能最新新闻"}, "thought": "需要搜索最新 AI 新闻"}
[调用工具]: web_search
[工具结果]: 摘要:...

[步骤 2/5]
[AI 思考]: {"type": "final_answer", "content": "根据最新搜索结果..."}
[完成,共 2 步]

Agent:根据最新搜索结果,以下是 AI 领域近期重要动态:...
(对话记忆:2 条)

你:/plan 帮我调研 AI 编程工具的现状,写份简要报告

正在制定计划...
目标:调研 AI 编程工具现状
共 3 步:
  步骤 1:搜索主流 AI 编程工具  (工具:web_search)
  步骤 2:搜索用户评价和对比    (工具:web_search)
  步骤 3:整合信息,撰写报告

确认执行?(y/n):

不是截图,是你自己跑出来的。

每一行代码你都知道为什么在那里。


技术准备

环境要求:

  • Python 3.10 或以上(python --version 查看)
  • 一个 API Key

API Key 怎么获取:

如果在国内,推荐 DeepSeek(便宜,效果好,接口格式和 OpenAI 完全一样):

OpenAI 官方也可以,gpt-4o-mini 很便宜,跑完7天大概花 $0.5 以内。

代码怎么拿:

这个系列所有代码都可以在文章里直接复制,也会在文末提供 GitHub 地址(完整项目结构,每天独立目录,下载即用)。


开始吧

下一篇是 Day 1:《让 AI 帮你"做决定"——你的第一个 Agent》

我们会用不到50行 Python,做出一个真正能"感知→思考→行动"的程序。

不是玩具。是后面所有东西的骨架。


这个系列每天更新一篇,建议收藏本文,后续在评论区更新目录链接。

全部代码开源,文末附 GitHub 地址。