大家好,我是AI淇橦学。
上期问大家:你把做好的应用给身边的人试用了吗?他在哪里卡住了?
评论区里有几条让我印象很深——有人说用户盯着「客户描述」输入框不知道该写什么,以为要填完整的公司全名;有人说智谱审查报价单时日志滚太快,用户看不清楚发生了什么;还有人说执行完了用户不知道文件在哪里,找了半天……
这些反馈非常真实,也非常有价值。你在自己测试时绝对发现不了这些问题,因为你知道所有答案。真实用户测试的价值就在这里——它告诉你「你以为很明显」但用户根本不知道的地方。
好,今天第8期,这一期不讲新的技术概念。8期做下来,你已经接触了足够多的内容——现在该做的,是把这些内容整理清楚,形成真正属于自己的认知框架,然后规划接下来的路。
一、8期做了什么——完整回顾
先用最简短的方式把8期的核心内容串一遍:
| 期数 | 主题 | 核心内容 |
|---|---|---|
| 第1期 | 基础认知 | 搞清楚 AI / LLM / Chatbot / Workflow / Agent 的区别;明确要做一个桌面端销售报价单 Agent |
| 第2期 | 8模块结构 | 把 Agent 拆成 8 个模块:目标/模型/工具/记忆/规划/执行/反馈/约束;理解每个模块的作用 |
| 第3期 | 工具调用 | 工具调用的底层机制:AI 只发指令,程序去执行;用 Codex 做出了 3 个核心工具:read_file / write_content / save_file;在终端里第一次跑通报价单填写 |
| 第4期 | 大模型接入 + 记忆 | 接入智谱 API,封装 llm.py;建立客户知识库,智谱做语义搜索,输入「南山区那家传感器公司」能找到正确客户 |
| 第5期 | 规划能力 | 智谱批量分析任务、制定执行计划、给出针对性备注;实现批量模式,一次处理多份报价单 |
| 第6期 | 评估与自检 | 两层自检:规则检查字段完整性 + 智谱审查内容合理性;故意制造错误验证拦截效果 |
| 第7期 | 整合与界面 | 把 5 个模块装进 tkinter 桌面应用;后台线程运行智谱调用,界面不卡死;真实用户测试 + MVP 验收 |
| 第8期 | 知识整理(本期) | 整理知识地图;规划后续迭代路径;结束是新的起点 |
二、你真正掌握的,是 5 种能力
8期学了很多概念——RAG、ReAct、Function Calling、智谱 API……但这些技术名词本身不是最重要的收获。最重要的,是你在实际动手过程中练到的 5 种能力。
这 5 种能力不会过时——不管 AI 框架怎么更新、模型怎么迭代,这 5 种能力永远有用:
| 能力 | 具体表现 | 你在哪里练到的 |
|---|---|---|
| 描述能力 | 把你想做的事用清晰准确的自然语言说出来,让 Codex 生成符合要求的代码;给智谱写出有效的 prompt,让它做出你想要的判断 | 每期的「发给 Codex 的提示词」——你每次描述越来越精准;第4-6期给智谱写 prompt 时的反复打磨 |
| 拆解能力 | 把「做一个销售报价单 Agent」这个大目标,拆成 5 个模块、6 个文件、8 步数据流、6 项验收标准 | 第2期结构设计、第5期任务规划、第7期整合检查表 |
| 验收能力 | 知道怎么判断结果是否正确:不只看有没有报错,还要看智谱的判断是否合理、字段有没有错位、原文件有没有被修改 | 第6期的两层自检设计 + 实际故意出错的测试 |
| 调试提问能力 | 出错时提供「具体现象 + 日志 + 初步判断」,让 Codex 快速定位问题,而不是只说「有 bug 帮我修」 | 每期「遇到问题怎么办」里的报错处理经验 |
| 迭代能力 | 从最小可用版本开始,每次只加一个功能,边加边验证,不追求一步到位 | 整个 8 期课程的结构本身——每期只做一件事,做完验证,再进下一期 |
这 5 种能力的本质: 它们是「用 AI 工具做事」的通用能力——不只适用于做报价单 Agent,也适用于用 Codex 做任何项目、给智谱写任何 prompt、用 AI 工具完成任何任务。你在做这个 Agent 的过程中,顺带训练了一套通用的「AI 协作能力」。
坦白说,我觉得这 5 种能力的价值,远大于你学会了具体的某个技术框架。框架会过时,但这套做事方式不会。
三、你的 Agent 知识地图
把8期的核心知识点整理成三个层次。这张地图你可以收藏,之后遇到 Agent 相关的概念,都可以对照这里找到位置:
概念层——是什么
| 知识点 | 一句话理解 |
|---|---|
| AI / LLM / Chatbot / Workflow / Agent | Agent = AI 大脑 + 工具 + 自主规划,能真正帮你做事,不只是告诉你答案 |
| 上下文窗口 | AI 的「工作桌面」有大小限制,超出就丢弃最早的内容;对话结束桌面清空,这就是 AI 没有记忆的本质 |
| 智谱 API | 通过 HTTP 请求调用智谱模型的接口;ask_zhipu() 发指令,ask_zhipu_json() 要求返回结构化数据 |
| Token 和费用 | 约 1 个汉字 = 1.5 个 Token;处理一份报价单约消耗 500-800 Token |
机制层——怎么做到的
| 知识点 | 一句话理解 |
|---|---|
| 工具调用 / Function Calling | AI 只发指令,程序去真正执行,结果再返回 AI;AI 从头到尾只处理文字 |
| RAG 5步流程 | 切片→向量化→存库→检索→生成;让 AI 基于你的真实文档工作,而不是靠猜 |
| 智谱语义搜索 | 把客户列表和搜索描述一起发给智谱,智谱理解语义并返回最匹配的客户;比 TF-IDF 更灵活,能处理「南山区那家」这种模糊描述 |
| Plan-and-Execute | 先让智谱把所有步骤规划出来、你确认、再按顺序执行;适合批量处理等步骤固定的场景 |
| ReAct 循环 | 思考→行动→观察→继续,每步根据实际结果决定下一步;适合处理格式不固定的复杂任务 |
实践层——怎么用好
| 知识点 | 一句话理解 |
|---|---|
| 工具设计三原则 | 单一职责 + 描述清晰 + 返回易读;工具描述写清楚,智谱调用出错的概率大幅降低 |
| 给智谱写 prompt 的关键 | 说清楚角色、输入、输出格式、边界约束;要 JSON 就明确说「只返回 JSON,不要任何其他文字」 |
| 目标漂移防范 | 描述加边界(不能做什么)+ 执行前展示计划 + 批量操作加预览确认 |
| 两层自检设计 | 规则检查快速过滤明显问题(不消耗 API),智谱审查处理规则覆盖不到的语义问题 |
| 调试三要素 | 具体现象 + 相关日志 + 初步判断;这三个信息给全,Codex 能直接定位问题 |
| 线程与界面 | 智谱 API 调用放在后台线程,用 queue 传递消息更新界面,界面才不会卡死 |
四、接下来 3 个月的规划
8期结束,但迭代没有结束。根据大家在评论区提到的真实需求,这是一个可参考的 3 个月规划:
第 1 个月:让它真正融入日常工作
目标:把这个 Agent 变成你日常出报价单的默认工具,在真实工作中用起来。
具体做法:
- 把你真实的客户资料都录入
客户资料.json,不要只用示例数据 - 每次出报价单都用这个程序,记录遇到的问题(智谱匹配错了?字段没填上?界面哪里不顺手?)
- 集中修复最影响日常使用的 3 个问题——用 Codex 解决,每次修复完验证一遍
完成标志:连续用 2 周,没有出现需要手动纠正的错误。
第 2 个月:扩展一个真正需要的功能
目标:根据第 1 个月的真实使用,找到最痛的一个点,加一个新功能。
高频需求参考(选一个,每次只加一个):
| 需求 | 难度 | 怎么加 |
|---|---|---|
| 支持 PDF 格式的报价单 | ⭐⭐ | 安装 pdfplumber 库,新增 read_pdf 工具函数 |
| 生成完报价单后自动发邮件 | ⭐⭐⭐ | 用 Python 的 smtplib 库,让智谱生成邮件正文,附上报价单文件 |
| 支持从 Excel 表格批量导入客户 | ⭐⭐ | 用 openpyxl 读取 Excel,转成 客户资料.json 的格式导入 |
| 报价单生成后自动保存到指定云端文件夹 | ⭐⭐⭐ | 接入云盘 API |
每次只加一个,加完在真实场景里测试稳定了,再考虑加下一个。
第 3 个月:沉淀方法,准备做第二个 Agent
目标:把这 8 期学到的方法沉淀成可复用的资产,开始规划第二个 Agent。
具体做法:
- 整理你自己的提示词模板库:把每期「发给 Codex 的提示词」里有效的部分存成文档,下次做新项目直接复用
- 把
llm.py整理成通用模块:它不只适用于报价单场景,任何需要调用智谱的项目都可以复用 - 规划第二个 Agent:用同样的方法论——先想清楚「输入是什么、输出是什么、智谱在哪几个环节做判断」,再动手
第 3 个月最重要的事:做第二个 Agent。
第一个 Agent 是学习的过程,第二个才是验证的过程——验证你是不是真的掌握了这套方法论,而不只是跟着课程走了一遍。第二个 Agent,从立项到跑通的速度,应该比第一个快至少一倍。如果没有快,说明有什么东西还没真正内化,值得回头再想一遍。
五、给整个系列一个句号
我想用一句话来总结这 8 期:
做 Agent 最核心的不是写代码,是把你想做什么说清楚——说给 Codex,说给智谱,说给自己。
你把目标说清楚了,Codex 能帮你写代码;你把任务说清楚了,智谱能帮你做判断;你连自己都没想清楚,再好的工具也帮不了你。这不是 AI 的限制,这是「思考」本身的价值。
这 8 期的价值,不只是你学会了 RAG 或者智谱 API,而是你练了一遍「怎么把一个模糊的想法,一步步变成一个可以真实运行的、有 AI 大脑的产品」。
从第3期第一次在终端里看到报价单被自动填好,到第7期把整个系统装进一个窗口应用,交给不懂技术的人也能用——这个过程里你不只是在「学 Agent」,你是在练一种工作方式:把问题拆清楚,用对工具,一步一步验证,不追求一步到位。
这种工作方式,在 AI 时代会越来越重要。
系列结束了,但不是全部结束。
我会继续更新——记录我怎么迭代这个报价单 Agent,加入邮件发送、PDF 支持,以及我开始做第二个 Agent 的全过程。
关注我,我们继续。
思考题: 8期学下来,你最有收获的是什么?是某个具体的技术,还是这套工作方式?评论告诉我。
关注公众号「AI淇橦学」,和 AI 一起成长。
有问题或建议?后台留言即可。
后台回复“Agent”,领取课程讲义。