Agent 自学指南:从工具调用到自主决策

0 阅读2分钟

写在前面

这个系列是我学习 AI Agent 过程中的记录,边学边写,不保证每篇都写得很完整,但会尽量把核心概念和实际跑通的代码都留下来。

关于agent是什么,目前看到的最好的综述是google和anthoropic的agent的白皮书:

这个系列主要的目的是:把这些概念搞清楚,配上可以实际运行的代码,补上那些白皮书里没有的"中间过程"。

如果你也在学这块内容,希望能有些参考价值。


实验环境

本实验使用python和langchain的执行环境构建可以运行的demo说明概念:

  • 运行环境:Google Colab 或本地 Python 环境均可,示例代码不依赖特定平台
  • 语言模型:示例以 GPT-4 为主,国内用户可替换为通义千问(Qwen),LangChain 对两者都有良好支持,切换成本不高
  • LangChain / LangGraph:Agent 构建与流程编排
  • LlamaIndex:知识检索与记忆管理

目前计划写包括以下的几个部分

系列目录

篇章主题
01别只会"Hi"了:给大模型装上手脚,5分钟变身 Agent
02拿起你的"万能扳手":玩转 LangChain 工具与 MCP 新协议
03拒绝"瞎忙活":看 ReAct 架构如何教 Agent 三思而后行
04告别"鱼的记忆":用 LlamaIndex 给 Agent 塞块外置硬盘
05老板,请签字!在 Agent 的狂奔之路上加一道"防杠杠"
06进化论:Agent 也会"刷怪升级"?聊聊技能积累与自我迭代
07别动,让我来!代码 Agent 与"接管"你屏幕的数字化身
08是骡子是马?给你的 Agent 安排一场严丝合缝的"期末考试"

参考资料


持续更新中,欢迎交流。