AgentClaw：从AOI检测助手到全栈工业智能体从AOI产线的一个真实痛点出发，讲述AgentClaw如何从一个“缺

标签：AI Agent 工业AI AgentClaw LangGraph 智能制造 个人项目

Github:github.com/JamesW-ang/… 演示视频：B站：www.bilibili.com/video/BV1qe…

起点：一个AOI产线的真实痛点

我在产线上遇到的第一个AI问题，是AOI缺陷分析。

AOI设备每天产生上千张缺陷图片。每一张都需要工程师判断：这是真缺陷还是灰尘？是划痕还是气泡？需要停机检查还是可以放过？

一个批次的图片，熟练工程师需要2小时完成分析。而产线上只有3个工程师，他们还要处理设备调试、工艺优化、异常处理。缺陷分析永远排在最后，经常积压。

我做了一个最简单的工具：把缺陷图片发给Claude API，让它自动判断缺陷类型、严重程度、处理建议。效果出奇的好——单批次分析时间从2小时降到15分钟。工程师只需要复核关键判断，不用再逐张盯屏幕。

这就是AgentClaw的前身。

但很快我发现，产线上的AI需求远不止AOI分析。工程师每天被重复问题淹没：“这个报警代码什么意思？”“换型时配方怎么导？”“ConnectionPool的超时参数怎么设置？”300页的文档没人看，知识全在老师傅脑子里。

我需要一个更大的系统——不只是分析缺陷图片，而是能回答任何产线问题、能调用设备工具、能主动发现异常的智能体。

于是有了AgentClaw。

从0到1：L1的诞生

L1的目标很明确：让Agent能查文档、回答问题。

技术栈是LangGraph ReAct Agent + ChromaDB RAG检索。跑通的那天，我问它“上位机框架支持哪些运动卡”，它从文档里检索到答案，准确返回。我第一次感受到“知识库问答”的实用价值。

但L1有三个致命局限：

健忘：每次新对话，昨天的记忆全清空。
被动：只在用户提问时响应，设备异常了一无所知。
单步执行：只会回答问题，不会自主完成“检查良率→分析原因→生成报告”这样的闭环任务。

从1到5：逐层进化

L2 给Agent装上了“笔记本”和“监控屏幕”。三层记忆架构（对话摘要+知识库+用户偏好）让Agent记住历史对话；主动感知系统让它定时巡检设备状态，发现异常主动推送。

L3 给Agent装上了“手”。五个OS工具（文件读写、进程管理、浏览器控制、定时调度、系统监控）让Agent从“只能看”进化为“能动手操作”。每一层都有完整的安全防护机制。

L4 让Agent越用越聪明。反馈收集器采集每次执行的信号，经验学习器挖掘成功模式，自适应优化器动态调整参数，进化管理器在后台协调整体循环。

L5 补全了多模态和RAG能力。视觉理解工具让Agent能看懂AOI缺陷图片，图片生成工具让Agent能创建报告配图，手写的RAG引擎让Agent能检索私有知识库。

v6.1：生产级收官

v6.1是最近完成的版本。核心升级是三重可靠性保障：

指数退避重试（retry.py）：API调用失败时自动重试，指数退避+随机抖动防止重试风暴。
令牌桶限流（rate_limiter.py）：三层部署（全局HTTP限流、LLM调用限流、工具执行限流），保护系统不被过载。
健康检查（health.py）：兼容Kubernetes探针，ChromaDB+LLM API+内存三维检测，确保服务可自动恢复。

六层架构在v6.1最终确定：

text

L6 检测层（health.py）— ChromaDB/LLM API/内存三维健康检查
L5 服务层（api_server.py + demo_ui.py）— FastAPI + Gradio 双入口
L4 编排层（agent_core.py）— LangGraph ReAct 循环
L3 安全与可靠性层（security.py + retry.py + rate_limiter.py）
L2 工具层（tool_registry.py）— 18个工具的单例注册中心
L1 基础层（core/config.py + logger.py）— 配置+日志

18个内置工具覆盖五大类别：搜索、计算、文件操作、命令执行、代码沙箱、系统监控、进程管理、视觉分析、图片生成、知识库检索、浏览器控制。

整个系统约8300行Python代码，27个源文件，通过Docker Compose一键部署。

从AME视角看这件事

我是一名AME。我的工作不是写代码，是确保产线稳定高效运行。

当AOI缺陷分析成为瓶颈时，我用AI解决它。当知识传递成为瓶颈时，我用Agent解决它。当系统可靠性成为瓶颈时，我用工程化手段解决它。

AgentClaw不是一个“AI项目”，它是AME方法论在软件领域的延伸——识别瓶颈、拆解问题、定义方案、工程化落地。

六层架构的设计思路来自产线上的工位布局。安全纵深防御体系来自产线上的防呆设计。自主进化闭环来自产线上的持续改进流程。工程文档体系来自产线上的SOP标准。

我做的不是一个Agent。我是在为一个“数字产线”做设备导入。

产线需要AOI检测助手，更需要在未来的每一步都有合适的智能工具。AgentClaw已经从解决一个具体问题的工具，变成了支持多个场景的平台。当你知道系统可以如何扩展，也就知道了答案在未来的什么地方。

这，就是AgentClaw从AOI检测助手到全栈工业智能体的完整进化史。