标签:AI Agent 工业AI AgentClaw LangGraph 智能制造 个人项目
Github:github.com/JamesW-ang/… 演示视频:B站:www.bilibili.com/video/BV1qe…
起点:一个AOI产线的真实痛点
我在产线上遇到的第一个AI问题,是AOI缺陷分析。
AOI设备每天产生上千张缺陷图片。每一张都需要工程师判断:这是真缺陷还是灰尘?是划痕还是气泡?需要停机检查还是可以放过?
一个批次的图片,熟练工程师需要2小时完成分析。而产线上只有3个工程师,他们还要处理设备调试、工艺优化、异常处理。缺陷分析永远排在最后,经常积压。
我做了一个最简单的工具:把缺陷图片发给Claude API,让它自动判断缺陷类型、严重程度、处理建议。效果出奇的好——单批次分析时间从2小时降到15分钟。工程师只需要复核关键判断,不用再逐张盯屏幕。
这就是AgentClaw的前身。
但很快我发现,产线上的AI需求远不止AOI分析。工程师每天被重复问题淹没:“这个报警代码什么意思?”“换型时配方怎么导?”“ConnectionPool的超时参数怎么设置?”300页的文档没人看,知识全在老师傅脑子里。
我需要一个更大的系统——不只是分析缺陷图片,而是能回答任何产线问题、能调用设备工具、能主动发现异常的智能体。
于是有了AgentClaw。
从0到1:L1的诞生
L1的目标很明确:让Agent能查文档、回答问题。
技术栈是LangGraph ReAct Agent + ChromaDB RAG检索。跑通的那天,我问它“上位机框架支持哪些运动卡”,它从文档里检索到答案,准确返回。我第一次感受到“知识库问答”的实用价值。
但L1有三个致命局限:
- 健忘:每次新对话,昨天的记忆全清空。
- 被动:只在用户提问时响应,设备异常了一无所知。
- 单步执行:只会回答问题,不会自主完成“检查良率→分析原因→生成报告”这样的闭环任务。
从1到5:逐层进化
L2 给Agent装上了“笔记本”和“监控屏幕”。三层记忆架构(对话摘要+知识库+用户偏好)让Agent记住历史对话;主动感知系统让它定时巡检设备状态,发现异常主动推送。
L3 给Agent装上了“手”。五个OS工具(文件读写、进程管理、浏览器控制、定时调度、系统监控)让Agent从“只能看”进化为“能动手操作”。每一层都有完整的安全防护机制。
L4 让Agent越用越聪明。反馈收集器采集每次执行的信号,经验学习器挖掘成功模式,自适应优化器动态调整参数,进化管理器在后台协调整体循环。
L5 补全了多模态和RAG能力。视觉理解工具让Agent能看懂AOI缺陷图片,图片生成工具让Agent能创建报告配图,手写的RAG引擎让Agent能检索私有知识库。
v6.1:生产级收官
v6.1是最近完成的版本。核心升级是三重可靠性保障:
- 指数退避重试(retry.py):API调用失败时自动重试,指数退避+随机抖动防止重试风暴。
- 令牌桶限流(rate_limiter.py):三层部署(全局HTTP限流、LLM调用限流、工具执行限流),保护系统不被过载。
- 健康检查(health.py):兼容Kubernetes探针,ChromaDB+LLM API+内存三维检测,确保服务可自动恢复。
六层架构在v6.1最终确定:
text
L6 检测层(health.py)— ChromaDB/LLM API/内存三维健康检查
L5 服务层(api_server.py + demo_ui.py)— FastAPI + Gradio 双入口
L4 编排层(agent_core.py)— LangGraph ReAct 循环
L3 安全与可靠性层(security.py + retry.py + rate_limiter.py)
L2 工具层(tool_registry.py)— 18个工具的单例注册中心
L1 基础层(core/config.py + logger.py)— 配置+日志
18个内置工具覆盖五大类别:搜索、计算、文件操作、命令执行、代码沙箱、系统监控、进程管理、视觉分析、图片生成、知识库检索、浏览器控制。
整个系统约8300行Python代码,27个源文件,通过Docker Compose一键部署。
从AME视角看这件事
我是一名AME。我的工作不是写代码,是确保产线稳定高效运行。
当AOI缺陷分析成为瓶颈时,我用AI解决它。当知识传递成为瓶颈时,我用Agent解决它。当系统可靠性成为瓶颈时,我用工程化手段解决它。
AgentClaw不是一个“AI项目”,它是AME方法论在软件领域的延伸——识别瓶颈、拆解问题、定义方案、工程化落地。
六层架构的设计思路来自产线上的工位布局。安全纵深防御体系来自产线上的防呆设计。自主进化闭环来自产线上的持续改进流程。工程文档体系来自产线上的SOP标准。
我做的不是一个Agent。我是在为一个“数字产线”做设备导入。
产线需要AOI检测助手,更需要在未来的每一步都有合适的智能工具。AgentClaw已经从解决一个具体问题的工具,变成了支持多个场景的平台。当你知道系统可以如何扩展,也就知道了答案在未来的什么地方。
这,就是AgentClaw从AOI检测助手到全栈工业智能体的完整进化史。