AI龙虾🦞部署好了,然后呢?

0 阅读20分钟

最近打开 X 和公众号真是铺天盖地的 OpenClaw(🦞 龙虾),相信配置小龙虾在现阶段已经不是难题(网上很多人都做了配置教程,还有方便的 SaaS 服务可以一键部署,包括kimi,minimax,百度等) avatar.webp

本文尝试从以下几个视角来剖析 openclaw:

  1. 为啥突然爆火且热度持续不断,和其他 agent 工具的本质区别在哪
  2. 这只小龙虾的核心原理是啥
  3. 普通人能用它来干啥

前言

说起来第一次知道 openclaw 🦞 还是我老婆告诉我的(2026.1.26)

当时我去 X 上搜了一下,一开始还不推荐折腾

刚开始火的时候配置门槛还是比较高的,基础设施也在不断迭代;于是想着过一段时间再试试

接下来的时间里,它从 clawdbot 改为 moltbot,又从 moltbot 改名为 openclaw;3 天的时间内有了三个名字...

而后的一个周末晚上,闲着无聊准备尝试一下,随便找了一个教程,没想到一把就配置成功了!

为啥爆火

关键还在于它的几点核心特性:

  • 龙虾的名称,风格可定制,技能也可以按需配置,每个人的龙虾不一样,是可以被调教和养成的,一下子具备了社交属性,激发拥有者的分享欲;
  • 支持记忆存储,搭配龙虾自身的 agent 能力,可自主进化,越用越顺手
  • 支持 IM 通讯工具接入,飞书,钉钉,企业微信等都可以接入;
  • 如果部署在个人电脑里,可以直接访问你的本地资源

能接入飞书等通讯工具是它区别于其他的 agent 最大的特色。这使得我们的工作极大程度上改变了!以前是依赖于PC端才能工作,离开电脑就没法干活。但是现在通过手机和龙虾聊天就可以工作。

以前你在通讯工具上通常是跟真人聊天,现在 openclaw 能接进来,并且它是有记忆的,它就住在你的电脑里,可以访问网页,可以截屏,甚至可修改本地文件再发送给你,这种奇妙的感觉和在传统 agent 对话框真的不太一样。

读取本地文件并发送

一句话总结 OpenClaw 爆火的最大原因,是它在“AI 个人助理即将到来但还没真正落地”的饥渴窗口,**用最简单、最接地气的方式(发消息 → 本地干活 → 持久记忆)**给了大家一个“哇塞这玩意儿真能用”的震撼体验,实现了 AI 从 “被动对话” 到 “主动干活” 的范式跃迁。

然后病毒传播 + 社区自燃就一发不可收拾了。

核心原理

Unlocking the “Lobster Way”: A Technical Deep Dive into OpenClaw’s Architecture

openclaw 核心流程

我们从左往右尝试理解这张图:

每个环节都对照图例来查看下面解释,其实不复杂。

  1. Telegram 和 Discord 是两种通讯工具
  2. Channel Adapter 的核心职责就是负责消息的接收和处理,把各类的工具的不同消息格式都做个漏斗适配,最终都转换成 “文本” + “附件” 的统一格式,交给 Gateway Server
  3. Gateway Server负责协调和管理会话(the coordinator),确保多条会话都在各自的队列里,不会错乱。
    1. 例如 telegram 里可能存在多个用户会话,每个会话都会有一个独立 sessionid,消息历史会按 id存储到对应的 Queue 里,确保消息的有序不冲突;
    2. 再例如一只龙虾可能同时被多个用户订阅,telegram 和 discord 同时来消息了,都是要对同一个文件进行修改操作,这时候该怎么办? Gateway Server 的做法是串行处理,处理完第一个再处理第二个消息,避免错乱。
  4. Agent Runner 负责 prompt 组装和上下文管理
    1. System Prompt Builder:组装系统提示词,和传统 agent 不同的是,它是**“动态”组装**的机制,也就是说,每条用户消息进来,它都会重新扫描文件、拉记忆、拼工具列表,确保 prompt 永远是最新的。
    2. LLM Context Window Monitor:实时监控对话上下文的长度,假设上下文已经到达模型的上限的75%了,就对最靠前的部分消息进行对话压缩,只保留核心内容。这样可以做到既不丢失重要信息也会超过模型的最大上下文。(Context Guard 说的就是这个意思)
  5. LLM API Interaction 这个很好理解,就是处理好上下文后,会调用一次 LLM 大语言模型
    1. 可以接入 openAI 的模型
    2. 也可以接入 anthropic 的模型
    3. 或者其他国内模型(kimi,minimax,glm等)
  6. Agentic Loop
    1. 简单理解是 ReAct 模式:思考-执行-观察,中间可能包含多个执行步骤(工具执行)
    2. 一直Loop这个流程,直到结合所有的上下文可以直接回答用户的问题,再将最终的结果发送给 IM 工具。
  7. IM 工具收到消息,呈现给用户。

整个过程梳理下来,就会非常清晰。


另外,从使用者的角度来看,你的龙虾🦞会存储以下文件:

  • SOUL.md:龙虾的“灵魂”,这个文件里给你的龙虾起名字、定人格。让它每次醒来都记得“我是谁”;
  • AGENTS.md:龙虾的操作手册,龙虾通过阅读这个文件知道如何进行工作;
  • USER.md:龙虾主人的信息,也就是你的信息,帮助龙虾更好的了解你;
  • TOOLS.md:龙虾的工具清单,给你的龙虾扩展执行能力;
  • MEMORY.md:存储龙虾的“长期记忆”,聊天过程中的一些重要信息都会被记录到这个文件里。

对话过程中,龙虾可以自主地修改这些文件内容来进化自己。这也是它为什么会越用越聪明的原因。

理解了这些文件,会对你使用龙虾非常有帮助。

使用场景

都说这只龙虾🦞好,作为不写代码的普通用户,到底能利用它做些什么?

以下是我尝试过的一些案例:

整理文件

由于我是直接将🦞部署在我的个人电脑上,所以龙虾能看到所有的文件。有些文件很乱,不想手动整理,可以交给他。

整理桌面只是一个基本案例,重点是演示一下它有访问和处理本地文件的能力。龙虾有了基础能力,想象空间就大了:前言中也提到另一个案例,就是把电脑上的文件传到手机上。

定时任务

就像是定闹钟一样,通过聊天的方式让龙虾帮你设置定时任务,到时间了它就会发消息通知你,并且自动监测任务状态。这个在传统 chatgpt 工具上没办法做到吧。

定时任务也是龙虾🦞的通用能力,利用这个能力,可以做好多事情:记录待办,邮箱提醒,定时爬取新闻供你阅读,甚至定时帮你发小红书等等。

这一切都不用分布在各个软件上进行,都是在你最常用的通讯工具上完成。

全渠道信息收集助手

这里推荐一下社区最新开源的 Agent Reach@Neo_Reidlab),我试了一下非常实用

AI Agent 已经能帮你写代码、改文档、管项目——但你让它去网上找点东西,它就抓瞎了:

  • 📺 "帮我看看这个 YouTube 教程讲了什么" → 看不了,拿不到字幕
  • 🐦 "帮我搜一下推特上大家怎么评价这个产品" → 搜不了,Twitter API 要付费
  • 📕 "帮我看看小红书上这个品的口碑" → 打不开,必须登录才能看
  • 📺 "B站上有个技术视频,帮我总结一下" → 连不上,海外/服务器 IP 被屏蔽

如上,一只基础的龙虾在网络资源获取上能力有限的,现在各种网站都需要认证,也有反爬机制。

装上这个 Agent Reach 技能包,能让我们的龙虾🦞进行全网资源获取,能看小红书、推特X,youtube,B站,RSS...

这个项目几天前开源,我自己也试用了下,非常实用的工具,分享给大家!

首先给你的龙虾发一条消息就可以安装它

帮我安装 Agent Reach:raw.githubusercontent.com/Panniantong…

接下来,尝试让他查看一下B站资源

再让他查看下 X(推特)上的最新消息:

一开始行不通,但是按照github上的指引,继续和龙虾聊天,让他帮忙配置。

按这个流程把对应的消息给龙虾后,🦞就在后台帮你打通X信息的获取流程了,这是他最终的返回结果:

更多的场景

年前在良渚参加了一个 OpenClaw 线下交流会,开放麦环节很多人上台分享自己的使用案例,收益匪浅。

2026.2.12 杭州良渚 openAI 线下交流会

印象最深的两个:

  1. 一名来自创业公司的伙伴,他们团队用mac mini部署了openclaw 🦞 ,甚至还给它弄了个工位,打通了让龙虾🦞自己领任务-->写代码-->写测试用例--> 提pr-->部署的流程;新的协作方式只需要在项目管理平台上指派任务给它,后面的流程基本可以做到自动化。这是完完全全把龙虾当一个“人”来对待了。
  2. 另一位独立开发者,提出了“vibe PRD”的概念,相对于 vibe coding。现在AI coding的能力越来越强,代码几乎不需要手写了,只要把需求文档(PRD)写好写完善,后续的流程理论上都可以让龙虾🦞帮你自动完成。——我一下子联想到这不就是我上个团队去年一直想做的事情么!对于非技术攻坚的常规需求任务,让产品经理根据指定风格来撰写PRD,然后制造一整条 AI coding 工作流,完成代码的开发,测试,CI/CD 以及自动上线。

还有人分享他们使用龙虾 🦞 来帮助他们打通自动回复 appStore 里的用户评论,极大释放了人力成本。

这些都是真实的生产力案例,第一次去现场交流收益还是很大的,和身边的人交流如何使用真是一种非常不错的学习方式。

还有更多的使用案例可以去 X 上继续探索。

写在最后

听了很多播客,都说 openclaw🦞 不是什么革命性的新技术,每一个组件拆开来看都不新鲜——LLM 调用、Prompt 工程、Bot API 接入、本地工具调用。根据本文原理部分的分析,确实也是这样。

但它把这些东西组合在一起,放到了一个大家每天都在用的场景(IM 聊天)里,体验上就产生了质变。

目前 openclaw 的热度仍持续不断,很多博人眼球的案例都还停留在概念性阶段,目标愿景是美好,同时也有很多安全问题需要技术攻坚,但这一天终会到来,我们离AGI 真的越来越近。

对于普通人来说,我们就吃好睡好保持身体健康,保持求知欲,积极使用各类 agent 工具,享受 AI 时代带来的便利和全新体验!