要问这两天 AI 圈在比什么,毋庸置疑,就是谁家养龙虾又便宜又方便:
智谱刚刚发了个澳龙,把在本地部署满血龙虾这件事的门槛打下去;
腾讯也发布自家的小龙虾,也是最快 1 分就能搞定部署这件事;
壕是都非常壕,但好,到底好不好?
巧了,这两天刚好有一群极客和开发者,就对龙虾能用来干什么、干到什么程度,做了些有趣的实测。
例如下面这个可可爱爱的小马,就是免费龙虾的杰作:
**
△创作者:徐帆
不是说龙虾造了个硬件啊,而是这个龙虾的能力已经深度嵌入到了这个小马里面。
在它的身体里有一个语音识别的小芯片,我们可以通过说话的方式,让赛博小马在电脑上打开网页、生成视频,甚至自动创建文件夹。
这么个能看、能聊天,还能帮你干活儿的赛博宠物要是放你工位旁,那简直不要太卡哇伊。
然后还有创作者们一起做了给龙虾搞了线上办公室:
**
△创作者:海辛 & Simon 阿文
如果说过去我们用 AI,就像是往一个黑盒子里塞需求,那这个项目就是把黑盒子砸碎。
他们为龙虾打造了一套极具游戏感的 RPG 可视化面板。
你可以直观地看到你的 AI 此时此刻到底在干嘛——是在休息、在干活、在同步数据,还是在苦逼地修复 Bug。
这只虾甚至还能搬家、探索新地图,根据学到的新技能自动生成独特的技能树地图,还能联机共享,学习别的龙虾的技能点。
不难看出,这个龙虾在上面两个有趣的任务上的表现,不说 “夯”,但也起码“人上人” 的 level。
但如果到真正工作的场景中,这些龙虾是否还能 hold 住呢?
不止有趣,龙虾真能干实事儿
刚才我们看的龙虾可以打开网页去生成一个视频。
但接下来的这只龙虾,可以说是把工作做得更深了一层——视频自动剪辑。
**
△创作者:Gilbert
现在,你只需要告诉龙虾视频文件的位置,它就能自动进行静音检测(把没说话的废镜头全砍掉)、语音转录、切片剪辑。
长达 9 分钟的原视频,直接精剪到了 39 秒钟!
甚至面对多段视频素材,这只龙虾也能自动提取最佳段落并完成多素材拼接。
这对于视频剪辑工作者来说,尤其是那些自己录还有自己剪的博主们,可以说是省去了很大的工作量。
再如这只胜任电子班主任的龙虾:
**
△创作者:史皓天
这只龙虾要解决的,是在考研、考博这种高强度的教辅场景下,一个导师根本带不过来那么多学生的问题。
它能读取学生的科研设想文档,自动给出细致的评分和修改建议,还能辅导复试、搜索背景资料、评价文献综述。
结果显示,在一周的时间内,这只龙虾班主任在后台被调用了超过 2 万次 API。它能够清晰地记住每个学生的历史消息和专属档案,真正实现了规模化的个性培养。
最后,还有一只擅长搞钱的龙虾。
**
△创作者:Kevin
这是一个 MCN 海外营销实战,典型的一个人就是一支军队。
但在这个任务中,龙虾并不是只有一只,而是一个蜂巢虾群系统:
-
指挥塔:一个指挥虾(别名虾指挥);
-
商业化部门:大约 30 只员工虾,细分为猎手虾和联络虾;
-
内容孵化部门:大约 10 只员工虾,包括创作虾和质检虾;
-
创新小组部门:大约 10 只潜伏虾;
-
效率中台部:1-2 只知识虾。
为了方便管理,这套系统甚至给不同的虾设定了 MBTI 性格,增强协同的拟人感。
这套多 Agent 协同的玩法,可以说是精准击中了传统 MCN 极度依赖人力堆叠的痛点。
为什么需要给龙虾一个新的身份?
看完这些案例,如果你还觉得这只是极客们的一场赛博狂欢,那可能就错过了背后正在发生的产业暗流——一次真实生产环境大考。
在过去一两年里,我们对大模型的认知,普遍还停留在单兵作战的 Chatbot 阶段。
无论是 ChatGPT 还是各类网页、APP 版 AI,它们就像是一个被死死绑在椅子上的智者。你问它问题,它能口若悬河地给你讲宇宙起源、量子力学,甚至帮你写一篇华丽的文章。
但问题是,它没有手脚,也没有对你这个人和你所在公司的长期记忆,更触碰不到你的现实世界。
而以 OpenClaw 为代表的 Agent 框架,本质上就是在做一件事:给这个绑在椅子上的大脑,装上能感知世界的传感器(API),装上能干活的手脚(Skills),以及装上能形成经验的记忆中枢(Memory)。
这为什么极其重要?
因为在真实的商业世界里,真正的生产力爆发从来不在于个人效率,而在于团队协作。
我们去观察任何一家能够高效运转的企业,它的核心是依靠一套成熟的组织架构、信息流转机制和业务 SOP。
当大模型试图真正进入业务线跑起来时,它面临的其实是三个极其现实的组织管理命题:
第一,Agent 必须理解组织结构与权限。
如果一个 AI 只是一个飘在云端的账号,它是极其危险且无用的。在公司里,实习生不能查看核心财务数据,销售不能随意修改研发代码。
一个成熟的 Agent,必须知道 “我是谁,我在为谁服务,我能看什么数据”。它需要融入现有的企业权限体系中,否则它连查一份内部文档的资格都没有,更别提自动化审批了。
第二,Agent 需要一个稳定的身份。
打工人进公司第一件事是干什么?领工牌。工牌不仅仅是一个门禁卡,它代表了你在系统中的绝对唯一标识。对于 Agent 来说也是如此。
在 Kevin 的 MCN 案例和史皓天的电子班主任案例中,我们可以清晰地看到,AI 已经上岗 “质检员小 A”、“博导助理小 B”。
这种稳定的身份,是 Agent 之间、以及 Agent 与人之间建立长期信任和协作流的基础。如果没有固定的工牌,多 Agent 协同就是一纸空谈。
第三,Agent 需要分层的记忆。
Chatbot 只有当前对话的短期上下文记忆。但在实际工作中,一个项目可能要跨度三个月,涉及几十个文档、几百条群聊记录。
Agent 必须具备类似人类的记忆分层机制:短期记忆处理当下的指令,长期记忆(通过向量数据库或知识库对接)沉淀过往的项目背景、用户偏好和历史修改记录。只有读懂了昨天的数据,Agent 才能做出今天正确的决策。
当这三个命题被摆在桌面上时,整个 AI 行业的痛点也就变得无比清晰:
我们现在最缺的,其实是一个能让 Agent 安家落户的合适的工作台。
这个工作台必须同时具备三个底层基础设施:通畅的通信能力、结构化的业务数据流、以及丰富的协作上下文。
如果没有这样的工作台,开发者们就得自己去搭数据库、写权限校验、做前端 UI、搞消息推送…… 这无疑是把 “造汽车” 变成了“炼钢铁”,直接劝退了 99% 的业务人员。
这也就是为什么,当我们回过头去盘点上述那些极其硬核的极客案例时,会发现一个共性现象——他们都把龙虾接入了同一个平台:飞书。
但问题来了,为什么偏偏就非得是飞书啊?
首先,飞书把云文档、日历、多维表格这些核心办公组件,全部做了 API 模块化封装。这意味着开发者写 Agent 的时候,不需要像使唤老旧的 Windows API 那样反复授权、反复登录。
并且官方还发布了插件,可以让 OpenClaw 在飞书里丝滑地读取消息和调用工具。
其次,也是最关键的一点,飞书本身就承载了企业的通信和业务数据。Agent 跑在上面,就像是一个空降的高管,它不需要你手把手地喂数据、导入历史聊天记录。它直接就能 “看到” 群里正在讨论的项目、日历上即将到来的截止日期、多维表格里需要质检的 MCN 内容。
最后,门槛被已经被降低到了普通人都能操作的程度,已经实现了一键就能让你在飞书上养虾的功能,直接把部署的难题砍掉。
这种普及速度,是任何国外软件都无法比拟的中国式优势。
也正如我们刚才所说,Agent 技术已经走出了实验室的测试环境、走出了代码仓库里的 Demo,迎来了走入真实生产环境的全面大考。
在这场大考中,聪明的开发者们已经得出了答案:
一个优秀的 Agent 大脑决定了 AI 能做什么;但一个开放、包容、数据结构化且天然具备协作基因的底层平台,则决定了这个 AI 能做得有多好。
这帮在飞书里养龙虾的先行者们,虽然实际表现还有不尽人意的地方,但或许也算是在提前彩排未来的工作方式。
不过有一点是肯定的,打工人的协作空间,正在被重塑。
欢迎在评论区留下你的想法!
— 完 —