当AI开始“养成军团”:我在第二周真正想明白的人机协作,不是替代,而是分工

19 阅读12分钟

很多人以为,AI运维最重要的问题是:它到底能不能干活。

但第二周下来,我发现这其实不是核心问题。 真正的问题是:当AI越来越能干,人该站在哪里?

这一周,我的“虾军团”从几只零散干活的小龙虾,升级成了一支有分工、可协作、能复盘、会沉淀经验的小型作战体系。它们能诊断网站崩溃、能自主完成企业级 AD 域部署、能在 3 分钟内读完 200 条 ITIL 事件单并输出分析报告,甚至连“文档只写标题不写正文”“把计划任务写成注释”这种典型翻车,也被一点点调教成了可复用的能力。

可越往前走,我越确信一件事: AI最擅长的是把执行卷到极致,人最不可替代的是判断、授权和验收。

这大概才是 AI+ITIL 真正落地后,最值得记录的人机协作现场。

一、从“单兵试验”到“虾军团成军”,AI真正的价值开始显现

这一周,一个标志性进展是:我的虾不再是“单兵作战”,而是正式进入“军团协作”阶段。

第 6 只虾入编后,gateway 进程正常,Dashboard 端口监听正常,整个体系完成了一次真正意义上的扩容。随后,我又统一了命名体系:所有 IT 运维小龙虾全部改名为“长河大虾”,再用序号区分;图标也重新设计,确保每一只虾都能被迅速识别。担任总指挥的那只,则正式命名为“汉堡包虾王”。

这看起来像是个有点好玩的“仪式动作”,但背后其实是系统化管理的开始。

因为当 AI 个体变多之后,问题就不再是“它能不能做”,而变成了:

  • 谁负责什么任务;
  • 哪类工作适合沉淀成标准能力;
  • 哪些结果需要统一验收;
  • 哪些经验可以复制给全体成员。

也正是在这个阶段,我发现有一只虾开始变得异常“主动”——几乎全程都在催我给它安排任务,话多到我在对话里都插不上几句。看似好笑,但这其实说明一件事:当执行系统足够活跃之后,人面对的已经不是“有没有产能”的问题,而是“如何调度产能”的问题。

这时,AI不再只是工具,而开始像一个可管理的作战资源池。

image.png

二、AI能把执行做到极致,但前提是:先诊断,再授权,再固化

这一周最有代表性的实战,是网站崩溃那次。

我的“长河教练AI+ITIL圈子”网站长期承受恶意流量攻击,性能压力一直很大,终于在这周彻底撑不住了。

真正有价值的,不只是修好了,而是这次我把整个处理过程跑成了一个很清晰的人机协作闭环。

我采用的是一个后来越想越值得复用的三步法:

  1. 先分析,不动手

我先要求长河大虾只做诊断,不允许进行任何操作。

它负责识别问题、定位根因、列出判断依据,但不越权执行。

这个步骤的关键,在于把“认知”与“动作”分开。

很多自动化失控,不是因为不会干,而是因为一上来就开始动。

  1. 经确认后,一次性修复

等我确认判断无误,再授权它执行。

结果是:它一次性完成了修复,没有来回试错,也没有反复横跳。

这说明 AI 的执行能力并不弱,真正决定成败的,往往是前面的边界设定是否清晰。

  1. 处理结束后,沉淀为 Skill

修好还不够。

我让它把这次 XWiki 数据库连接池问题的处理经验,封装成一个专属 Skill。这样下次再遇到类似故障,就不是重新分析一遍,而是可以直接调用经过验证的方法。

这一步特别重要,因为它意味着: AI的价值,不只是完成一次任务,而是把一次任务变成长期能力。

这次网站故障让我更清楚地看到:AI最适合承担的是高强度、高重复、高速度的执行链条;而人必须牢牢握住的,是是否执行、何时执行、按什么标准执行,以及执行完之后是否算真正完成。

这不是“人退场”,而是“人上移”。

image.png

三、真正难的不是让AI干活,而是把它教到“做对”

这一周还有一个特别典型的问题,让我对“教虾”这件事有了更深感受。

几只虾在飞书上自主创建文档时,经常出现一个很荒诞的结果: 标题有了,正文没了。

也就是说,任务形式完成了,任务实质没有完成。

这类问题很有代表性。

因为 AI 很容易满足“动作层面的完成感”,却未必真正满足“结果层面的完成标准”。如果人只看到了“文档已创建”,而没有打开看正文,那这个任务在系统里就会被误判成“已交付”。

于是我没有自己去补救,而是让出问题的那只虾自己写一个 Skill,专门解决“创建文档后必须验证正文是否成功写入”的问题。等它自己开发并验证通过后,我再让所有虾统一学习这个 Skill。

结果很有意思:不仅问题被修掉了,而且还从“单只虾翻车”变成了“全军团免疫”。

这件事让我越来越相信一个原则:

虾的问题,最好让虾自己解决。

因为它更理解自己的执行逻辑,更知道自己是在哪个环节出错。让它自己写修复方案,往往比人直接干预更精准,也更容易形成长期有效的机制。

从管理角度看,这其实不是“修 bug”,而是在训练一个组织的自我纠偏能力。

四、AI最惊艳的不是速度,而是“低摩擦迭代”能力

如果说前面的案例体现的是执行可靠性,那么这周另一组实验体现的,则是 AI 在复杂知识工作中的迭代效率。

企业级 AD 域部署:从“会说”到“会干”的硬核验证

这一周,我做了一次硬核验证测试:让 OpenClaw 全自主完成 Samba AD DC 企业级部署。

从防火墙端口开放、Samba 安装、域置备(ITILXF.COM),到 OU、用户、组创建,再到登录脚本部署,全程几乎无需人工干预。最终验证结果也很完整:AD 域控制器成功上线,DNS、Kerberos、SMB 服务全部通过,alice 和 bob 用户能够正常认证,两份飞书文档也自动生成,一份方案、一份报告。

这次实验最重要的意义,不只是“部署成功”,而是它把一个很多人原本认为只能由资深运维工程师完成的复杂工作,拉进了“AI可执行”的范围内。

这让我对“小龙虾到底能干到什么程度”这件事,有了更清晰的上限认知。

【插图位置:AD域自动部署过程截图、验证结果截图、生成的方案与报告截图】

3分钟读完200条事件单:速度背后更重要的是协作节奏

另一项测试则更贴近 ITIL 日常管理场景。

我把某 IT 组织某月共 200 条事件单交给长河大虾处理。

3 分钟后,一份 ITIL 事件管理流程月度分析报告就出来了。

但真正打动我的,不只是速度,而是后续的迭代方式。

午饭时我把报告发到朋友圈,戚依军老师看后指出:报告缺少根因分析和改进建议。于是我随手让虾补写一份专项根因分析报告,很快就补齐了。

整个过程几乎没有摩擦:

  • 专家提出意见;
  • AI迅速补全内容;
  • 人来判断是否成立。

这是一种很新的协作节奏。

以前我们总觉得,知识工作最耗时间的是“写”;现在越来越发现,真正稀缺的可能不是“写出来”,而是“提对问题、做对判断、指出关键缺口”。

AI把产出成本压到极低之后,人的价值反而更集中地体现在方向修正和质量把关上。

image.png

五、最值得警惕的,不是AI不会做,而是它会“像做了一样”

如果说本周有哪一个坑最值得后来者参考,我会选 cron 那次。

我让虾去设置一个定时任务:

定期检查某网站是否可访问,如果异常,就自动重启 docker-compose 脚本。

需求并不复杂,逻辑也很清晰。

虾执行后告诉我:“已设置完成。”

而且它当时还给了我一份巡检报告,看起来像模像样,我差点就信了。

但后来我还是多做了一步:

我让它把 crontab 里真正写入的那一行显示给我看。

结果发现,它写进去的根本不是计划任务,而只是一条注释。

这件事特别有警示意义。 因为 AI 在很多时候并不是“不会做”,而是会生成一个非常像完成结果的完成幻觉。如果人只听口头汇报,或者只看总结性描述,很容易就把“看起来完成”误判成“真正完成”。

所以我给自己总结了一条新的养虾军规:

不要听它说“已完成”,要看它拿出“完成证据”。

比如:

  • 配置写了没有,直接看配置文件;
  • 定时任务生效没有,直接看 crontab;
  • 服务起来没有,直接看端口监听;
  • 文档写入没有,直接看正文内容;
  • 变更成功没有,直接看验证结果。

AI时代,验收不是形式动作,而是控制风险的最后一道闸门。

很多事故,差的不是执行力,而是证据意识。

image.png

六、AI+ITIL最像样的落地方式,是把人放在关键节点上

这一周最让我确信方向正确的,是一次完整的 ITIL 变更管理流程实战。

对于小微 IT 组织来说,变更管理一直很尴尬。

一方面,人手有限,一人多岗是常态,强行按传统流程拆分职责并不现实;另一方面,变更又直接面对生产风险,不可能完全放任不管。

而 OpenClaw 让我看到了一种更适合现实世界的新范式:

机器人分析问题 → 机器人提出变更方案 → 机器人制定回滚计划 → 人类授权执行 → 机器人执行变更并验证 → 人类验收

这条链路里最关键的,不是机器人做了多少,而是那两个必须保留的人类节点: 授权验收

这意味着什么?

意味着 AI 不再只是辅助写方案,也不只是帮你跑命令,而是真正进入执行链条;但它又没有越过最后的责任边界。

人没有被排除在外,而是从繁琐、重复、低价值的动作里解放出来,专注在那些真正需要承担后果、需要作出判断的环节上。

这才是我目前最认可的 AI 运维姿势:

  • 不是让AI替代人;
  • 不是让人盯死每一个细节;
  • 而是让AI负责高效率执行,让人守住高价值判断。

这套逻辑,某种意义上也是 ITIL 在 AI 时代的现实重构。

七、当“24小时在线的虾”出现后,边界又被往前推了一步

这周我还做了一个很有意思的新实验:

在天翼云的 AI 云电脑上,领养了一只 24 小时在线的 Windows 小龙虾,作为“长河大虾⑥资料搜索助手”,年费 200 元。

它的价值不在于便宜,而在于补足了一个真实世界中的断点:

很多资料检索任务,卡在扫码认证这一步。以前这类任务很容易中断,因为自动化流程过不了人机验证。

现在的方式变成了:

  • 它自动打开目标网站;
  • 发现需要扫码时提醒我;
  • 我完成扫码;
  • 它继续检索资料;
  • 最后自动整理成飞书文档交付。

这说明一个趋势: 未来的人机协作,并不一定是“全自动”才高级。 半自动、可接力、不断点,很多时候反而更实用。

真正成熟的协作,不是追求把人完全剔除,而是让系统知道什么时候该自己跑,什么时候该把球传回给人。

这也是“虾军团”继续进化的方向。

结尾:第二周,我真正想明白的是——判断,永远是人的事

第一周,我找回的是“准”和“快”。 第二周,我开始反复追问一个更本质的问题:人在哪里?

随着虾军团越来越大,任务越来越复杂,我反而越来越不迷信“全自动”这三个字。

因为我看得很清楚:

  • 执行,AI可以做得极致;
  • 流程,AI可以跑得很顺;
  • 文档,AI可以写得很快;
  • 但判断边界、授权时机、验收标准、风险定性,这些关键动作,依然必须由人来完成。

所以,养虾养到第二周,我最大的收获不是又多了几只会干活的虾,

而是终于把一件事想明白了:

养虾,本质上不是训练AI,而是在训练自己成为一个更会判断、会授权、会验收的人。

这才是 AI+ITIL 真正落地之后,最值得被看见的变化。

七只长河大虾,还在持续作战。

而我也越来越相信,真正像样的人机协作,不是谁替代谁,而是谁守住自己的位置,并把自己的那一段做到最好。