2026 年初,如果你还在靠复制粘贴 Prompt 驱动 AI,那你可能已经站在了被淘汰的边缘。
当所有人都在谈论那只叫 OpenClaw(龙虾) 的红色生物时,真正的行业巨头已经悄悄完成了从“对话型 AI”到“执行型 AI”底层架构的换代。虽然 OpenClaw 在 GitHub 极速爆红并引发开发者社群狂欢,但真正的生产力变革来自于基础设施的平民化。
3 月中旬,Google 开源 gws (Google Workspace CLI) 率先点燃了战场,一天内狂揽 10K+ Star。国内巨头迅速跟进:钉钉在 3 月 17 日宣布 AI 原生转型后,于 3 月 27 日正式上架 DingTalk CLI;飞书则在 3 月 28 日紧随其后上线 Lark CLI。这不只是代码仓库的更新,更是企业协作软件正式进入“人机协同”指令集时代的里程碑。
核心痛点:为什么“对话式 Agent”正在失效?
作为一名长期追踪 AI 生产力的开发者,我发现过去一年很多 Agent 一落地就“骨折”。
- 授权地狱: 调用一个 API 就要折腾半天 OAuth 认证。
- 黑盒操作: Agent 无法感知企业内部的实时上下文(如:老板此时是否在开会)。
- 执行断层: AI 只能给你建议,却没法替你把那封催办邮件发出去。
本质原因在于:GUI(图形界面)是给人类设计的,而 CLI 才是 Agent 的“母语”。 执行层打通,AI 才能真正干活。Google gws 的先行试水证明了这一点,而国内双雄的加入,则让这种“指令化”变得更接地气。
方案对比:飞书 vs 钉钉,两条分岔的进化路径
亲自上手体验后,我发现两家的策略逻辑有着本质区别。
| 维度 | 飞书 (Lark CLI) | 钉钉 (DingTalk CLI) |
|---|---|---|
| 开源协议 | MIT (极其宽松,鼓励生态衍生) | Apache-2.0 (严谨,符合企业级标准) |
| 核心逻辑 | 池塘策略:侧重上下文感知与生态连接 | 指令化重构:侧重原子能力的标准化调用 |
| 能力覆盖 | 2500+ API,覆盖消息、文档、多维表格等 11 域 | 首批 10 项核心能力,侧重 AI 表格、DING 消息 |
| 技术特征 | 强调 Aily 平台与 CLI 的无缝联动 | 强调底层重写后的高并发与稳定性 |
1. 飞书:把所有 Agent 引入自己的“池塘”
飞书的策略是**“上下文为王”**。通过 Lark CLI,开发者可以无缝调用全量资产。这意味着你的 Agent 不再是孤岛,它能感知群聊里的紧急程度。
- 优势: 极高的灵活性,适合初创团队快速搭建复杂的自动化流。
- 隐忧: 这种“全家桶”式的接入模式,是否会让企业数据过于中心化?在隐私合规要求极高的行业,开发者需要更谨慎地处理 Token 作用域。
2. 钉钉:让 AI 像操作 OS 一样操作钉钉
钉钉走的是**“原生重塑”**路线。它将产品功能变成 AI 可直接调用的标准化指令,避开了模拟 UI 操作的低效。
- 优势: 执行效率极高,非常适合处理大规模、高频次的指令流。
- 挑战: 这种“硬核重构”对存量系统的兼容性提出了挑战。对于拥有大量旧系统、非标准化流程的传统企业,迁移到这套原生指令体系的成本不容小觑。
技术实战:如何用 CLI 让 Agent 自动处理业务?
在 2026 年的开发环境下,你不再需要编写复杂的 SDK 调用代码。以 GitHub Issue 自动同步为例:
直接在 Agent 的 Tools 逻辑中执行:
# 示例:通过 Lark CLI 快速创建任务并通知
$ lark task create --title "修复 Bug #102" --due "2026-04-01"
$ lark im send --chat_id "oc_123" --content "新任务已同步"
# 示例:通过 DingTalk CLI 发起 DING 消息
$ dingtalk ding send --users "user_001" --text "服务器压力预警"
深度洞察:被忽视的潜在风险与行动指南
虽然 CLI 开源极大地降低了门槛,但我建议开发者必须警惕**“权限穿透”**风险。
- 安全隐患: 当你把 CLI 权限交给具备自主决策能力的 Agent 时,一旦发生 Prompt 注入,Agent 可能会误删数据。
- 实操建议: 1. 权限最小化: 为不同的 Agent 配置独立的 CLI Profile,仅开放必要的 Scopes。
2. 引入 Human-in-the-loop: 在涉及“发送”、“删除”等写操作指令前,必须由人工在终端进行一次
[Y/N]确认。
总结:上下文才是 2026 年的“硬通货”
这场由 Google 引领、国内厂商跟进的 CLI 开源浪潮,本质上是企业平台在争夺 AI 时代的“入口权”。
对开发者而言,这意味着**“API 编程”向“指令编程”的全面转型**。工具的门槛被踏平了,剩下的竞争力全在于你如何利用平台沉淀的高质量上下文。这场浪潮之后,企业协作软件将不再是网页或 App,而是一系列可以被 AI 随意调用的“乐高插件”。