兜兜转转,AI又回到了石器时代?

0 阅读4分钟

不知道大家有没有发现,最近互联网大厂开始推出自己家核心产品的CLI版本了,比如字节的飞书。

这个现象其实还蛮有意思的,不亚于当年文艺复兴。。。

这里先给不是IT行业的朋友们科普一下,CLI也叫命令行界面,只要你用过Windows系统的cmd终端,对这玩意儿应该不陌生。

没错,就是那个黑框框,古早时期使用电脑的那批人就是用这样的命令行界面和电脑操作系统进行交互的。

直到后来,有了GUI,我们现在看到的公众号界面就是GUI,也叫可视化界面。

GUI的出现解决了CLI学习门槛高、操作不直观、容错率低等等问题,某种程度上,电脑这玩意儿能够普及,GUI居功至伟。

后来,互联网兴起,大家用各种带界面的应用软件用的不亦乐乎。

再然后,到了2023年,ChatGPT出现了,整个人类社会正式迈进AI时代。

从一开始只能对话聊天,到2026年的今天,AI已经能作为个人助理帮你用电脑干活了,发展速度之快令人发指。

但AI在与外界交互的方式上却返祖了,从GUI倒退60年回到了CLI。

有在持续关注AI发展的朋友可能会发现,从Agent这个概念出现那一刻开始,整个圈子就一直围绕“AI到底应该用什么方式跟外部工具交互”这个命题在打转。

先是MCP在2025年上半年爆火,再到2025下半年,视觉方案随着豆包手机的推出成功破圈,接着是在大厂加持下的CLI潮流。

在AI时代,CLI突然变成香饽饽这事,其实我很诧异。

CLI这种交互模式天然比MCP省token,我承认。

CLI天生支持管道操作,灵活又高效,这个也没问题。

但这些,我认为都不是互联网大厂们急着花大力气去重构核心产品CLI版本的核心原因。

反复思考之后,我觉着大厂们这么干,目的在于争夺底层交互的主权

OpenClaw这种C端Agent的火爆,让大厂们意识到未来SaaS软件终将服务于AI,AI服务于人类。

MCP的本质是什么?是一套通用接口协议,它希望把所有工具和数据源都暴露在协议之下。

要命的是,这套交互协议是别人定义的。

对于大厂们来说,最难受的莫过于失去自主控制权,这是被别人卡了脖子啊。

自己用 CLI 重构就不一样了,这套接口怎么定义,自己说了算。

这事其实就跟十几年前浏览器百家争鸣很像,互相争夺生态主权呗。

到这,大厂纷纷转向CLI这事算是整明白了。

为啥像OpenClaw这样的开源产品,也在推CLI?

其实吧,这事就更简单了。

CLI 从20世纪发展至今,生态最成熟,也最完善,接入AI的成本最低。

各种数据库、开发工具、云服务以及操作系统本身,在AI到来之前,都已经存在了一套CLI。

而对于OpenClaw这种Agent基座,最重要的就是让用户以最低的成本用到最多的功能。

并且,CLI不够安全这个问题,在OpenClaw这类开源产品这里,恰好它就不是太大的问题。

从这两点来看,当然是CLI更合适。

那么,CLI是不是像广大AI博主说的那样,是AI触及外部世界的最终解决方案?

我的回答是否。

在20世纪初CLI刚刚面世时,那个时候人们也一定认为这是人机交互的最终解决方案,而后来,GUI把一切打破了。

现在的AI,就和那时的人们一样,刚刚开始踏入一个新世界。

历史的指针从不停止,我们刚刚见证的,或许只是下一个伟大时代的序章。