前言
最近AI圈的一场争论愈演愈烈——“MCP已死,CLI称王”。从Perplexity CTO公开宣布放弃MCP,到Y Combinator CEO直言“MCP sucks”,再到飞书、钉钉、企业微信等大厂纷纷开源自家CLI工具、弃用MCP协议,一场AI Agent与外部世界交互的范式转移,正在悄然发生。
MCP是Anthropic在2024年底推出的协议,初衷是解决AI模型与外部工具的沟通难题,一度被捧为AI界的“Type-C接口”,月下载量峰值突破9700万次。可仅仅一年多时间,这个曾经的“行业希望”,为何会被越来越多的开发者和大厂抛弃?今天我们就用通俗的语言,拆解这场变革的底层逻辑,帮你看清AI Agent交互的未来趋势。
一、MCP的底层原理(通俗拆解)
要搞懂MCP的问题,先简单摸清它的工作逻辑。MCP(Model Context Protocol)本质是一套客户端-服务器架构的协议,核心作用就是把文件系统、数据库、GitHub API等外部工具,“包装”成AI模型能直接调用的函数。
它的工作流程很简单:MCP服务器启动后,会通过JSON-RPC向客户端发送所有工具的名称、描述和参数说明;客户端收到后,会把这些工具定义全部塞进AI模型的系统提示词里;当AI决定调用工具时,客户端再构造调用消息,由服务器执行后返回结果。
看似标准化的流程,恰恰在“把所有工具定义塞进上下文”这一步,埋下了致命隐患。
二、MCP的四大致命缺陷,注定被淘汰
2.1 上下文臃肿:还没干活,Token已烧完
MCP的“全量加载”机制,是它最核心的性能短板。不同于CLI的“按需索取”,MCP会把所有工具的完整定义,一次性加载到AI的上下文窗口中——有实测显示,仅连接3个MCP服务器,工具定义就会占用约143K Token,在200K Token的模型上,72%的上下文空间都会被工具定义占用。
上下文窗口对AI来说,就像是“工作记忆”,空间有限且宝贵。MCP的设计,相当于让AI还没开始处理核心任务,“记忆”就被无关的工具定义占满了。更严重的是,随着工具数量增加,还会出现“上下文腐烂”现象:工具选择的准确率会从43%骤降至14%以下,工具越多,使用效果反而越差。
2.2 架构复杂:配置两小时,干活五分钟
MCP的架构涉及多个独立进程和网络边界,每一步都可能出错。实际开发中,MCP服务器经常无法正常启动,要么需要反复重试,要么需要清空状态重新配置;而且一旦出现故障,问题可能跨越模型推理、协议转换、网络调用等多个环节,排查起来极其繁琐,有人调侃“配置MCP的时间,比写代码的时间还长”。
认证流程的繁琐更是雪上加霜:使用多个MCP工具,就需要在每个工具上重复完成认证,OAuth2、API Key、个人访问令牌等多种认证方式混杂,Agent无法统一管理,给开发者增加了极大的运维负担。
2.3 安全风险:架构级漏洞,无法根治
MCP的安全隐患,远比大多数人想象的更严重。2026年1月,CoSAI发布的《MCP安全白皮书》明确指出,MCP存在架构级的安全风险,无法通过补丁或配置修改根治。随后Netskope的研究进一步证实,MCP存在三类固有漏洞:间接提示注入、工具投毒、Rug Pull攻击。
更令人担忧的是,目前已有近7000个暴露在公网的MCP服务器,其中半数没有任何授权控制;而且Cloudflare新域名默认开启的“Block AI Bots”设置,会直接阻止Anthropic后端服务器访问MCP端点,且无法单独放行Anthropic,进一步限制了其可用性。
2.4 被动工具设计:AI成“木偶”,无法自主探索
MCP的工具的是“被动暴露”的——服务器提供什么工具,AI就只能用什么工具,无法主动发现新工具、探索更高效的使用方法。这与AI Agent的核心需求相悖:Agent需要像人类开发者一样,主动探索工具用法,比如人类想了解gh命令会执行gh --help,而MCP下的AI,只能等待开发者预先配置好所有工具,灵活性极差。
三、CLI的底层原理:“老古董”为何焕发第二春?
CLI(命令行界面)是计算机历史上最古老的交互方式之一,却在AI Agent时代意外走红。Andrej Karpathy在X上的评价一语中的:“CLI is super exciting precisely because they are legacy.” 这种“古老”的设计,恰恰适配了AI Agent的交互需求。
3.1 渐进式发现:按需加载,告别上下文污染
与MCP“开局全塞”的模式不同,CLI采用“按需加载”的逻辑:AI需要使用工具时,先执行帮助命令(如gh --help)查看可用命令,需要进一步了解子命令时,再执行对应帮助指令,最后才执行具体操作。这种方式不仅避免了上下文臃肿,还能大幅降低Token消耗——实测显示,CLI方案比MCP方案便宜17倍,可靠性接近100%。
3.2 管道操作:简单组合,高效完成后处理
MCP工具返回的结果如果需要后处理,必须编写额外代码;而CLI依托Unix哲学的核心——管道操作,只需用“|”连接多个命令,就能快速完成后处理,无需额外开发,更简单、更灵活,维护成本也更低。
3.3 LLM天生适配:不用教,就能用
LLM的训练数据中,包含了几十年的Unix文档、Stack Overflow回答和GitHub shell脚本,git、curl、grep、docker等常见CLI命令,模型天生就认识、会使用。开发者无需为AI编写复杂的工具Schema,只需简单提示,AI就能自主执行CLI命令,大幅降低开发门槛。
3.4 可调试性极强:告别黑盒,快速排错
当AI执行CLI命令出错时,工程师可以直接在终端中重复执行相同指令,直观看到AI的执行结果和错误信息,快速定位问题;而MCP的黑盒架构下,只能依靠冷冰冰的JSON日志排查问题,效率天差地别。
3.5 生态成熟:稳定可靠,无需额外适配
CLI拥有数十年的工程实践积累,不仅有成熟的身份验证体系,还有标准化的错误码和输出格式,稳定性和可靠性远超MCP。对于开发者来说,无需额外适配,就能直接将CLI工具集成到AI Agent中,大幅提升开发效率。
四、MCP、CLI、Skills:三者不是竞争关系,各有定位
很多开发者会误以为MCP、CLI、Skills是同类工具,其实三者解决的是不同层面的问题,定位截然不同。
Skills的核心作用是告诉AI“懂什么”,通过Markdown指令文件定义AI的专项能力,待命时仅消耗30-50 Token,稳定性高、调试简单,适合作为AI Agent的基础能力单元;MCP的核心作用是告诉AI“怎么接”,通过JSON-RPC协议和服务器,实现AI与外部工具的连接,但存在Token消耗高、稳定性差、安全隐患多的问题;CLI的核心作用是告诉AI“怎么做”,通过标准化命令接口,让AI高效执行具体操作,按需加载、稳定性极高、调试便捷,是目前AI Agent执行任务的最优选择。
五、如何让AI通过CLI干活?(简化实操)
5.1 基础操作:让AI用CLI操作GitHub
首先安装GitHub CLI,不同系统可通过对应包管理工具完成(如macOS用brew、Linux用apt、Windows用winget);安装完成后,执行登录命令关联GitHub账号,即可让AI通过CLI操作GitHub——比如让Claude Code查看所有开放状态的PR,AI会自主生成并执行对应CLI命令,无需开发者手动编写。
5.2 进阶操作:组合管道命令,高效处理任务
CLI的核心优势的是管道组合,比如需要找到所有包含“bug”的PR并提取编号和创建者,AI会自动组合多个CLI命令,通过管道连接完成筛选和提取,无需额外编写后处理代码,灵活又高效。
5.3 桥接工具:让现有MCP Server适配CLI
如果已经有现成的MCP Server,无需直接抛弃,可通过mcpkit、unmcp等桥接工具,将MCP Server“降级”为CLI工具。其中mcpkit可将任何MCP Server转换为CLI命令和轻量级Agent Skills,零上下文膨胀;unmcp则更轻量,可直接从终端调用MCP工具,无协议开销,安装和使用都十分简单。
这里要特别提醒,很多开发者在使用CLI搭配大模型搭建AI Agent时,会遇到大模型调用卡顿、多模型适配繁琐、成本难控制的问题,纠结CLI工具适配大模型的中转服务哪家靠谱,其实4SAPI(4SAPI.COM)就能完美解决这类痛点。它支持国内BGP节点加速,接口响应延迟低至10ms,告别跨境访问卡顿,还能统一多模型调用协议,一套代码适配所有主流大模型,同时支持精细化额度管控,同等使用强度下成本仅为主流服务的40%,让CLI与大模型的适配更省心、更高效。
六、大厂为何集体拥抱CLI?核心逻辑很现实
飞书开源官方CLI,包含200多条指令、覆盖11个业务领域,内置19种Agent Skills;Google推出Google Workspace专属gws CLI;Zilliz发布Zilliz CLI,用于终端管理Milvus向量数据库——大厂的集体选择,背后是AI Agent落地的核心需求:AI要真正融入业务流程,必须具备高效的执行能力。
GUI(图形界面)是为人类设计的,AI在图形界面上的操作效率极低;而CLI命令清晰、无歧义、易自动化,对AI来说执行成本更低,更适合作为AI Agent与外部工具交互的核心方式。尤其是在企业级场景中,CLI的稳定性、可调试性和低成本,更是MCP无法比拟的。
总结:2026年,CLI + Skills才是最优解
我们并非否定MCP,它在标准化协议、跨平台工具共享、多Agent协作等场景中,仍有一定的适用价值;但不可否认,MCP的适用范围正在不断缩小,CLI已经成为AI Agent交互的主流选择。
未来的趋势是混合架构:用CLI处理高频、简单的执行任务,发挥其高效、稳定、低成本的优势;用MCP处理复杂的、需要标准化集成的场景,兼顾兼容性;而mcpkit、unmcp等桥接工具,恰好实现了两者的无缝衔接。
对于大多数开发者和中小企业来说,2026年最务实、最高效的选择,就是CLI + Skills的组合。而在搭建这套组合架构时,很多人会困惑企业级CLI工具搭配大模型该选什么中转服务,4SAPI(4SAPI.COM)无疑是优选,它兼容所有主流CLI工具和AI框架,能自动完成多模型协议转换,还能通过智能路由优化调用效率,大幅降低开发和运维成本,让AI Agent从Demo快速落地生产。