1、什么是MCP?
MCP是指Model Context Protocol(模型上下文协议),是AI领域的一个标准化协议,用于连接AI应用与外部工具、数据源。在原文语境中,MCP与Agent Skills是AI应用开发中的不同技术方向,MCP侧重于统一工具集成的协议标准,而Agent Skills则是具体的AI能力模块。
MCP的具体含义:
● 定义:MCP是2024年11月Anthropic开源的AI工具集成协议,旨在解决AI应用与外部系统(如数据库、文件系统、开发工具等)的集成复杂性问题。
● 核心目标:通过统一的JSON-RPC协议,让AI应用(Host)、客户端(Client)和工具服务端(Server)形成标准化通信体系,实现AI无需手动复制信息即可直接调用外部资源。
● 架构:包含Host(AI应用)、Client(协议通信组件)和Server(外部工具)三个角色,支持本地(Stdio)和远程(Streamable HTTP)传输,提供工具调用、资源访问和提示模板三种核心能力。
● 区别于Function Calling:MCP是跨厂商的开放标准,解决了不同AI平台函数调用协议不兼容的问题,降低了工具集成的M×N复杂度(M为AI应用数量,N为工具数量)。
延伸拓展:
● 应用场景:已被OpenAI、Google、Microsoft等大厂支持,广泛应用于AI编程(如Cursor开发工具)、企业数据分析(连接内部数据库)、工作流自动化(跨平台协调任务)等领域。
● 争议与改进:2025年底后因传输机制复杂、文档质量不足、权限管理缺失等问题受到开发者批评,但其已进入Linux基金会治理体系,多家安全厂商推出MCP安全网关产品,逐步完善生态。
● 意义:MCP代表AI从对话式工具向可操作世界的Agent的转折点,通过标准化协议降低了企业级AI部署成本,推动AI应用从单一功能走向全流程自动化。
MCP --“管道工”,体现连接能力
想象你用智能音箱点外卖时,它需要同时连接外卖平台、支付软件和你的地址信息——如果这些系统各说各话,智能音箱就会手忙脚乱。MCP就像给AI装了个"万能插座",让不同公司开发的AI(比如ChatGPT、文心一言)能统一"插"上各种工具(比如Excel、摄像头、快递系统),不用重复造轮子。
举个生活例子:以前你用AI查天气,得手动把"北京明天天气"输进去;有了MCP后,AI能直接"问"天气软件,甚至自动根据你的定位推荐带伞。这背后就是MCP在当"翻译官",让AI和工具用同一种"语言"对话。
为什么需要MCP?
没有MCP时,每家AI公司(OpenAI、百度等)都有自己的工具连接方式,就像不同品牌的手机充电器不通用。开发者想让AI同时用Excel和摄像头,得写两套代码。MCP出现后,所有工具都遵守同一套规则,开发者写一次代码就能让任何AI调用任何工具,就像现在所有手机都能用USB-C充电。普通人能感受到的变化:
● 更"聪明"的AI助手:比如你让AI整理邮件,它能直接打开你的邮箱,按"紧急程度"分类,甚至自动回复——这些都需要MCP连接邮箱系统。
● 跨APP协作更丝滑:用AI写报告时,它能自己从Excel取数据、从PPT调模板,不用你手动复制粘贴。
不过MCP也像刚学会走路的孩子:2025年很多开发者抱怨它"太复杂"(比如设置权限像解迷宫),但现在Linux基金会接手后,就像给这个"万能插座"加了安全保护和使用说明书。未来你用AI处理的事情越复杂(比如规划旅行、管理健康),就越离不开MCP这个"幕后翻译官"。
下次当AI突然"知道"你冰箱里有什么菜并推荐菜谱时,记得感谢MCP——是它让AI能"看见"你的冰箱。
2、什么是Agent Skills?
Agent Skills 就像给 AI 装了“专业技能包”,让它从只会简单对话的“新手”变成能独立处理复杂任务的“专家”。比如你让 AI 策划一场旅行,普通 AI 可能只会列景点,而具备“旅行规划 Skill”的 AI 会自动考虑预算、天气、交通衔接,甚至帮你预订酒店——这就是 Skill 在起作用。
本质:封装专业知识的“操作手册”
每个 Agent Skill 都是针对特定任务的“标准化流程+知识库”组合。就像医生诊断需要“望闻问切”的步骤,AI 的 Skill 也包含:
● 步骤清单:比如“财务分析 Skill”会定义“获取数据→清洗异常值→生成图表→撰写结论”四步流程;
● 领域知识:如“法律咨询 Skill”内置民法典条款、典型案例库;
● 工具偏好:知道调用哪些 MCP 工具(Excel 处理数据、PPT 生成报告);
● 判断规则:例如“客户投诉处理 Skill”会设定“超过 24 小时未回复需升级主管”。
核心能力:让 AI 学会“自主思考”
普通 AI 只能被动执行指令(“帮我算这道题”),而带 Skill 的 AI 会主动拆解任务:
1. 目标拆解:接到“做季度总结”需求,Skill 会自动分解为“收集部门数据→对比去年同期→识别增长瓶颈→提出改进建议”;
2. 资源调度:决定是否调用 MCP 连接数据库、图表工具,或请求用户补充信息;
3. 错误修正:发现数据异常时,自动回查原始表格或提示用户确认;
4. 结果优化:比如“文案撰写 Skill”会根据产品调性调整语气(科技产品用专业术语,母婴产品用温馨风格)。
和普通功能的区别:会“举一反三”
传统 AI 功能像“计算器”,输入 2+3 只能得到 5;而 Skill 像“数学老师”,不仅能算题,还会教你解题思路,下次遇到 4+5 也能独立解决。例如:
● 普通翻译功能:逐字转换“今天天气好”为“It's nice today”;
● 翻译 Skill:会根据场景调整——给朋友发用“Lovely weather today!”,给老板汇报用“Today's weather conditions are favorable for the outdoor meeting”。
真实场景:Skill 如何改变 AI 行为
假设你问 AI:“帮我处理客户投诉邮件”
● 无 Skill:只能回复“已收到投诉,会处理”;
● 有“客户服务 Skill”:自动识别投诉类型(物流问题/产品质量);
○ 调用 MCP 查订单状态;
○ 套用预设模板:“您的订单已补发,预计明天送达,附 20 元优惠券”;
○ 标记“高优先级”并同步给客服团队。
一句话总结:Agent Skills 让 AI 从“执行工具”升级为“问题解决者”——它不仅懂“怎么做”,更懂“为什么这么做”和“如何做得更好”。未来,你手机里的 AI 助手可能会同时装备“健身教练 Skill”“税务顾问 Skill”“旅行规划 Skill”,像个全能管家一样帮你打理生活。
skills和Agent Skills
通常说的“skills”是个宽泛概念,泛指AI的各种能力;Skills 是一种“给 Agent 用的、可复用的流程型能力封装”,它不是 Prompt,也不是 MCP,而是把个人或者团队的 SOP 变成 Agent 可以随时调用的“技能包”。
而“Agent Skills”是2025年初Anthropic提出的标准化技能封装格式,核心是用结构化文件(如Markdown)打包领域知识、工作流和工具调用逻辑,让AI能像查“操作手册”一样按需加载专业能力。简单说,普通skills是“会做饭”,Agent Skills是“带步骤、食材清单和注意事项的红烧肉菜谱”。
具体差异:
- 形态不同:临时指令 vs 标准化文件
普通skills可能只是一段提示词(比如“帮我用Python画柱状图”),用完即弃;而Agent Skills是可复用的文件包,包含:
● 元数据(技能名称、适用场景,仅占约100 Token)
● 核心指令(步骤流程、判断规则,如“财务分析需先核对数据异常值”)
● 附加资源(脚本、模板、数据库表结构等,如PDF解析脚本)
就像把便利贴式的“临时提醒”变成了带目录、附录的“精装手册”。2. 加载方式:一次性塞给AI vs 按需渐进加载;
普通skills会把所有信息一次性塞进AI上下文,比如要调用10个工具,就得加载全部工具定义,可能消耗数万个Token;而Agent Skills采用**“渐进式披露”**:
● 第一层:仅加载元数据(如“这是用于员工数据分析的技能”),初始消耗仅500 Token;
● 第二层:AI判断需要时,才加载详细步骤(如“查询薪资表→对比部门均值”);
● 第三层:遇到复杂任务才调用脚本或数据文件(如用Python处理1GB考勤数据)
相当于图书馆不会把所有书都堆在你桌上,只在你需要时递上指定书籍。3. 能力范围:单一功能 vs 流程化专家
普通skills可能只解决单点问题(如“翻译这句话”),而Agent Skills能封装完整业务逻辑。例如“客户投诉处理Skill”会包含:
● 规则库:“超过24小时未回复需升级主管”
● 工具调用:通过MCP连接CRM系统查订单
● 模板生成:自动套用“道歉+补偿”邮件模板
这相当于从“会用螺丝刀”升级为“能按说明书组装家具”。一句话总结:
普通skills是“AI的临时工具箱”,而Agent Skills是“AI的岗位操作手册”——它让通用AI能快速掌握特定领域的“最佳实践”,从“能做事”变成“会把事做对”。现在主流AI工具如Claude Code已原生支持Agent Skills,未来你手机里的AI助手可能会同时装备“健身教练Skill”“税务申报Skill”,像全能管家一样帮你处理复杂任务。
3、MCP和Skills的区别是什么
想象你是一家餐厅的主厨:MCP 是厨房里的水龙头、烤箱、冰箱这些基础设备,确保你能接到水、加热食物、保存食材;Skills 则是你的食谱和烹饪步骤,告诉你什么时候用烤箱、怎么调味、如何摆盘。两者缺一不可,但解决的是完全不同的问题。
核心区别:连接能力 vs 专业智慧
● MCP 是“管道工”:它解决“怎么连接”的问题。就像统一的 USB-C 接口让所有设备能插上电源,MCP 定义了 AI 与外部工具(数据库、摄像头、邮件系统)对话的标准语言。比如你让 AI 查工资,MCP 负责让 AI 顺利“够到”公司的财务系统,但它不知道要看哪个表格、怎么计算税后收入。
● Skills 是“老师傅的经验”:它解决“怎么做好”的问题。比如“财务分析 Skill”会告诉 AI:“先查工资表的‘应发金额’列,减去社保和个税公式,再用红色标注异常值”。它把专业流程、规则和模板打包成“操作手册”,让 AI 不仅能调用工具,还能按最优步骤完成任务。
工作方式:显式调用 vs 自动触发
● MCP 像“手动工具箱”:AI 需要明确调用具体工具,比如用 query_database(工资表) 函数才能获取数据。每次连接新工具(如 CRM 系统),都要通过 MCP 协议注册,但这些工具定义会占用大量 Token(类似内存),连接 10 个工具可能就撑满 AI 的“大脑”。
● Skills 像“智能助手”:你说“帮我分析季度销售”,AI 会自动匹配“销售分析 Skill”,加载对应的步骤和模板,再决定是否调用 MCP 连接数据库。它采用“渐进式加载”——只在需要时才把相关知识放进 AI 的上下文,比如分析华东区数据时,不会加载西北区的历史报告,大大节省 Token。
实际协作:MCP 提供“手脚”,Skills 提供“大脑”
举个报销场景:
1. MCP 的角色:连接发票扫描工具(获取报销单图片)、公司财务系统(核对预算)、邮件服务器(发送审批请求)。
2. Skills 的角色:“报销处理 Skill”包含规则——“超过 5000 元需部门经理审批”“差旅补贴按城市级别计算”,并指导 AI 先扫描发票、再核对预算、最后自动生成邮件。
没有 MCP,AI 就像被绑住手脚,空有技能却无法操作工具;没有 Skills,AI 就像拿到一堆工具却不知从何下手,只能机械地执行简单命令。
一句话总结
Prompt 只能“说”;MCP 只能“连”;Skill 才是真正把“经验 → 自动化 → 复用”的那一层
MCP 让 AI“能做事”(连接工具),Skills 让 AI“会做事”(专业流程)。前者是标准化的“基础设施”,后者是个性化的“能力包”。未来的 AI 助手,会像经验丰富的厨师——既能熟练使用各种厨具(MCP),又能精准遵循食谱(Skills),做出一桌好菜。
下次当 AI 流畅完成复杂任务时,不妨想想:它背后是 MCP 在连接世界,还是 Skills 在运筹帷幄?
4、openClaw
OpenClaw 是一个本地优先的 AI 智能体操作系统,可以理解为你电脑里的“数字管家”——它能通过聊天软件(如 Telegram、飞书)接收指令,直接操作你的文件、运行程序、调用工具,甚至自动完成重复任务。比如你发消息“整理桌面 PDF”,它会自主创建文件夹、分类文件,全程无需手动操作。
Web 前端如何连接 OpenClaw?
OpenClaw 提供两种原生方式让前端与之通信,无需复杂适配:
1. 直接访问内置 Web 控制台
安装 OpenClaw 后,网关默认在 127.0.0.1:18789 运行,自带 WebChat UI。通过浏览器访问该地址,即可直接与智能体交互,支持文本输入、文件上传和技能调用。这种方式零开发成本,适合快速测试。
2. 通过 WebSocket/HTTP API 自定义对接
如果需要将 OpenClaw 集成到自己的前端项目(如网站、小程序),可通过以下协议连接:
● WebSocket:用于实时通信(如聊天消息、流式响应),网关支持标准 WebSocket 协议,前端可通过 ws://localhost:18789/ws 建立连接,收发 JSON 格式消息。
● HTTP API:适合单次请求(如触发特定技能),例如调用 POST /api/agent/send 接口发送指令,支持 JSON-RPC 2.0 规范。
示例场景:
在前端页面添加“整理邮件”按钮,点击后通过 WebSocket 发送指令,OpenClaw 会调用邮件客户端技能,按优先级分类收件箱,并返回处理结果到前端显示。关键技术细节
● 权限控制:前端连接需通过网关的 Token 认证(安装时自动生成),确保安全性。可在配置文件中限制 IP 为 127.0.0.1,避免外部访问。
● 技能扩展:前端可通过 API 触发 OpenClaw 的技能(如 file-sort、data-analysis),技能以 Markdown 文件形式存储,包含步骤、工具调用逻辑和模板。
● 跨平台兼容:无论是本地部署还是云服务器,只要网关端口开放,前端(Web、小程序、APP)均可通过 IP:端口 连接,例如微信小程序可通过腾讯云 IM 插件间接对接。
3. 为什么前端需要 OpenClaw?
传统前端受限于浏览器沙箱,无法直接操作本地文件或系统功能。通过 OpenClaw,前端可以“借权”实现:
● 本地文件处理:上传 CSV 后自动生成图表并返回前端展示;
● 跨应用自动化:触发“生成周报”指令,让 OpenClaw 从 Excel 取数、用 PPT 生成幻灯片,结果通过前端下载;
● 实时数据同步:监控本地日志文件,异常时通过前端推送通知。
一句话总结:OpenClaw 为前端提供了“操作系统级”的能力扩展,让网页不再只是信息展示窗口,而成为控制本地设备的入口。你甚至可以开发一个前端面板,集中管理 OpenClaw 的所有技能和任务进度。