26年AI 与web前端的开年思考什么是MCP？MCP是指Model Context Protocol（模型上下文协议）

1、什么是MCP？

MCP是指Model Context Protocol（模型上下文协议），是AI领域的一个标准化协议，用于连接AI应用与外部工具、数据源。在原文语境中，MCP与Agent Skills是AI应用开发中的不同技术方向，MCP侧重于统一工具集成的协议标准，而Agent Skills则是具体的AI能力模块。

MCP的具体含义：

● 定义：MCP是2024年11月Anthropic开源的AI工具集成协议，旨在解决AI应用与外部系统（如数据库、文件系统、开发工具等）的集成复杂性问题。

● 核心目标：通过统一的JSON-RPC协议，让AI应用（Host）、客户端（Client）和工具服务端（Server）形成标准化通信体系，实现AI无需手动复制信息即可直接调用外部资源。

● 架构：包含Host（AI应用）、Client（协议通信组件）和Server（外部工具）三个角色，支持本地（Stdio）和远程（Streamable HTTP）传输，提供工具调用、资源访问和提示模板三种核心能力。

● 区别于Function Calling：MCP是跨厂商的开放标准，解决了不同AI平台函数调用协议不兼容的问题，降低了工具集成的M×N复杂度（M为AI应用数量，N为工具数量）。

延伸拓展：

● 应用场景：已被OpenAI、Google、Microsoft等大厂支持，广泛应用于AI编程（如Cursor开发工具）、企业数据分析（连接内部数据库）、工作流自动化（跨平台协调任务）等领域。

● 争议与改进：2025年底后因传输机制复杂、文档质量不足、权限管理缺失等问题受到开发者批评，但其已进入Linux基金会治理体系，多家安全厂商推出MCP安全网关产品，逐步完善生态。

● 意义：MCP代表AI从对话式工具向可操作世界的Agent的转折点，通过标准化协议降低了企业级AI部署成本，推动AI应用从单一功能走向全流程自动化。

MCP --“管道工”，体现连接能力

想象你用智能音箱点外卖时，它需要同时连接外卖平台、支付软件和你的地址信息——如果这些系统各说各话，智能音箱就会手忙脚乱。MCP就像给AI装了个"万能插座"，让不同公司开发的AI（比如ChatGPT、文心一言）能统一"插"上各种工具（比如Excel、摄像头、快递系统），不用重复造轮子。

举个生活例子：以前你用AI查天气，得手动把"北京明天天气"输进去；有了MCP后，AI能直接"问"天气软件，甚至自动根据你的定位推荐带伞。这背后就是MCP在当"翻译官"，让AI和工具用同一种"语言"对话。

为什么需要MCP？

没有MCP时，每家AI公司（OpenAI、百度等）都有自己的工具连接方式，就像不同品牌的手机充电器不通用。开发者想让AI同时用Excel和摄像头，得写两套代码。MCP出现后，所有工具都遵守同一套规则，开发者写一次代码就能让任何AI调用任何工具，就像现在所有手机都能用USB-C充电。普通人能感受到的变化：

● 更"聪明"的AI助手：比如你让AI整理邮件，它能直接打开你的邮箱，按"紧急程度"分类，甚至自动回复——这些都需要MCP连接邮箱系统。

● 跨APP协作更丝滑：用AI写报告时，它能自己从Excel取数据、从PPT调模板，不用你手动复制粘贴。

不过MCP也像刚学会走路的孩子：2025年很多开发者抱怨它"太复杂"（比如设置权限像解迷宫），但现在Linux基金会接手后，就像给这个"万能插座"加了安全保护和使用说明书。未来你用AI处理的事情越复杂（比如规划旅行、管理健康），就越离不开MCP这个"幕后翻译官"。

下次当AI突然"知道"你冰箱里有什么菜并推荐菜谱时，记得感谢MCP——是它让AI能"看见"你的冰箱。

2、什么是Agent Skills？

Agent Skills 就像给 AI 装了“专业技能包”，让它从只会简单对话的“新手”变成能独立处理复杂任务的“专家”。比如你让 AI 策划一场旅行，普通 AI 可能只会列景点，而具备“旅行规划 Skill”的 AI 会自动考虑预算、天气、交通衔接，甚至帮你预订酒店——这就是 Skill 在起作用。

本质：封装专业知识的“操作手册”

每个 Agent Skill 都是针对特定任务的“标准化流程+知识库”组合。就像医生诊断需要“望闻问切”的步骤，AI 的 Skill 也包含：

● 步骤清单：比如“财务分析 Skill”会定义“获取数据→清洗异常值→生成图表→撰写结论”四步流程；

● 领域知识：如“法律咨询 Skill”内置民法典条款、典型案例库；

● 工具偏好：知道调用哪些 MCP 工具（Excel 处理数据、PPT 生成报告）；

● 判断规则：例如“客户投诉处理 Skill”会设定“超过 24 小时未回复需升级主管”。

核心能力：让 AI 学会“自主思考”

普通 AI 只能被动执行指令（“帮我算这道题”），而带 Skill 的 AI 会主动拆解任务：

1. 目标拆解：接到“做季度总结”需求，Skill 会自动分解为“收集部门数据→对比去年同期→识别增长瓶颈→提出改进建议”；

2. 资源调度：决定是否调用 MCP 连接数据库、图表工具，或请求用户补充信息；

3. 错误修正：发现数据异常时，自动回查原始表格或提示用户确认；

4. 结果优化：比如“文案撰写 Skill”会根据产品调性调整语气（科技产品用专业术语，母婴产品用温馨风格）。

和普通功能的区别：会“举一反三”

传统 AI 功能像“计算器”，输入 2+3 只能得到 5；而 Skill 像“数学老师”，不仅能算题，还会教你解题思路，下次遇到 4+5 也能独立解决。例如：

● 普通翻译功能：逐字转换“今天天气好”为“It's nice today”；

● 翻译 Skill：会根据场景调整——给朋友发用“Lovely weather today!”，给老板汇报用“Today's weather conditions are favorable for the outdoor meeting”。

真实场景：Skill 如何改变 AI 行为

假设你问 AI：“帮我处理客户投诉邮件”

● 无 Skill：只能回复“已收到投诉，会处理”；

● 有“客户服务 Skill”：自动识别投诉类型（物流问题/产品质量）；

○ 调用 MCP 查订单状态；

○ 套用预设模板：“您的订单已补发，预计明天送达，附 20 元优惠券”；

○ 标记“高优先级”并同步给客服团队。

一句话总结：Agent Skills 让 AI 从“执行工具”升级为“问题解决者”——它不仅懂“怎么做”，更懂“为什么这么做”和“如何做得更好”。未来，你手机里的 AI 助手可能会同时装备“健身教练 Skill”“税务顾问 Skill”“旅行规划 Skill”，像个全能管家一样帮你打理生活。

skills和Agent Skills

通常说的“skills”是个宽泛概念，泛指AI的各种能力；Skills 是一种“给 Agent 用的、可复用的流程型能力封装”，它不是 Prompt，也不是 MCP，而是把个人或者团队的 SOP 变成 Agent 可以随时调用的“技能包”。

而“Agent Skills”是2025年初Anthropic提出的标准化技能封装格式，核心是用结构化文件（如Markdown）打包领域知识、工作流和工具调用逻辑，让AI能像查“操作手册”一样按需加载专业能力。简单说，普通skills是“会做饭”，Agent Skills是“带步骤、食材清单和注意事项的红烧肉菜谱”。

具体差异：

形态不同：临时指令 vs 标准化文件

普通skills可能只是一段提示词（比如“帮我用Python画柱状图”），用完即弃；而Agent Skills是可复用的文件包，包含：

● 元数据（技能名称、适用场景，仅占约100 Token）

● 核心指令（步骤流程、判断规则，如“财务分析需先核对数据异常值”）

● 附加资源（脚本、模板、数据库表结构等，如PDF解析脚本）

就像把便利贴式的“临时提醒”变成了带目录、附录的“精装手册”。2. 加载方式：一次性塞给AI vs 按需渐进加载；

普通skills会把所有信息一次性塞进AI上下文，比如要调用10个工具，就得加载全部工具定义，可能消耗数万个Token；而Agent Skills采用**“渐进式披露”**：

● 第一层：仅加载元数据（如“这是用于员工数据分析的技能”），初始消耗仅500 Token；

● 第二层：AI判断需要时，才加载详细步骤（如“查询薪资表→对比部门均值”）；

● 第三层：遇到复杂任务才调用脚本或数据文件（如用Python处理1GB考勤数据）

相当于图书馆不会把所有书都堆在你桌上，只在你需要时递上指定书籍。3. 能力范围：单一功能 vs 流程化专家

普通skills可能只解决单点问题（如“翻译这句话”），而Agent Skills能封装完整业务逻辑。例如“客户投诉处理Skill”会包含：

● 规则库：“超过24小时未回复需升级主管”

● 工具调用：通过MCP连接CRM系统查订单

● 模板生成：自动套用“道歉+补偿”邮件模板

这相当于从“会用螺丝刀”升级为“能按说明书组装家具”。一句话总结：

普通skills是“AI的临时工具箱”，而Agent Skills是“AI的岗位操作手册”——它让通用AI能快速掌握特定领域的“最佳实践”，从“能做事”变成“会把事做对”。现在主流AI工具如Claude Code已原生支持Agent Skills，未来你手机里的AI助手可能会同时装备“健身教练Skill”“税务申报Skill”，像全能管家一样帮你处理复杂任务。

3、MCP和Skills的区别是什么

想象你是一家餐厅的主厨：MCP 是厨房里的水龙头、烤箱、冰箱这些基础设备，确保你能接到水、加热食物、保存食材；Skills 则是你的食谱和烹饪步骤，告诉你什么时候用烤箱、怎么调味、如何摆盘。两者缺一不可，但解决的是完全不同的问题。

核心区别：连接能力 vs 专业智慧

● MCP 是“管道工”：它解决“怎么连接”的问题。就像统一的 USB-C 接口让所有设备能插上电源，MCP 定义了 AI 与外部工具（数据库、摄像头、邮件系统）对话的标准语言。比如你让 AI 查工资，MCP 负责让 AI 顺利“够到”公司的财务系统，但它不知道要看哪个表格、怎么计算税后收入。

● Skills 是“老师傅的经验”：它解决“怎么做好”的问题。比如“财务分析 Skill”会告诉 AI：“先查工资表的‘应发金额’列，减去社保和个税公式，再用红色标注异常值”。它把专业流程、规则和模板打包成“操作手册”，让 AI 不仅能调用工具，还能按最优步骤完成任务。

工作方式：显式调用 vs 自动触发

● MCP 像“手动工具箱”：AI 需要明确调用具体工具，比如用 query_database(工资表) 函数才能获取数据。每次连接新工具（如 CRM 系统），都要通过 MCP 协议注册，但这些工具定义会占用大量 Token（类似内存），连接 10 个工具可能就撑满 AI 的“大脑”。

● Skills 像“智能助手”：你说“帮我分析季度销售”，AI 会自动匹配“销售分析 Skill”，加载对应的步骤和模板，再决定是否调用 MCP 连接数据库。它采用“渐进式加载”——只在需要时才把相关知识放进 AI 的上下文，比如分析华东区数据时，不会加载西北区的历史报告，大大节省 Token。

实际协作：MCP 提供“手脚”，Skills 提供“大脑”

举个报销场景：

1. MCP 的角色：连接发票扫描工具（获取报销单图片）、公司财务系统（核对预算）、邮件服务器（发送审批请求）。

2. Skills 的角色：“报销处理 Skill”包含规则——“超过 5000 元需部门经理审批”“差旅补贴按城市级别计算”，并指导 AI 先扫描发票、再核对预算、最后自动生成邮件。

没有 MCP，AI 就像被绑住手脚，空有技能却无法操作工具；没有 Skills，AI 就像拿到一堆工具却不知从何下手，只能机械地执行简单命令。

一句话总结

Prompt 只能“说”；MCP 只能“连”；Skill 才是真正把“经验 → 自动化 → 复用”的那一层

MCP 让 AI“能做事”（连接工具），Skills 让 AI“会做事”（专业流程）。前者是标准化的“基础设施”，后者是个性化的“能力包”。未来的 AI 助手，会像经验丰富的厨师——既能熟练使用各种厨具（MCP），又能精准遵循食谱（Skills），做出一桌好菜。

下次当 AI 流畅完成复杂任务时，不妨想想：它背后是 MCP 在连接世界，还是 Skills 在运筹帷幄？

4、openClaw

OpenClaw 是一个本地优先的 AI 智能体操作系统，可以理解为你电脑里的“数字管家”——它能通过聊天软件（如 Telegram、飞书）接收指令，直接操作你的文件、运行程序、调用工具，甚至自动完成重复任务。比如你发消息“整理桌面 PDF”，它会自主创建文件夹、分类文件，全程无需手动操作。

Web 前端如何连接 OpenClaw？

OpenClaw 提供两种原生方式让前端与之通信，无需复杂适配：

1. 直接访问内置 Web 控制台

安装 OpenClaw 后，网关默认在 127.0.0.1:18789 运行，自带 WebChat UI。通过浏览器访问该地址，即可直接与智能体交互，支持文本输入、文件上传和技能调用。这种方式零开发成本，适合快速测试。

2. 通过 WebSocket/HTTP API 自定义对接

如果需要将 OpenClaw 集成到自己的前端项目（如网站、小程序），可通过以下协议连接：

● WebSocket：用于实时通信（如聊天消息、流式响应），网关支持标准 WebSocket 协议，前端可通过 ws://localhost:18789/ws 建立连接，收发 JSON 格式消息。

● HTTP API：适合单次请求（如触发特定技能），例如调用 POST /api/agent/send 接口发送指令，支持 JSON-RPC 2.0 规范。

示例场景：

在前端页面添加“整理邮件”按钮，点击后通过 WebSocket 发送指令，OpenClaw 会调用邮件客户端技能，按优先级分类收件箱，并返回处理结果到前端显示。关键技术细节

● 权限控制：前端连接需通过网关的 Token 认证（安装时自动生成），确保安全性。可在配置文件中限制 IP 为 127.0.0.1，避免外部访问。

● 技能扩展：前端可通过 API 触发 OpenClaw 的技能（如 file-sort、data-analysis），技能以 Markdown 文件形式存储，包含步骤、工具调用逻辑和模板。

● 跨平台兼容：无论是本地部署还是云服务器，只要网关端口开放，前端（Web、小程序、APP）均可通过 IP:端口连接，例如微信小程序可通过腾讯云 IM 插件间接对接。

3. 为什么前端需要 OpenClaw？

传统前端受限于浏览器沙箱，无法直接操作本地文件或系统功能。通过 OpenClaw，前端可以“借权”实现：

● 本地文件处理：上传 CSV 后自动生成图表并返回前端展示；

● 跨应用自动化：触发“生成周报”指令，让 OpenClaw 从 Excel 取数、用 PPT 生成幻灯片，结果通过前端下载；

● 实时数据同步：监控本地日志文件，异常时通过前端推送通知。

一句话总结：OpenClaw 为前端提供了“操作系统级”的能力扩展，让网页不再只是信息展示窗口，而成为控制本地设备的入口。你甚至可以开发一个前端面板，集中管理 OpenClaw 的所有技能和任务进度。