前言
最近学习了MCP,在查看了很多视频与文章后,终于对MCP有了一个较为完整的认识。这里对MCP的概念进行梳理,以加深自己的理解。以下内容不会涉及任何代码,只是介绍当前我对MCP的认知。
大模型为什么要调用工具
主要有两点:
- 大模型的训练数据存在时效性和专业性的限制,无法获取实时信息,以及专业领域信息。
- 模型本身无法处理一些复杂的计算逻辑,通过调用外部工具可以弥补自身的不足。
大模型调用工具的完整过程
以用户查询北京天气为例,整个流程如下所示:
sequenceDiagram
actor 用户
participant 大模型应用
participant 天气工具
participant 大模型
用户->>大模型应用: 1、查询北京天气
大模型应用->>大模型: 2、转发查询请求 (提供工具列表,与用户请求)
大模型->>大模型: 3、判断需要外部工具 (天气工具)
大模型->>大模型: 3.1、构造工具调用参数
大模型->>大模型应用: 4、请求调用天气工具
大模型应用->>天气工具: 5、调用天气工具 (北京)
天气工具-->>大模型应用: 6、返回北京天气数据
大模型应用->>大模型: 7、将天气信息与用户历史询问信息一起发送给大模型
大模型->>大模型: 8、生成天气查询结果
大模型-->>大模型应用: 9、返回天气查询结果
大模型应用-->>用户: 10、显示北京天气信息
该流程主要分为四步:
- 工具注册: 大模型应用将可用工具列表,加入到大模型的提示词中。
- 意图识别与工具选择:大模型解析用户问题,判断需调用哪个工具,并生成请求参数。
- 工具调用: 大模型应用接收大模型的返回信息,判断出需要调用工具,进行工具调用。
- 整合回复: 将工具结果与用户问题发送给大模型,大模型整合后返回回复结果。
在这个过程中,大模型本身并不会调用工具,而是进行意图识别、工具决策,并构造请求参数。 调用工具的是大模型应用。
那么这个流程有什么问题?MCP和这个流程有什么关系?
我们先了解下这个流程中的M * N问题。
工具集成M * N问题
MCP的文章中提到解决了工具集成的M * N问题。(我们有M个工具,要集成到N个大模型中)
首先要了解:M * N问题主要发生在工具调用的第一步,也就是工具注册阶段。
在工具注册阶段,大模型应用要告诉大模型,我有M个工具,这些工具是做什么的,都有什么参数。
问题出在了每个大模型接受工具列表的形式不同,格式也不同。(其实返回参数也不同,这里以接受参数为例)
例如,有的模型需要json格式,有些模型需要xml格式,有些模型需要自然语言。
因此如果程序员想要新增或者修改一个工具,必须针对不同大模型的要求进对接或者修改,也就有了M * N的问题。
MCP如何解决M * N的问题
MCP就是为了解决这个问题出现的。 但是必须要注意的是,MCP并非是统一了各个大模型接收工具的参数,而是在工具与模型之间增加了一个"中间层",它提供了工具描述规范和调用规约。
- 各个工具按照MCP协议的要求来描述工具信息。
- MCP HOST按照各个模型不同的要求,来描述工具信息。
- 大模型按照MCP协议要求来返回标准化的工具调用。
对于工具而言,通过MCP HOST来屏蔽模型之间的差异,做到一次封装,多处复用。因此通过MCP协议,将工具接入的工作量从M * N 降到了M + N。
MCP是什么?
所以MCP到底是什么呢,引用一下官方的定义吧:
MCP 是一种开放协议,它标准化了应用程序如何向 LLM 提供上下文。可将 MCP 视为 AI 应用程序的 USB-C 端口——正如 USB-C 提供设备连接外围配件的标准化方式,MCP 提供将 AI 模型连接到不同数据源和工具的标准化方式。
但是我觉得改成 MCP提供了一种标准化方式,允许不同数据源和工具通过统一接口描述与AI应用进行交互 反而更容易理解。
以上仅是我自己的理解,如有错误欢迎指正。