过去一年,Agent 能不能“调用工具”几乎成了衡量能力的标准。
Function Calling、Tool Use、MCP……各种 Demo 层出不穷。
但在真实使用中,一个问题越来越明显:
能调用工具的 Agent,和能交付任务的 Agent,是两回事。
一、工具调用,只解决了「能不能做」
从技术角度看,工具调用已经不是瓶颈了:
- 大模型已经稳定支持 Function Calling
- MCP 进一步统一了工具的描述和接入方式
- 搜索、下单、发消息、查数据库,都不再是难题
这解决的是一个确定性问题:
模型有没有能力“触达”外部世界?
答案是:已经有了。
但真实场景中的失败,往往不发生在这里。
二、大多数 Agent 失败,发生在「做事过程」
如果你实际用过 Agent,很容易遇到这些问题:
- 该用工具时不用
- 用了工具,但参数不对
- 中途跑偏,忘记原始目标
- 步骤顺序混乱,结果不可复现
这些问题有一个共同点:
不是模型不会推理,而是“不知道该怎么把事情做完”。
工具只是能力,
任务交付需要流程。
三、从工程视角看:Agent 缺的是「可执行流程」
在传统软件工程中,我们很少让系统“自由发挥”:
- 订单有明确状态流转
- 审批有固定节点
- 异常有回滚和兜底
但在 Agent 设计中,很多系统却默认:
“模型自己想办法吧。”
这在 Demo 阶段看起来很智能,
在真实环境中却极不稳定。
Agent 的真正分水岭在于:
是否存在一个可约束、可复现、可演进的任务流程。
四、从「即兴推理」到「任务可交付」
一个可交付的 Agent,通常具备几个特征:
- 任务被拆解成明确步骤
- 每一步都有清晰的输入与输出
- 工具调用是流程的一部分,而不是随机行为
- 关键节点可以校验、回滚或人工介入
这时,Agent 的角色发生了变化:
- 不再是“聪明的聊天机器人”
- 而是执行既定任务的运行时
五、为什么 Agent 会走向 Skills / Workflow
这也是 Agent Skills、Workflow、Playbook 开始出现的原因。
它们解决的不是“能力问题”,而是:
- 如何管理上下文
- 如何约束行为
- 如何复用经验
本质上:
把“人类做事的 SOP”,转译成 Agent 可执行的结构。
工具调用(无论是 API 还是 MCP),
只是流程中的一个节点。
六、技术人员应该关注什么?
如果你是技术人员,与其纠结:
- 用哪个模型
- 接多少工具
不如优先思考:
- 任务边界是什么?
- 哪些步骤必须确定性执行?
- 哪些环节允许模型自由发挥?
这是 Agent 能否走向生产环境的关键。
结语
Agent 的未来,不取决于它能调用多少工具,
而取决于:
它是否能稳定地把一件事,从头到尾做完。
工具调用,是起点;
任务可交付,才是分水岭。