强业务Agent太难了,一方面你希望大模型“懂你没说的东西”,体现出智能、推理与容错能力;另一方面,你又希望它“不要出错”,像规则系统一样精准可靠。
- 像不像女人对男人的要求?
- 像不像你老板对你的要求?
Agent做不到精准的根本原因:强业务逻辑往往依赖于 MCP 服务的支撑,而大模型与 MCP 之间的连接本质上是自然语言的“匹配博弈”:MCP 通过描述(Description)告诉模型“我能做什么、需要什么参数”;模型则依据用户提供的 prompt 去判断“该用哪个接口、怎么填参数”。 最终能否成功调用接口并准确填充参数,取决于三件事:
- 用户说了什么(intent 是否清晰);
- MCP 描述了什么(能力表达是否充分);
- 模型撮合得怎样(是否理解意图并正确匹配)。
这个过程——既模糊又依赖默契,像极了我女朋友和我之间的拉扯: 我猜你需要什么,你猜你想表达什么,最后还得一起决定谁来做这件事,而且不能出错。
人类之间的高质量沟通,需要长期共情、理解上下文、积累语境,而我们现在却希望一个模型在冷启动时就能一次做好。
换个角度看:
感情中的“女人的要求” | Agent 中对大模型的要求 |
---|---|
懂我、猜中我没说出口的东西 | 推理上下文中未显式表达的变量、意图 |
不出错,别瞎猜 | 避免生成错误信息、不要臆断业务流程 |
情绪稳定、响应得体 | 输出自然得体、不犯错、还能容错 |
不要问太多问题 | 模型不能老是反问用户,打断体验 |
这意味着什么?
要在“智能 + 精确”的夹缝里搞定大模型 Agent,我们就得像做情感经营一样“降期望 + 建规则 + 提示清晰”:
- 不要假设模型能读心:就像不要假设男人能一次就读懂你所有潜台词;
- 多一些结构约束:就像约定节日该送什么、吵架不要提旧账;
- 建立清晰反馈机制:出错了要能让模型知道是哪里错,像感情里的“讲清楚问题在哪里”。