女朋友和Leader VS 我和Agent - 既要你懂我没说的话,又不能做错事

0 阅读2分钟

强业务Agent太难了,一方面你希望大模型“懂你没说的东西”,体现出智能、推理与容错能力;另一方面,你又希望它“不要出错”,像规则系统一样精准可靠。

  • 像不像女人对男人的要求?
  • 像不像你老板对你的要求?

Agent做不到精准的根本原因:强业务逻辑往往依赖于 MCP 服务的支撑,而大模型与 MCP 之间的连接本质上是自然语言的“匹配博弈”:MCP 通过描述(Description)告诉模型“我能做什么、需要什么参数”;模型则依据用户提供的 prompt 去判断“该用哪个接口、怎么填参数”。 最终能否成功调用接口并准确填充参数,取决于三件事:

  • 用户说了什么(intent 是否清晰);
  • MCP 描述了什么(能力表达是否充分);
  • 模型撮合得怎样(是否理解意图并正确匹配)。

这个过程——既模糊又依赖默契,像极了我女朋友和我之间的拉扯:
我猜你需要什么,你猜你想表达什么,最后还得一起决定谁来做这件事,而且不能出错。

人类之间的高质量沟通,需要长期共情、理解上下文、积累语境,而我们现在却希望一个模型在冷启动时就能一次做好。

换个角度看:

感情中的“女人的要求”Agent 中对大模型的要求
懂我、猜中我没说出口的东西推理上下文中未显式表达的变量、意图
不出错,别瞎猜避免生成错误信息、不要臆断业务流程
情绪稳定、响应得体输出自然得体、不犯错、还能容错
不要问太多问题模型不能老是反问用户,打断体验

这意味着什么?

要在“智能 + 精确”的夹缝里搞定大模型 Agent,我们就得像做情感经营一样“降期望 + 建规则 + 提示清晰”:

  • 不要假设模型能读心:就像不要假设男人能一次就读懂你所有潜台词;
  • 多一些结构约束:就像约定节日该送什么、吵架不要提旧账;
  • 建立清晰反馈机制:出错了要能让模型知道是哪里错,像感情里的“讲清楚问题在哪里”。