为什么说,人正在成为 Agent 的瓶颈?

2 阅读9分钟

最近 AI 圈里有一个越来越常被提到的观点:人,正在逐渐成为 Agent 的瓶颈。

这句话听起来有点刺耳,好像是在说人类不重要了。但它真正想表达的,并不是“人没用了”,而是:当 AI Agent 的执行能力越来越强,真正限制效率的,可能不再是 Agent 能不能干活,而是人能不能跟上它的速度。

过去我们用 AI,更像是在用一个聊天助手。人问一句,AI 答一句;人继续问,AI 继续答。整个节奏主要由人控制。

但 Agent 不一样。Agent 不只是回答问题,它可以拆任务、查资料、写代码、调用工具、生成文档、运行测试,甚至连续执行一整套流程。

这时候问题就变了:以前是人等 AI 回答,现在很多时候变成了 AI 等人决策。

这个观点并不是凭空出现的。比如 OpenAI 的 Sam Altman,他代表的是通用 AI 产品化最前沿的视角。OpenAI 一直在推动 AI 从聊天助手走向能够完成任务的 Agent,这背后其实隐含着一个变化:AI 不再只是被动回答,而是越来越接近主动执行。

再比如 Anthropic 的 Dario Amodei,他所在的 Anthropic 推出了 Claude 和 Claude Code,也一直在推动 AI 进入更复杂的真实工作流。Claude Code 这类产品的出现,本质上就在说明:AI 已经不只是帮你写几句话,而是可以参与更长链路的任务执行。

所以我这里给大家汇总一下, “人逐渐成为 Agent 的瓶颈”到底有三层含义。

第一层:人和 Agent 的效率不一样,所以很难完美协作

这是最核心的一层:人类的输出速度和 Agent 的执行速度不在一个量级上。Agent 可以高速生成、连续执行、不断推进任务,但人的反馈往往是低频、低带宽的。这种效率差,会导致人和 Agent 之间不能很好地互通有无,也不能及时调整方向。

人类的输出速度本质上是很慢的。我们打字慢,说话也慢。更重要的是,我们很多时候并不能一次性把自己的想法说清楚。

你让 Agent 帮你做一个方案,它可能很快生成十几个方向;你让 Agent 帮你写代码,它可能几分钟写出一大段;你让 Agent 帮你查资料,它可能很快整理出一堆结论。

但问题是,Agent 做得越快,人越容易跟不上。它做完一步,需要你判断方向对不对;它遇到问题,需要你补充上下文;它准备继续执行,需要你确认下一步;它跑偏了,需要你及时把它拉回来。

可人的反馈往往很慢,而且信息量很低。Agent 给你一大段分析,你可能只回两个字:“继续”“批准”“不对”。

这就会出现一个很大的问题:Agent 在高速运转,但人类反馈是低频、低带宽的。

真正高效的协作,应该是双方不断交换信息、不断校准方向、不断修正策略。但在人和 Agent 的组合里,常常是 Agent 输出很多,人类反馈很少;Agent 执行很快,人类判断很慢。

所以瓶颈不是简单的“人慢”,而是:人的慢,会破坏 Agent 的协作闭环。

这也是为什么越来越多人开始讨论 Multi-Agent。因为如果是 Agent 和 Agent 之间协作,情况就不一样了。

一个 Agent 可以提出方案,另一个 Agent 可以审查问题;一个 Agent 可以写代码,另一个 Agent 可以跑测试;一个 Agent 可以生成内容,另一个 Agent 可以挑逻辑漏洞。

它们之间可以用极高频率、极高信息密度进行交流。人和 Agent 的对话可能只是“继续”“改一下”“这个不对”,但 Agent 和 Agent 之间可以互相解释原因、补充细节、反驳方案、重新规划路径。

在你给的访谈里也提到过类似观点:人和模型对话时,人产出的信息量较少,而模型产出的信息量较多;如果让两个模型之间互相交流,它们可以用更高效率交换大量信息,整体效率就可能超过“人 + 单 Agent”的交互。

所以 Multi-Agent 不是为了炫技,而是因为:Agent 与 Agent 之间,可能天然更适合高频协作。

第二层:人监督多个 Agent,会越来越累

第二层问题是:Agent 越能干,人越容易被“检查工作”压垮。因为 AI 生成内容太快了,一个人如果要同时监督多个 Agent,就必须不断切换上下文、理解过程、检查结果、判断风险。真正累的不是亲自干活,而是验收 AI 干出来的活。

很多人第一次用 Agent,会觉得很爽。一个 Agent 帮我写代码,一个 Agent 帮我查资料,一个 Agent 帮我整理文档,一个 Agent 帮我做测试,一个 Agent 帮我生成方案。表面上看,一个人好像拥有了一支 AI 团队。

但很快你会发现,问题来了:每个 Agent 都需要你监督。

你要知道它做到哪一步了,要判断它有没有跑偏,要检查它生成的内容是否可靠,要在不同任务之间切换上下文,还要决定哪些结果能用,哪些结果要返工。

这件事非常累。

因为 AI 生成内容的速度太快了。过去你自己写一篇文章,写得慢,检查也慢;现在 AI 几分钟生成一篇文章,但你要判断事实有没有错、逻辑有没有断、表达有没有问题。

过去你自己写一段代码,写的时候就知道自己在干什么;现在 Agent 一口气改了很多文件,你要回过头理解它为什么这么改、有没有引入新 bug、是不是符合原来的目标。

过去你自己做一个方案,过程都在你脑子里;现在 Agent 直接给你一个完整方案,你反而要重新理解它的推理路径。

所以一个人管理一个 Agent,还能勉强跟上;一个人同时管理五六个 Agent,就会被上下文切换拖垮;一个人同时管理十几个 Agent,很快就会发现:真正累的不是干活,而是验收。

这时候,人类不应该再站在每一步中间做检查员。更好的方式是让 Agent 之间先互相检查:一个负责执行,一个负责审查,一个负责测试,一个负责总结,最后人只看压缩后的关键结果。

也就是说,未来人的角色不应该是“每一步都亲自检查”,而应该是“设计一套检查机制”。

否则 AI 生成得越快,人反而越累。

第三层:AI 很会干活,但不知道该干什么

第三层问题是:AI 很会执行,但它并不天然知道什么事情真正值得做。Agent 可以写代码、查资料、生成方案、跑测试,但任务从哪里来,目标是什么,做到什么程度算好,仍然需要人来定义。

所以,虽然 Agent 和 Agent 之间协作效率更高,但这并不意味着人可以完全退出。

AI 最大的问题不是不会干活,而是它不知道什么事情真正值得干。

Agent 可以执行任务,但任务从哪里来?Agent 可以优化方案,但优化目标是什么?Agent 可以写代码,但为什么要写这个产品?Agent 可以生成内容,但这篇内容到底要打动谁?Agent 可以跑实验,但实验方向是不是值得做?

这些问题,仍然需要人来定义。

AI 可以沿着一条路拼命往前跑,但它并不天然知道哪条路更有意义。这就像你有一个执行力极强的员工。你让他做什么,他都能做得很快。但如果你没有给他方向,他可能每天都很忙,最后却做了一堆不重要的事情。

所以,人不是不重要了。人的重要性正在从“亲自执行”转向“定义目标”。

以前人的价值是:我会不会写,我会不会做,我会不会查,我会不会改。

现在人的价值会越来越变成:我要解决什么问题,这个问题值不值得解决,做到什么程度算好,哪些结果可以接受,哪些底线不能突破,最终方向应该往哪里走。

AI 会干活,但人要告诉它为什么干、往哪干、干到什么程度。

人不是失去价值,而是价值位置变了

所以,“人逐渐成为 Agent 的瓶颈”这句话,不应该理解成“人类没用了”。

更准确地说,是:如果人还停留在过去那种一步一步指挥 AI 的方式里,人就会成为瓶颈。

因为 Agent 的执行能力,已经开始超过这种交互方式了。

过去我们像是在操作工具。点一下,工具动一下;输入一句,AI 回一句。人是中心,AI 是辅助。

但 Agent 时代更像是在驾驭一套系统。你要给它目标,给它权限,给它工具,给它约束,让它自己获得反馈,让它在一定范围内自动调整。

人不应该永远卡在每一步中间做确认,而应该站到更高的位置,设计目标、流程和验收机制。

所以未来真正厉害的人,不一定是最会写提示词的人,而是最会组织 Agent 的人。

他知道哪些事情交给 AI,哪些事情让多个 Agent 互相检查,哪些事情必须人来判断,哪些流程可以自动化,哪些目标不能交出去。

AI 可以越来越会干活,但“该干什么”仍然是人的核心权利。

这也是我觉得最重要的一点:

AI 可以替你执行,但不能替你拥有目标。

一个没有目标的 Agent,只是一个很强的工具;一个被正确目标驱动的 Agent,才可能变成真正的生产力系统。

而这也引出了下一个更重要的问题:

如果人的输出速度天然较慢,监督多个 Agent 又会让人越来越累,同时 Agent 与 Agent 之间又更适合高频交流和互相校验,那么为什么我们还要只使用一个 Agent?

为什么未来很多复杂任务,不是交给一个超级 AI 单独完成,而是交给一组分工不同、互相协作、互相监督的 Agent?

下一篇,我们就继续聊:

为什么要使用 Multi-Agent?