人人都在说的 Agent,到底是个什么东西?

0 阅读4分钟

人人都在说的 Agent,到底是个什么东西?

agent_cover

最近,“Agent” 这个词火得一塌糊涂。

AI 圈几乎人人在谈它,创业公司在做它,连 ChatGPT、Claude、Gemini 等大模型都在强调自己能“生成 Agent”。

可问题是:

Agent 到底是什么?

是不是只要给大模型加点“外挂功能”,就能称之为 Agent?还是说,它其实是AI发展的一次真正跃迁?

今天我们就从头说清楚这个词:看看从哲学、人工智能到大模型时代,“Agent”到底经历了怎样的进化。

一、最早的含义:Agent = 能行动的主体

“Agent”这个词并不是AI发明的,它来自拉丁语 agere,意思是「去做、去行动」。

在哲学里,Agent 指的是能感知世界、形成意图、并主动行动的主体。

比如人,就是典型的「moral agent(道德主体)」,能判断是非、做出选择,并承担结果。

所以最初的含义非常简单:Agent = 一个会主动做事的存在。

这个定义听起来抽象,但它几乎奠定了后面所有人工智能系统的思维模型。

二、在人工智能里:Agent 是“智能的最小单元”

20世纪50年代,当AI研究刚起步时,科学家开始试图把这种“感知—行动”的思维方式用机器实现出来。

agent_loop

1995年,Russell 和 Norvig 在经典教材《人工智能:一种现代方法(AIMA)》里正式定义:Agent 是任何能通过传感器感知环境、并通过执行器作用于环境的实体。

这就是最早的 智能体模型。它的思维路径是一个闭环:

感知(Perceive)
→ 推理(Reason)
→ 行动(Act)
→ 获得反馈(Observe)
→ 调整策略(Loop

早期的机器人、博弈程序、控制系统,都是基于这种框架设计的。

它们的核心不在“聪明”,而在“能闭环行动”。

三、Agent 工程化:从哲学到软件代理

进入 1990–2010 年,Agent 从实验室走向工业界,那时候流行的是“软件代理(Software Agent)”:

  • Mail Agent:帮你自动过滤邮件
  • Web Crawler:自动抓取网页信息
  • Trading Agent:自动下单、撮合交易
  • Monitoring Agent:后台监控系统状态

这些 Agent 都能自动执行任务,但它们并不聪明,它们的聪明实际上依然是基于规则、脚本或状态机来运行。

换句话说:它们会“动”,但不会“想”。

四、转折点:大模型让 Agent 重新复活

真正的转折,发生在 GPT-3 和 GPT-4 出现之后,这些大模型第一次让机器具备了理解语境、推理问题、规划行动的能力。

研究者突然意识到:“如果大模型能思考,它是不是就能自己‘去做事’?”

agent_leap

于是,一批新的 Agent 架构诞生了:

  • ReAct(Reason + Act)
  • AutoGPT
  • LangChain Agent
  • CrewAI / LangGraph / Autogen

它们的共同点是:不再让AI只是被动回答,而是让它能自己决定下一步要做什么,并真的去执行。

五、现代定义:LLM 时代的 Agent 到底是什么?

现在我们可以这样定义:

Agent = 大模型(大脑) + 记忆系统(记忆) + 工具(手脚) + 反馈循环(学习)。

agent_equation

如果一个系统能做到以下四件事,它就能称为 Agent:

能力说明
自主性(Autonomy)能根据目标自己规划下一步
记忆(Memory)记住上下文、用户偏好、历史决策
工具使用(Tool Use)能调用外部API、脚本、数据库
自我修正(Feedback Loop)能根据结果调整策略、优化行为

所以简单来说就是:“大模型 + 其他能力 = Agent。”

六、Agent 为什么突然火了?

通过上面的描述,其实大家会发现,Agent 并不是新概念,从早期的机器人、软件代理,到今天的自主智能体,它一直都在,只是能力一直有限。

  1. 过去的 Agent 会动,但不会想。
  2. 机器学习时代的 Agent 能学,但不懂沟通。
  3. 而到了大模型阶段,一切都变了,既能又能了。

现在大模型时代来了,对于创造一个真正的Agent来说,三件事同时成熟了:

  1. 大模型的推理能力足够强,能理解任务、分解目标;
  2. 工具调用(Function Calling)机制稳定,AI 能主动“执行”操作;
  3. 框架生态完善,LangChain、CrewAI、Autogen 等让构建门槛极低。

这让 Agent 终于从“回答问题”变成“解决问题”,它不再只是一个聊天模型,而是一个能理解目标、规划路径、执行任务的自主系统。

总结

Agent,就是让大模型真正“动起来”的那部分能力。

它能感知环境、理解意图、执行动作、根据结果自我调整,换句话说,AI 不再只是语言模型,而是开始拥有「行动力」,可以 “主动去做事”。

agent_action