什么让一个 AI 系统成为“智能体”(Agent)?

199 阅读10分钟

本文基于Antonio Gulli 的新书《Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems》 ,仅用于个人学习与技术交流,不作任何商业用途。

一、前言

简单来说,AI 智能体(Agent)是一种能够感知环境、并采取行动以实现特定目标的系统。

它是从传统大型语言模型(LLM)演化而来的新一代形态,具备规划、使用工具、与环境交互的能力。可以把它想象成一个会在工作中学习的智能助手。

它通过一个简单的五步循环来完成任务(见图1):

  1. 接收任务(Get the Mission):你给它一个目标,比如“帮我整理日程”。

  2. 扫描环境(Scan the Scene):它会收集所需信息——读取邮件、查看日历、访问联系人等,了解当前状况。

  3. 思考计划(Think It Through):它会制定实现目标的最佳方案。

  4. 执行行动(Take Action):执行计划,如发送会议邀请、安排会议、更新日历。

  5. 学习优化(Learn and Get Better):观察结果并持续改进。例如,如果会议被改期,它会从中学习,以便下次做得更好。

图1:通过经验持续学习,遵循“五步循环”来完成任务。

二、Agent 的崛起

AI 智能体正以惊人的速度普及。根据最新研究,大多数大型 IT 企业都已在积极使用智能体,其中有五分之一的企业是在过去一年内刚刚开始部署。

金融市场同样注意到了这一趋势:到 2024 年底,AI Agent 初创公司已融资超过 20 亿美元,整个市场估值达到 52 亿美元。预计到 2034 年,市场规模将暴涨至近 2000 亿美元。

换句话说,一切迹象都表明,AI 智能体将在未来经济中扮演举足轻重的角色。仅仅两年时间,AI 的发展范式已发生巨变,从简单的自动化系统迈向复杂的自主系统(见图2)。

早期,AI 工作流主要依赖基础的提示词(prompt) 与触发机制来调用 LLM 处理数据;接着,出现了 RAG(检索增强生成) 技术,让模型基于事实信息生成更可靠的内容;随后发展出能使用工具的单体智能体;而如今,我们正进入 Agentic AI 时代——多个专门化智能体协同工作,共同完成复杂目标。这标志着 AI 从“单点智能”跃迁到“协作智能”的新阶段。

图 2:从 LLM 到 RAG,再到 Agentic RAG,最终发展为 Agentic AI 的演化路径。

本书旨在探讨专门化智能体之间如何协作以实现复杂目标的设计模式

每一章都会展示一种协作与交互的范式。在深入探讨之前,让我们先看一组涵盖不同复杂度的智能体示例(见图3)。

三、智能体的四个层级

图 3 :展示了智能体从简单到复杂的不同实例。

Level 0:核心推理引擎(The Core Reasoning Engine)

LLM 本身还不是一个智能体,但可以作为最基础的智能体核心。

在“0级配置”中,LLM 不具备工具、记忆或环境交互功能,只能基于预训练知识回答问题。它的优势在于拥有强大的知识储备,但劣势是缺乏对当前事件的感知

例如,它无法告诉你 2025 年奥斯卡“最佳影片”的获奖者(若该信息超出其训练时间范围)。

Level 1:连接型问题解决者(The Connected Problem-Solver)

此级别下,LLM 通过调用外部工具成为真正可执行任务的智能体。

它的能力不再受限于自身知识,而是能主动执行多步操作,从外部获取并处理信息,例如:通过搜索引擎或数据库(RAG)检索资料;调用金融 API 获取实时股价;组合多种工具完成任务。

例如,用户要求“找出最近的新剧”,它会先识别需要最新信息,然后调用搜索工具获取数据,再整合结果。

这种与外部世界多步交互的能力,是一级智能体的核心特征。

Level 2:战略型问题解决者(The Strategic Problem-Solver)

在二级阶段,智能体的能力显著增强,具备战略规划、主动协助、自我优化等特性。

这里的关键技术是 Prompt Engineering(提示词设计)Context Engineering(上下文工程)。智能体不再只使用单一工具,而是能解决多步骤、复杂任务,并在过程中主动筛选与组织上下文信息

例如,为了查找两地之间的咖啡馆,它会:先用地图工具确定路线;提取关键街道名称作为上下文;将这些信息传递给本地搜索工具。这样可以避免信息过载,让每一步都精准高效。

上下文工程的目标就是精选、包装并管理关键信息,让模型把注意力集中在最重要的部分。

在实际场景中:

  • 邮件解析助手会从冗长的邮件中抽取航班号、时间、地点,再用这些信息更新日历与天气提醒;

  • 编程助手会从 bug 报告和代码库中提炼关键上下文,以高效完成修复与提交。

更进一步,智能体还会自我改进

例如,它询问用户提示词是否可优化,从反馈中学习如何更好地组织输入,从而不断提升准确性与效率。(详见第17章)

Level 3:多智能体协作系统的崛起(Collaborative Multi-Agent Systems)

在第三级阶段,AI 开发迎来范式转变——从“单体超级智能”走向“多智能体协作系统”。

复杂问题往往更适合由多个专长智能体分工合作来完成,就像人类组织一样。

每个智能体负责特定领域,通过信息共享与协同实现整体目标。例如,在新产品发布流程中:

  • “项目经理智能体”负责总体协调;

  • “市场调研智能体”收集消费者数据;

  • “产品设计智能体”构思方案;

  • “营销智能体”制作宣传材料。 关键在于这些智能体之间的流畅沟通与数据共享,以确保协作一致。

这种系统正在被积极研发,但仍受限于当前 LLM 的推理与协作能力。 未来的突破将决定能否实现真正的全自动化业务流程

四、智能体的未来:五大假设

AI 智能体的研发正以惊人速度推进,覆盖软件自动化、科研、客服等诸多领域。

虽然现有系统已令人印象深刻,但未来的潜力才刚刚显现。

以下是关于智能体发展的五大前沿假设。

假设 1:通用型智能体的出现

未来的智能体将从专用型进化为真正的通才型系统,能够长期、自主地完成复杂模糊任务。

例如,只需一句话:“帮我规划公司30人赴里斯本的季度团建。”

智能体就能持续数周管理整个项目:审批预算、预订航班、选定场地、收集反馈、生成行程表,并定期汇报进度。

实现这种能力需要在推理、记忆和可靠性方面取得重大突破。

另一种平行思路是 小型语言模型(SLM)拼装体系

用多个“小而专”的专家智能体模块化组合,而非扩展单一庞大模型。

这种“乐高式”结构更廉价、易调试、部署灵活。

两条路径——大型通用模型与小型模块组合——都可能并行发展,甚至融合。

假设 2:深度个性化与主动目标发现

智能体将成为主动型的个人伙伴

它不仅响应指令,还会根据你的行为模式和目标主动预测需求

当 AI 从“被动聊天”转向“主动执行”,它才真正成为智能体。

未来,它会主动参与合作、提出建议、执行行动。

例如,你在研究可持续能源,智能体会察觉你潜在的目标,并主动推荐课程、总结论文,帮助你深入探索。

随着这种主动性增强,它将成为助你实现未曾明确表达目标的伙伴

假设 3:具身化与物理世界交互

智能体将突破数字边界,进入物理世界,形成“具身智能体”。

例如,不再只是帮你预约水管工,而是让家中的智能助手直接修好漏水的水龙头

它会:用视觉传感器识别问题;调用知识库规划修理方案;操控机械臂精准完成修复。

这将是数字智能与物理行动的融合,重塑制造、物流、护理等行业。

假设 4:智能体驱动经济(The Agent-Driven Economy)

高度自主的智能体将成为经济主体,创造新的市场与商业模式。

未来,企业家可直接“发布”一个智能体来经营电商:

它会自动分析趋势、生成营销内容、管理供应链、动态定价。

这种“智能体经济”将以人类无法企及的速度与规模运行,极大提升效率。

假设 5:目标驱动的自变多智能体系统

未来的系统将基于目标而非编程指令运作。

用户只需声明想要的结果,系统便会自动规划并执行。这种系统将能自我重构:

  • 结构层面(Architectural Modification):智能体能重写自身代码、优化结构以提升效率。

  • 指令层面(Instructional Modification):系统持续执行自动提示与上下文优化,无需人工干预。例如,用户仅声明:“启动一个手工咖啡电商业务。”

系统将自动生成“市场调研”与“品牌设计”智能体;若品牌设计阶段结果不佳,它会拆分为“Logo 设计”、“网站开发”、“供应链”智能体;若某环节成为瓶颈,它会复制任务分配,实现动态并行。

系统能根据任务不断自组织、自进化,以最优方式实现目标。

五、结语

总而言之,AI 智能体代表了人工智能的重大飞跃: 它不再只是生成文字,而是能感知、规划、行动以实现目标的自主系统。 AI 正从单体工具使用者,进化为多智能体协作网络,能够共同处理复杂任务。

未来,我们将看到更通用、更个性化、甚至能进入物理世界的智能体,它们将成为经济与社会的主动参与者

这一演进标志着技术范式的根本转变——迈向自我改进、目标驱动的智能系统时代,这些系统将彻底重塑我们的工作与生活方式。

参考文献

  • Cloudera, Inc. (2025年4月),《96% 的企业正在扩大 AI 智能体的使用》

  • Deloitte:《Autonomous generative AI agents: still under development》

  • Market.us:《全球 Agentic AI 市场规模、趋势与预测 2025–2034》