在开始写这本书的前几个月里,陆续出现了一些公告,强调对智能体的投资规模高达数百亿美元,覆盖了支持智能体的基础设施、构建智能体的工具包、为智能体提供动力的 LLM、面向开发者与大众的智能体培训,当然还有海量 YouTube 视频在大力鼓吹智能体的好处。
不过,智能体以这样或那样的形态,其实已经存在了一段时间。事实上,如果我们把时间线拉得足够远,很可能可以把最早的智能体概念追溯到 Alan Turing:他提出了机器智能以及用于评估机器能否展现类人智能的图灵测试。这项奠基性的工作,为我们今天所说的智能体播下了种子。
再快进几十年,各种非常原始的智能体开始出现。20 世纪 80 年代,第一批模拟人类决策的专家系统开始落地。随后出现了 Apple 的 Siri 等虚拟助手,并持续演进。但直到 2017 年,这个领域才真正发生质变:Google 的研究人员发表了里程碑论文《Attention Is All You Need》,提出 Transformer 架构,彻底改变了 AI。这个突破为当今先进的 LLM 奠定了基础,使得智能体能够以更类人的方式进行处理、生成与交互。
不过,今天的 AI 智能体体现的是一次“质的突破”,而不只是渐进式改良。与前辈不同,基于 LLM 的智能体能够进行灵活推理,在跨对话中理解上下文,生成创造性方案,并在没有预先编程的情况下适应全新情境。
我们在 LLM 智能体兴起前不久,就开始构想本书所描述的概念与架构。我们的工作建立在更早的生态之上,比如面向 API 的 service mesh,以及面向数据产品的 data mesh。本书沿着这条谱系进一步延伸到智能体,我们称之为 agentic mesh。最简单地说,生态系统就是一组相互连接、彼此依赖的部分。在技术领域,当组件——无论是服务、数据还是智能体——被设计为能够协同工作时,生态系统就会自然出现。
但“agent(智能体)”这个词对不同的人意味着不同的东西,因此我们先给出下面这些定义,用来框定我们的讨论:
Agentic(具备智能体性)
能够独立做出决策,通常面向达成某个目标
Agentic AI(智能体式 AI)
使用 LLM 进行复杂推理与迭代式规划,自主解决复杂的多步骤问题
Agents(智能体)
使用 agentic AI 来独立规划并执行任务
把这些术语组合起来,我们得到一个对“agent”的简单定义:
智能体是一种由 LLM 驱动的程序,它能够独立做出决策、迭代规划,并执行任务以实现复杂目标。
而当我们谈论一个由智能体构成的“网格”——也就是 agentic mesh——我们指的是:
agentic mesh 是一个互联的生态系统,使智能体可以轻松地彼此发现、协作、交互与交易。
在 agentic mesh 中,智能体是核心参与者。它们在设计上具备治理(governance)、互操作性(interoperability)与信任(trust),从而能在更广泛的智能体生态中协作、交互,甚至进行交易。然而,关键的区分在于:单个智能体的需求,与更大生态系统的需求并不相同。生态系统存在的目的,是在规模化条件下促进协作,这就引出了一个问题:当成千上万个彼此独立运作的智能体同时规划、执行并交付结果时,如何做到一致、可控?这正是 agentic mesh 试图解决的挑战。
话虽如此,我们先来看看我们是如何走到今天这一步的。
LLM 的出现
2023 年,OpenAI 发布了 GPT-3.5——可以说,这是 AI 首次让对话以一种“相对像人”的方式发生。当然,从那之后一切都在加速:LLM 的能力迅速增长,而成本下降得更快。许多最初规模不大的行业新巨头(如 OpenAI、Anthropic 等),以及 Google、Microsoft 这样的技术常青树,都推出了 ChatGPT、Claude 等服务,并获得了前所未有的增长与接受度。
这种快速演化改变了个人与企业与 AI 交互的方式。过去需要大量技术专长才能使用的工具,如今普通大众也能轻松上手,让数百万人把先进 AI 能力融入个人与职业生活。无论是生成文本、分析数据,还是提供客户支持,LLM 都把类人的智能带进了日常应用。
但我们到底在说什么?在 LLM 语境下,“类人智能”指的是:它们能够理解语言、围绕上下文进行推理,并以一种类似人类思考与沟通的方式生成回应。比如,当客户对航空公司聊天机器人说:“我的航班延误了,会赶不上转机,我该怎么办?”系统不只是做关键词匹配——它会理解意图,权衡处境,并给出解决方案,例如改签选项或最近服务台的指引。这种“理解 + 语境推理 + 适应性问题求解”的组合,类似人类客服处理同类请求的方式,因此我们称之为类人。
基于这些惊人的进展,许多人预测,巨大的生产力提升与增长机会将随之而来。Lila Ibrahim(Google DeepMind COO)写道:“AI 有巨大的潜力把我们的世界变得更好。从实现疾病的早期检测、加速药物发现,到通过发现可持续的新材料来应对关键的环境挑战,AI 已经在推动人类社会最棘手问题上的进展。”
Ibrahim 强调了 AI 已经在医疗、科研与环境可持续性方面产生的实质影响。但 AI 的影响覆盖所有行业。Organisation for Economic Co-operation and Development(OECD)指出:“AI 已经在跨行业改变关键业务职能,例如内容推荐、在线销售与客户服务……它分析数据、自动化流程并增强决策的能力,有望带来经济增长与社会进步。”
在此基础上,McKinsey & Company 表示:“生成式 AI 有望释放下一波生产力……其对生产力的影响可能为全球经济增加数万亿美元的价值。”其最新研究估计,GenAI “每年可能增加相当于 2.6 万亿到 4.4 万亿美元的价值”。McKinsey & Company 进一步称:“生成式 AI 将对所有行业产生显著影响。银行业、高科技与生命科学等行业,可能在收入占比上看到最大的影响……例如在银行业,如果用例被全面落地,这项技术每年可能创造相当于额外 2000 亿到 3400 亿美元的价值。在零售与快消品领域,其潜在影响也很可观,每年约 4000 亿到 6600 亿美元。”
不出所料,人们正在注意到这一点。AI 相关基础设施(例如数据中心、基础模型)的投资正在快速增长。JPMorgan Chase 估计:“美国目前正在建设超过 3800MW 的容量,比上一年增长约 70%,另有 7000MW 处于不同阶段的前期建设中。”在另一篇报道中,Reuters 称:“自 OpenAI 于 2022 年推出 ChatGPT 以来,用于为 AI 提供算力的数据中心投资激增;跨行业公司正越来越多地把运营迁移上云,并将 AI 集成到其产品中。”
这波基础设施增长浪潮意味着:把 AI 融入几乎任何业务流程,存在更广阔的机会。组织正越来越多地把工作负载迁移到云端,并利用 AI 驱动的解决方案来简化流程、优化资源、交付更好的客户体验。无论如何,这些投资的规模都表明:企业理解 AI 的深远影响,并在采取行动以确保能抓住其潜力。
AI 的力量正在以前所未有的速度重塑世界。ChatGPT 在短短 17 个月内就达到了每周 8 亿活跃用户,成为史上增长最快的产品,展示出的采用速度甚至超过互联网时代最成功的产品发布。与此同时,全球投资也达到惊人水平:2024 年美国六大科技公司与 AI 相关的资本开支同比增长 63%,达到 2120 亿美元;而 AI 岗位发布量自 2018 年以来增长了 448%。
然而,尽管 AI 与 LLM 已经取得如此多令人瞩目的进展,我们看到的仍只是更大变革的开端。与过去需要几十年才成熟的技术浪潮不同,AI 的发展正在以前所未见的复利速度叠加,模型性能持续提升。与此同时,推理成本在短短两年内下降了 99.7%。随着技术以惊人的速度演化,世界正在进入一个新阶段:AI 不再只是协助完成任务——它会自主承担责任、解决问题,并创造机会,从根本上重新定义工作的完成方式。
智能体时代
我们预见,AI 将从“被动响应的工具”演进为“主动、自治的智能体”——它们不仅响应提示,还能在既定参数内独立规划、执行多步骤工作流,并做出决策。早期例子已经出现:能够跨多个日历预订会议的 AI 智能体、通过浏览数百个网站开展研究的智能体、从首次接触到最终解决全程管理客户服务互动的智能体。这代表着一次根本性转变:从“回答问题的 AI”转向“达成目标的 AI”。
这些智能体由同样的 LLM 进展驱动,并由对 AI 基础设施的空前投资所推动,将使我们讨论过的商业收益不仅可行,而且变得司空见惯。它们会模糊自动化与自主行动的边界,带来一个机器与人协作、释放未被挖掘潜力的未来。
我们很快会定义并深入探讨我们所说的智能体,但在此之前,我们先看看它们预计将产生的影响。Marc Benioff,Salesforce CEO 表示:“我们正在进入一个由自治 AI 智能体构成的新纪元,它们能够自主采取行动,并增强人类的工作。这不仅是技术的演进,更是一场革命,它将从此根本性地重塑人类工作、生活与彼此连接的方式。”
不仅生产力预计将提升,工作方式本身也将发生剧烈变化。Benioff 进一步指出:“今天,我们已经习惯了‘预测式 AI’——分析数据以给出建议、预测与洞察——以及‘生成式 AI’——从数据中学习并用模式无缝生成文本、图像、音乐与代码。智能体远不止于此。它们可以独立执行任务、做出决策,甚至代表我们与其他智能体谈判。”
也许在人类历史上,这还是第一次角色发生反转:到目前为止,人类一直在指挥技术。我们——人——握着方向盘,让技术朝我们希望的方向走。现在,智能体可能会成为那种决定方向的技术(当然希望是在护栏之内,关于这一点本书后面会展开)。Benioff 继续说:“技术不再只是为人类提供做事的工具,而是在提供智能、可扩展的数字劳动力,能够自治地执行任务。智能体不再等待人类输入,它们可以分析信息、做出决策并独立采取行动,在过程中不断适应与学习。”
World Economic Forum(世界经济论坛)这一经济智库也预见智能体将推动重大经济变化:“AI 智能体正在变得更先进,这对决策、问责与监督具有重大影响。”因此,“AI 智能体的益处包括生产力提升、专业化支持,以及在医疗、客户服务与教育等领域的效率提升。”
有一件事似乎已经非常明确:智能体正在到来。很快。而且会以规模化的方式到来。
定义智能体(Defining Agents)
但什么是智能体(agent)?我们先看看一些头部公司和思想领袖给出的定义:
- “AI 智能体指一种系统或程序,它能够代表用户或另一个系统自主完成任务:通过自行设计工作流,并使用可用工具来完成。”
来源:IBM - “AI 智能体是一类人工智能(AI)系统,能够在无需人工干预的情况下理解并回应客户咨询。”
来源:Salesforce - “AI 智能体是一个使用 LLM 来决定应用程序控制流的系统。”
来源:LangChain - “AI 智能体是推理引擎,能够理解上下文、规划工作流、连接外部工具与数据,并执行动作以实现既定目标。”
来源:Deloitte
遗憾的是,我们认为这些定义里有相当一部分正在滑向“agent-washing(智能体洗白)”。这个词描述了一种日益增长的趋势:一些厂商把旧工具——聊天机器人、宏(macros)、机器人流程自动化(RPA)脚本——贴上“智能体”的标签,尽管它们缺乏真正的自治能力。真正的智能体能够动态地思考、规划、行动并适应;但许多所谓“agentic”的方案,不过是换了新皮肤的 AI 助手。Gartner 等机构也提醒:当下市场上的产品只有一小部分符合真正定义——也就是 LLM 能够驱动其自身流程、做出决策并独立协作的系统。与“被动响应”的工具不同,真正的智能体在保持上下文、管理优先级、以及在团队或生态中协作方面,更像人。
这种区分会带来严肃的架构影响——我们会在接下来的章节里展开详谈。真正的智能体是无头(headless)的、分布式的、事件驱动的,并且是安全优先的——这意味着它们需要容器化、编排、可观测性,以及零信任身份框架。我们将提出一种智能体架构模型:把微服务与推理引擎结合起来,使行为可规模化、可安全落地,并由目标驱动。企业必须要求透明度,避免被炒作裹挟。缺乏纪律会让企业把钱投到“重新包装”的工具上——它们既交付不了自治能力,也交付不了 ROI。若智能体要兑现承诺,我们就必须越过被夸大的标签,拥抱真正可运行的架构。
如你所见,这里有一些共通线索——我们把它们捆在一起,再补充几条观点,给出一个更整体的智能体定义:
- 智能体由 LLM 提供动力,LLM 支撑了其规划与执行任务的能力。
- 智能体具有一组稳定的特征,用以界定其目的、行为、范围与问责。
- 智能体具备自治性:能在其目的边界内、并在其所有者设定的约束下独立行动。
- 智能体能够使用工具,并与其他智能体协作来完成任务。
从实践角度出发,也为了区别“agent”一词过去的用法(也许不言自明),当我们谈论智能体时,应当清楚我们指的是 AI 赋能的智能体。
当下的智能体(Agents Today)
那么,今天真的在构建智能体吗?目前投入使用的多是“原始智能体(primitive agents)”,大多数组织更多是在使用工作流(workflows)。这些工作流(见图 1-1)依赖以一种方法论化、预定义的方式编排 LLM 与其他工具。当你采用工作流时,开发者或工程师会提前决定系统在每一步使用哪些工具,并明确行动序列。
图 1-1. AI 工作流 vs 自治智能体 vs 企业级智能体
Anthropic(一家 AI/LLM 厂商)将工作流定义为:“LLM 与工具通过预定义的代码路径进行编排的系统。”AI 工作流是一种结构化的、逐步推进的过程,它把多种工具、模型与算法整合起来以执行一个或一组任务。与被设计为具备一定自治性与适应性的智能体不同,工作流依赖开发者预先写好的指令与固定的决策点。
TIP
把 AI 工作流形象化的一个简单方法,是把它看作汽车装配线:每一步都被精心设计,以固定路径把任务往前推进,几乎没有偏离或自我决策的空间。
即便如此,AI 工作流已经变得相当强大。Anthropic 总结了几类常见的工作流模式:
- 提示链(prompt chaining) :把任务拆成顺序步骤,每一步处理上一步的输出,例如生成广告文案、翻译它、再验证译文准确性。
- 路由(routing)工作流:对输入进行分类并导向专门流程,例如把客户问题分流到退款请求、技术问题或一般咨询。
- 并行化(parallelization)工作流:把任务拆成相互独立的子任务并行处理,例如分析文档的不同章节,或汇总多次运行的输出。
- 评估器—优化器(evaluator-optimizer)工作流:通过迭代来打磨输出,一个 LLM 生成内容,另一个提供反馈,类似人的编辑流程。
为什么要强调工作流?因为它们极其强大,而且你的智能体很可能会使用工作流。但工作流不同于智能体。今天的工作流,是智能体的祖先。
智能体与工作流不同:智能体会为完成任务动态生成自己的计划——自己选工具、选执行路径,并控制如何完成任务。与工作流相比,智能体内建一种能力:无需预先定义静态实现,也能“想明白”怎样把任务做得最好。这意味着,智能体可以当场决定何时进行计算、何时查询数据库,或以其他方式调整计划。
智能体不是遵循固定步骤序列,而是实时分析任务、生成自己的计划,并选择最合适的工具与执行路径来达成目标。这种灵活性让智能体能够适应新颖或意外的情境,使其尤其适合复杂、开放式问题。例如,一个负责收集市场趋势信息的智能体,可能会动态决定去查询特定数据库、分析最新新闻文章、交叉对比社交媒体情绪,或与其他智能体协作,并随着新信息的出现不断调整策略。
尽管真正意义上的智能体自治仍处于早期阶段,但当下的开发者正在积极把“工作流的可预测性”与“类智能体的灵活性”结合起来。这些“原始智能体”往往在边界清晰的范围内运行:以工作流为地基,同时引入一定的决策与适应能力。我们认为,这些早期实现正在为更复杂的智能体铺路,它们展示了把静态工作流与动态能力结合的实际价值。
企业级智能体(Enterprise-Grade Agents)
因此,尽管今天已经在构建智能体,但仍有一些悬而未决的问题:它们能融入组织的技术环境吗?足够“可上生产”吗?称得上“企业级”吗?
随着智能体自治与复杂度提升,我们认为智能体必须走向企业级。它们需要能够轻松集成进企业的技术与应用版图;需要遵循企业流程——例如 DevSecOps 与 MLOps——这些流程为把关键任务应用(很快也包括智能体)推向生产提供必要的严谨性;需要满足企业应用的共性期待,做到可发现(discoverable)、可观测(observable)、可运维(operable)、安全(secure)与可信(trustworthy)。
想一想:如果我们构建的智能体尚未准备好上生产,如果它们不具备大多数企业里常见的能力,如果它们不遵循企业流程,它们就永远进不了生产。而进不了生产,就交付不了价值。我们认为,这不仅是个大问题,甚至是智能体演进过程中近乎“生存性”的挑战,必须被解决。
在一个我们已知智能体将要到来的世界里,我们需要企业级智能体。今天,企业往往以定制、手工拼装的方式把智能体推上生产。这显然不可持续,会带来一次性方案,并不可避免地堆积成技术债大山。
所以(也许显而易见),我们对此会有大量内容要讲。一个企业级智能体架构(见图 1-2)包含若干关键组件:
- 端点(Endpoints)
通过微服务中常见、成熟的方式访问智能体(例如 REST)。 - 核心能力(Core capabilities)
智能体可发现、可观测、可运维、可信,从而易于查找、监控、运营与信任。 - 安全(Security)
每个微智能体(microagent)都内嵌或使用企业通用能力:双向 TLS、用于基于角色访问控制的 OAuth2,以及与权威身份系统(identity books of record)的集成。 - 协作(Collaboration)
智能体可与人或其他智能体协作:能够识别满足所需能力的协作方,用自然语言通信,在长时间运行的请求中管理状态,并在需要更多信息时与人或其他智能体交互。 - 任务管理/智能(Task management/intelligence)
智能体能够动态规划并执行任务;能够利用多种能力——通过 LLM 获得的智能——来解决问题、学习、使用历史对话,并调用工具。
图 1-2. 企业级智能体(Enterprise-grade agents)
Agentic Mesh:智能体生态系统(The Agent Ecosystem)
我们相信,这些企业级需求会被满足,而智能体也会在不久的将来迅速扩散。但我们认为,智能体不会孤立运作,而是会在企业内部、甚至跨行业与跨领域形成互联的生态系统。这个互联生态系统(见图 1-3)就是我们所说的 agentic mesh。agentic mesh 的目标——也是其设计目标——很简单:让智能体能轻松彼此发现,并在安全前提下进行协作、交互与交易。
图 1-3. Agentic mesh:一个由智能体组成的生态系统
智能体——至少是它们未来的形态——将以类似人类的方式行事,尽管智能体是以软件形式实现的,并且通过网络与 API 交互。
就像人一样,没有任何智能体能独自存在,而是会在社群中繁荣发展。人类有政策与规则来约束行为,智能体也一样。像人类一样,没有任何一个单体能解决最大的挑战;也像人类一样,智能体会以团队方式解决更大、更复杂的问题。人类会组织成多层级的群体——我们称之为政府——来建立法律、政策与法规的框架;智能体也将很快演化出类似的治理结构。人类会组织成我们称之为企业的生态系统,提供单个人无法独立交付的服务;智能体也将如此。
agentic mesh——也就是智能体生态系统——提供让智能体可以协作的服务。它提供信任框架,使智能体可被治理;也提供安全“保护伞”,使智能体更安全。它还提供基础设施(例如微服务),使智能体能够以高效、有效并且企业级的方式运行。
从书名你大概也能猜到,agentic mesh——这个企业级智能体生态系统——是本书的核心关注点之一。它由六个组件构成:
Marketplace(市场)
市场让人们能够发现并与智能体建立连接。通过市场,用户可以找到匹配其特定需求的智能体,并在找到后发起与该智能体的交互。
Interaction manager(交互管理器)
它负责管理智能体对话与历史,并提供人们与智能体交互以完成任务的方式。它还允许人们保持对智能体行为的监督,理解任务状态,并确保任务按预期与政策要求被执行。
Registry(注册表)
智能体注册表充当智能体元数据的存储库。元数据包括关键细节,例如智能体的目的、所有者信息、政策、安全角色、能力、端点描述以及生命周期状态。通过维护这些元数据,注册表让智能体能够借助简单的查询机制彼此发现、识别协作者,从而为智能体运行提供结构化且安全的环境。
Monitor(监控器)
智能体监控器维护智能体的运行指标(请求数、延迟等),并提供访问“智能体对智能体”与“人对智能体”的对话细节、智能体为完成任务所采用的历史计划以及其他统计信息。智能体监控器也提供一个接口,使这些信息能以安全的方式对生态参与者开放。
Trust framework(信任框架)
agentic mesh 还提供一个用于认证智能体行为的信任框架。如前所述,每个智能体都有描述与目的,它们为其行为提供护栏与约束。每个智能体还维护一组政策,用来编码其预期目标与动机,并具备一种证明(attestation)能力,用以判定其对政策的遵循程度。信任框架提供类似当今标准组织的正式认证(例如美国的 Underwriters Laboratories、以及用于制造品的 Canadian Standards Association),用来确认某个智能体符合预期。
Patterns and protocols(模式与协议)
agentic mesh 还提供一组模式与协议,使智能体能够彼此发现,并安全地协作、交互与交易。它定义访问方式、参数与消息结构,使每个智能体在智能体生态中可被发现、可观测、可运维。
智能体的挑战(The Agent Challenge)
和任何具备变革性的技术一样,如果我们不强调自治智能体崛起所伴随的挑战,那就不够严谨。这些挑战与智能体带来的机会一样深刻,甚至可能更大,牵涉到经济、社会,乃至伦理框架中的关键问题。在 International Monetary Fund(IMF)的一篇博客中,Kristalina Georgieva 警示说:“AI 将影响全球近 40% 的工作岗位,替代其中一部分,并补充另一部分……我们正站在一场技术革命的边缘,它可能启动生产力、推动全球增长并提高世界各地的收入。但它也可能替代工作并加剧不平等。”
这一尖锐的预测凸显了一个非常现实的担忧:智能体确实可能带来前所未有的生产力与增长,但也会对就业与经济公平带来风险。影响不会均匀分布:不同行业、地区与人群可能经历截然不同的结果——有的收获红利,有的承担代价。
更广泛的影响还不止于工作与生产力;智能体也在挑战传统的问责与监督概念。当智能体独立行动、做决策并在过程中学习时,我们是否能够、以及是否公平地追问:它们的行为最终由谁负责?这会延伸到法律、伦理与运营层面的考量。我们如何确保智能体始终在预期边界内行动?当它们失败或造成伤害时会怎样?在创新与护栏之间取得平衡,将需要政策制定者、产业领袖与技术人员以前所未有的方式协作。
伦理问题同样重要。当智能体承担需要决策的角色时,它们的行动可能反映其训练数据与算法中的偏差与局限——换句话说,它们可能传播我们的偏见与误解。如果不谨慎,这会导致意外后果,包括强化有害刻板印象,或做出与人类价值不一致的决策。因此,从底层开始显式地把透明性、公平性与可问责性构建进智能体至关重要。
这些挑战还因智能体技术演进速度而进一步复杂化。智能体建立在 LLM 之上,而 LLM 的能力在指数级提升、成本也在同样快速下降。不管我们喜不喜欢,智能体都将到来。遗憾的是,政府、机构与企业很可能只能“追赶”,艰难地制定能跟上创新速度的政策与策略。
尽管如此,很显然我们必须采取行动。智能体的承诺太大,无法忽视,它们融入社会的进程也已经开始。如果我们以审慎、谦逊并愿意适应的态度进入这个新时代,我们或许能够在释放智能体力量的同时,降低其风险。无论如何,我们必须把这件事做对,否则这些挑战可能会淹没我们。
智能体的机会(The Agent Opportunity)
显然,企业正在审视如何把 AI 融入自身流程,甚至融入与客户的互动。就智能体而言,尽管它相对新,但企业已经开始识别它们的定位与适用场景。确实,这是高层战略层面的讨论;但全球组织今天也正在投入概念验证(PoC)、实施智能体,并处在早期生产部署阶段。理解智能体以及它们运行所依赖的智能体生态系统,将很快成为现代企业高管的一项核心能力。
对架构师来说,智能体是企业版图中的新组件。今天的智能体及其配套工具包往往以相对“单体式”的方式构建:使用共享内存,几乎所有组件都存在于少量 Python 源码文件中。简而言之,这种单体式方法并不利于轻松构建可上生产的智能体。(也就是说,构建企业级智能体——我们会在后续章节详细说明——此处暂时指智能体满足与其他企业应用类似的期望。)架构师需要梳理智能体技术版图,识别核心组件与集成点,并确定成为企业级所需的特征。本书将描述一种智能体架构:智能体需要如何连接与集成,以及如何把智能体做成企业级。
对开发者来说,正在涌现真正具有创新性的智能体工具包。但在今天,构建智能体仍需要对 LLM、提示工程以及编码(有时还涉及多种编程语言)具备深入知识。并且,调试智能体——哪怕是相对简单的——都很困难(这还是客气的说法)。在本书中,我们会识别出需要构建的关键组件,从而让智能体更容易被构建出来。
如前所述,智能体必须是企业级。智能体必须像其他生产系统一样运行:可发现、可观测、可运维,从而能像其他产品系统一样被管理。并且,智能体还必须具备运维流程,使其易于运营、易于调试、易于诊断与解决问题。我们提供一些选项——例如把智能体构建并运行成微服务——让开发者、工程师与运维人员能够复用几十年来构建可上生产应用的经验。
对工程师来说,我们会解决这些运维挑战。我们解释智能体如何融入 DevSecOps 这类企业流程,以及更新的 MLOps 流程。我们解释需要设置哪些护栏来确保智能体安全,确保它们使用的数据与与客户的交互符合监管、法律与隐私要求,以及企业标准与期望。但即便超越安全,如果智能体的承诺哪怕只兑现乐观者设想潜力的一小部分,那么智能体也必须“被信任”。我们会解释一个信任框架背后的原则:让智能体不仅安全,而且值得信任——可信其遵循伦理准则,可信其透明,可信其明确地做它们应该做的事。
所有现代 AI 方案都把 LLM 当作“大脑”,但 LLM 并不天然具备让系统安全的能力。LLM 可能不遵循组织的政策,尤其当它们没有被明确训练过这些政策时。即便对企业知识进行过微调的 LLM,也未必理解如何阻止敏感信息被无意泄露。而使用向量数据库做检索增强生成(RAG)的 LLM,会生成与从安全数据库迁移出来的数据相关联的 embedding,但在迁移过程中,原先规定访问权限与隐私的安全政策与规则可能会丢失。因此,安全专业人士意识到:当下的智能体并不容易被安全化,于是他们会提出一些让智能体更安全的方案。
总结(Summary)
通过为智能体以及它们所运行的 agentic mesh 生态系统提出一套架构、设计与实现方法,我们希望组织能够克服当前方法与工具包所面临的挑战,并实现 agentic mesh 的收益。我们相信,本书将帮助你——无论你是实践者、开发者、管理者还是高管——构建能够交付价值的智能体。我们也认为,它会为你提供洞见,帮助你打造企业级、可上生产(当然也能交付价值)的智能体,就像其他任何重要的企业系统一样。
归根结底,我们希望你会认同:agentic mesh 实现了它最核心的目的与目标——建立一个智能体生态系统,让智能体能够轻松彼此发现,并在安全前提下进行协作、交互与交易。
我们也希望,通过遵循这些务实的步骤,组织能够转变其对智能体的实践方式,加速其智能体之旅,并把握智能体所带来的巨大机会。