AgentKit 是 OpenAI 工具包,将 ChatGPT 代理集成到网站应用。它包含核心API、SDK、构建器、连接器、ChatKit及评估与安全防护。旨在简化AI代理开发、部署和改进,使AI助手可操作。
译自:How OpenAI's AgentKit Embeds ChatGPT Into Any Website
作者:Janakiram MSV
AgentKit 是一个综合工具包,它允许开发者将由 ChatGPT 驱动的代理集成到网站和应用程序中。它在 OpenAI 2025 年开发者日 上推出,作为构建 AI 代理的一种方式,这些代理不仅可以聊天,还可以执行浏览、进行 API 调用和完成多步任务等操作。
本质上,AgentKit 提供了将基于 ChatGPT 的助手直接嵌入到您的产品中所需的架构和构建模块。本文深入探讨了 AgentKit 的架构,包括其核心组件,并演示了它如何使 ChatGPT 式的功能无缝嵌入到任何网站中。
OpenAI AgentKit 的基础
AgentKit 的核心建立在由两个主要后端组件组成的强大基础上:响应 API 和 代理 SDK。它们构成了驱动所有 AgentKit 功能的引擎:
响应 API: 处理结构化输出和 OpenAI 的函数调用接口(即工具使用)。当代理需要使用外部工具或 API 时,响应 API 会格式化请求,执行函数调用,并以代理可以理解的结构化格式返回结果。这消除了开发者解析输出或手动处理工具集成错误的需要。
代理 SDK: 为代理提供运行时和编排层。它管理多轮对话状态,按顺序执行多步工具调用,处理重试和错误,并强制执行代理的控制流逻辑。此 SDK 使代理能够在不同步骤中保持记忆和推理,而无需开发者编写样板代码来链接提示或跟踪上下文。代理 SDK 可以直接在代码中使用以实现完全控制,也可以通过可视化构建器等更高级的工具进行访问。
实际上,响应 API 加上代理 SDK 意味着开发者不必为对话管理或工具重塑底层基础设施。
AgentKit 中的所有其他功能都建立在这两层之上。实际上,这种架构意味着开发者不必为对话管理或工具重塑底层基础设施——这些功能是开箱即用的。AgentKit 工作流可以通过可视化或代码定义,平台在幕后处理流式响应、状态和工具编排。这种架构通过处理常见的代理模式来加速开发,并通过提供带有内置错误处理和安全检查的经过测试的运行时来提高可靠性。
安全和护栏也是 AgentKit 架构不可或缺的一部分。该平台包括输入验证、输出过滤和个人身份信息 (PII) 屏蔽功能,以防止恶意提示和敏感数据泄露。这些护栏充当代理周围的安全层,扫描进入和离开模型的内容。虽然并非万无一失,但它们通过阻止越狱尝试和从日志中删除私人信息,显著降低了在真实用户数据上部署 AI 代理的风险。开发者可以根据用例调整护栏的严格性。例如,针对金融聊天机器人收紧限制,而对不那么敏感的内部工具则放宽限制。这种安全优先的设计确保了嵌入式 ChatGPT 代理在网站和应用程序中负责任地运行。
AgentKit 的构成模块
AgentKit 提供了一套模块化组件,它们协同工作,让您能够快速构建、部署和嵌入由 ChatGPT 驱动的代理。这些组件抽象了常见功能——例如构建对话流程或连接到数据源——因此您可以专注于您的用例逻辑而非基础设施。
以下是核心组件及其功能:
代理构建器: 一个可视化工作流编辑器,用于设计代理的逻辑和对话流程。开发者无需编写编排代码,而是可以将代表提示、工具调用、分支和其他操作的节点拖放到画布上。您连接节点来定义代理的决策逻辑并配置每个节点的参数。代理构建器支持版本控制和预览运行,这意味着您可以安全地迭代代理的设计。您可以测试新的工作流版本而不会影响生产,甚至可以在您准备好在自己的代码库中微调或扩展它时,将可视化流程导出为代码。这种可视化方法显著加快了复杂多步代理的原型设计,使开发者和非开发者都能更容易地协作处理代理逻辑。
连接器注册中心: 一个预构建集成的库,用于将代理连接到外部系统和 API。真实世界的代理通常需要从数据库、SaaS 应用和内部 API 等其他服务中获取数据或触发操作。连接器注册中心为 Dropbox、Google Drive、SharePoint、Microsoft Teams 等常见服务提供开箱即用的连接器。
每个连接器都预先编码,以处理身份验证、API 调用、速率限制和错误,因此您可以选择一个连接器,配置权限并将其插入到您的工作流中,而无需编写自定义集成代码。这个中央注册中心允许管理员在一个地方管理数据访问——您可以控制启用哪些连接器,安全地管理凭据并集中监控使用情况。如果所需的集成不可用,开发者可以创建符合相同接口的自定义连接器,并在项目之间共享。连接器注册中心简化了将您的 ChatGPT 代理与您的其余技术栈连接起来的过程,这是将代理嵌入到真实业务工作流中的关键能力。
ChatKit: 一个可嵌入的聊天用户界面工具包,用于在您的网站或应用程序上部署代理的前端。ChatKit 处理整个聊天界面——消息显示、流式响应、用户输入框、对话历史等——因此您不必从零开始构建聊天用户界面。开发者只需放入 ChatKit 组件并将其指向代理的 API 端点,即可立即在他们的产品中获得一个 ChatGPT 风格的助手。这意味着您可以以最少的努力将由 ChatGPT 驱动的助手直接嵌入到任何网站或应用程序中。
ChatKit 的外观高度可定制,允许您将小部件的设计与您网站的品牌(颜色、字体、布局)相匹配。在底层,它使用 WebSocket 逐令牌流式传输响应,以实现流畅、交互式的体验。通过使用 ChatKit,开发者可以将 ChatGPT 风格的助手嵌入到网站和应用程序中,因此相同的 AI 体验会跟随用户到他们工作的任何地方。
简而言之,ChatKit 通过提供现成的聊天界面,在任何网站上实现 ChatGPT 集成。开发者只需嵌入它,让它与您的 AgentKit 后端通信即可。这大大减少了前端开发时间(在自己构建实时聊天用户界面方面节省了“数周”的工作)。如果需要,团队仍然可以为独特的用例构建自定义界面,但 ChatKit 涵盖了大多数对话代理场景。
评估和追踪工具: 构建 AI 代理是一个迭代过程,AgentKit 包含用于评估和调试代理性能的工具。该平台允许您创建评估数据集(测试查询和预期答案或结果的集合),并对照它们运行您的代理,以测量准确性、响应质量和其他指标。它支持自定义“评分器”——自动化检查或人工评审功能——以评估代理响应的正确性、相关性和安全性。这有助于查明代理可能出错的地方。
AgentKit 还为每次对话提供追踪日志,显示代理的逐步推理过程:它尝试了哪些工具,收到了什么数据,以及它如何决定下一步。追踪评分允许开发者通过重放代理在每个步骤中“思考”的内容来检查和调试复杂的多步工作流。当将 ChatGPT 代理嵌入到生产网站中时,这些评估和追踪功能至关重要。它们为开发者提供了代理决策的可见性,以及系统地改进它的方法。事实上,AgentKit 甚至可以根据评估反馈自动建议提示改进,从而加速代理的完善周期。
AgentKit 支持通过反馈持续改进代理。
强化学习和改进循环: 除了单次评估之外,AgentKit 还支持通过反馈持续改进代理。开发者可以定义奖励函数或自定义成功指标,并利用它们随着时间的推移微调代理的行为。这种强化微调机制使用反馈信号来调整代理的策略。
AgentKit 提供了收集真实用户反馈、记录交互和执行迭代再训练的基础设施,而无需构建单独的管道。虽然开发者必须仔细定义“良好”行为意味着什么,但这个循环允许嵌入式代理在与用户交互时变得更智能,更适合您的领域。实际上,您网站上的代理可以逐渐学习如何通过结合反馈更准确地处理用户查询,所有这些都通过 AgentKit 的工具进行管理。
内置护栏: 如前所述,安全功能是核心组件。AgentKit 将 OpenAI 护栏(一个开源安全库)直接集成到代理中,为内容过滤和安全操作提供可配置的策略。您可以启用护栏来自动检查用户输入中是否存在不允许的内容或试图欺骗 AI 的模式,并类似地清理代理的输出。
有选项可以屏蔽个人数据,防止特定工具使用(例如,限制代理访问只读数据而非删除它),以及高风险操作需要人工批准。这些护栏可以按工作流定制,并有助于确保嵌入在网站上的 ChatGPT 代理在可接受的范围内运行,提供可靠协助而不会失控。例如,客户支持机器人可以有严格的过滤器,以避免提供财务建议或泄露账户详情,而内部研究机器人则可能被允许更多自由。通过捆绑护栏功能,AgentKit 使开发者省去了实现自己的安全检查的麻烦,并使他们能够更自信地部署代理。
组件协同工作
所有这些组件都协同工作。当您使用 AgentKit 将 ChatGPT 嵌入到网站中时,您使用代理构建器(或代码)来定义代理应该做什么,使用连接器将代理与它所需的外部数据/服务连接起来,使用 ChatKit 在您的网站上放置一个聊天界面供用户与代理交谈,并使用评估/监控来跟踪和改进代理的性能。
繁重的工作——例如管理对话状态或在底层调用 GPT-4/GPT-5——由响应 API 和代理 SDK 基础处理,因此您可以专注于构建功能而不是底层实现。
总结
OpenAI 的 AgentKit 代表了使 ChatGPT 风格人工智能在日常软件中无处不在的重要一步。其架构将构建 AI 代理的繁重工作抽象为一个平台,开发者可以轻松地将其集成到自己的产品中。
核心组件——例如代理构建器、连接器注册中心和 ChatKit——提供了一个高级工具包,用于设计代理应该做什么,并以最少的自定义代码将其部署到任何网站或应用程序。实际用例表明,公司正在使用 AgentKit 创建代理,通过将 ChatGPT 的功能嵌入到用户需要它们的地方,实现客户支持自动化、增强生产力工具和简化业务流程。
对于开发者而言,AgentKit 提供了一条从想法到可投入生产的 AI 代理的更快、更可靠的路径,有效地使 ChatGPT 作为有用的、可执行操作的助手存在于您的网站或应用程序中。凭借内置的评估和改进循环,这些代理可以持续改进,使得每个网站上都有一个 AI 助手的前景不仅仅是炒作,而是通过正确的工具可以实现的现实。




