你的AI副驾驶是否正在将数据困在孤立的信息孤岛中?

46 阅读8分钟

文章讨论了AI代理的数据孤岛问题,以及构建跨领域AI编排层的重要性。编排层可以整合来自多个来源的信息,保持技术不可知论,并优化数据访问。建议采取双轨方法,既利用现有AI代理,又构建通用的AI编排结构。

译自:Are Your AI Co-Pilots Trapping Data in Isolated Silos?

作者:Michael Berthold

竞赛已经开始。现在,几乎每个软件供应商都提供某种 AI 协驾驶员,旨在帮助用户在其软件中完成任务。这些助手可以显著加快日常任务的速度:GitHub Copilot 帮助编写代码,Microsoft Word 完成句子,而 Figma 的 AI 提供设计建议。

软件提供商的下一个逻辑步骤是构建超越简单辅助的代理,构建能够从数据中获取洞察,有时甚至做出决策的真正代理。这就是为什么许多软件提供商现在也在推动 AI 助手来分析 由他们自己的软件管理的数据——或多或少地智能化。例如,HubSpot 的 ChatSpot 现在可以从 CRM 数据生成报告,而 Google Analytics 的 AI 驱动的洞察可以自动发现异常的流量模式或标记参与度的突然下降。这使得存储在这些工具中的信息能够以更具创意的方式使用,而不是依赖于内置的仪表板或手动创建的报告。这些代理甚至可能最终 24/7 全天候监控数据,主动提供洞察和建议的操作。

但是,虽然从供应商的角度来看,每一项发展都是有意义的,但这给企业带来了一个问题:他们所有的 AI 代理都在孤立的孤岛中工作。

AI 碎片化和数据孤岛的挑战

限制于单一数据源的代理 用途有限,因为它们只能提供对可用信息狭窄切片的洞察。这在需要真正专业的代理的情况下可能是有意义的。但是,可以访问整个组织所有信息的代理可以提供更大的价值。想象一下客户成功代理:在 CRM 中,代理可能会提醒您,客户的续订将于下周到期,并且到目前为止没有人联系过。有用 - 但狭窄。

通过访问更多的工具,代理还可以标记出该客户的支持票据最近激增,产品使用量与上一季度相比下降了 40%,并且该帐户中没有人参加过任何网络研讨会或回复过营销推广。AI 可能不会简单地进行提醒,而是建议升级帐户或起草有针对性的签到消息来解决这些问题。

即使是经典的协驾驶员也将受益于企业范围的数据。即使它像能够说:“你现在开始做的事情,你的同事 Anita 已经在三个月前的不同情况下尝试过了” 这么简单。

大量助手在部分数据上并肩工作不符合任何人的利益。谷歌的 Agent-to-Agent 框架旨在(至少部分地)通过标准化代理之间的合作来解决这个问题。但是,这并没有解决核心问题:理想情况下,AI 代理应该跨系统无缝运行,并且可以无限制地访问组织的整个数据环境,包括来自 社交网络 或评论平台等来源的任何公开可用数据。

为什么 AI 代理需要成为一个编排层

如果您的组织是少数能够将所有数据保存在单个云提供商中或已实施全球数据仓库的组织之一,为什么不利用 AI 功能?但是,我们是否应该保留构建自己的代理的自由——或者使用来自专门从事 AI 而不是数据仓库或数据湖的提供商的代理?

无论如何,这种“在一个地方统一数据”的观点对于大多数公司来说是不现实的。大多数公司都在使用各种系统的拼凑而成,并且需要开放访问由这些工具管理的数据。但这不符合个别供应商的利益,因为它会削减他们的 AI 收入。一些供应商已经开始限制或彻底禁止外部代理访问他们的数据。客户能够容忍被告知他们无法充分使用自己的数据的情况还有待观察。

从长远来看,代理 AI 平台将作为一种平台盛行,该平台能够独立于组织内使用的软件工具和底层数据源来编排 AI 工具和代理。这些平台允许自由配置代理,并为它们提供灵活的工具,这些工具可以组合来自多个来源和抽象级别的信息。它们还可以合并其他代理,或者通过像 MCP 这样的协议,集成外部信息收集器或参与者(所谓的工具)。当然,它们有时会嵌入与特定软件工具相关的专用子代理——当这样做有意义时,而不是因为它们必须这样做。

就像 数据集成和分析平台 一样,这种方法对于保持技术不可知论是有意义的。例如,如果您想切换 CRM 系统,则不必依赖新工具的捆绑 AI 或重新配置所有代理。您只需要更新中间层中的一些集成工具,以将旧系统指向新系统。

最后,从合规性的角度来看,这种编排层也是有意义的。如果在某个时候,您想(或需要)追溯决策是如何做出的,如果一个工具记录了代理的整个决策过程,那就容易多了:处理了哪些查询,使用了哪些带参数的工具,以及从哪里检索了哪些数据。

我们在 KNIME 自己也看到了这一点。我们构建了一个内部 AI 代理(代号:AKA - 询问 KNIME 任何事情),它依赖于各种工具来访问关于客户、用户、事件和内部数据(如员工、财务和文档)的结构化信息。KNIME 员工使用 AKA 来快速了解关于客户、营销或人力资源相关问题的洞察,而无需了解通常访问这些洞察的软件。关键是这些工具不仅仅提供原始的 数据访问——它们通常整合来自多个来源的洞察

例如,“客户信息”工具将来自 CRM、支持系统和事件数据库的数据整合在一起。AI 理论上也可以进行这种集成,但这会使它的工作更加困难。此外,许多公司已经有了这种类型的数据集成工作流。想象一下,如果一个所谓的“万事通”代理必须从各种系统的原始输出或来自其专业 AI 的碎片化洞察中拼凑出所有东西,那将是多么麻烦。当然,当 AI 逐渐构建和完善自己的信息收集工具时,这会变得更加有趣——使用用户反馈来改进其对组织结构和关系的建模(以避免说“理解”)。

代理的广泛数据访问的复合回报

那么,与特定于软件的 AI 孤岛相比,您如何衡量这种 AI 编排层的附加值呢?与往常一样,这并不容易。真正的冲击会随着时间的推移而显现:代理可以访问的集成越多,它就越有用。没有代理可以从第一天就解决所有问题。用户反馈改进了提示和代理记忆,而持续的改进使代理一步一步地变得更好。最初,嵌入在特定工具中的代理可能看起来更优越——为该环境进行了完美调整。但是很快,具有更广泛信息访问权限的代理将超越该专家。

下一个大问题将是工具制造商如何试图强迫客户坚持使用他们的 AI 产品。有些人已经开始阻止访问外部 AI。对于云提供商来说,这不仅是一个产品问题,而且也是一个带宽问题。如果每个客户都手动访问他们的数据,那是可以管理的。但是,如果每个客户都运营自己的 AI 基础设施,每隔几分钟就发出大量数据请求,这就会成为一个问题。工具提供商收取的基于消费的定价很可能不仅仅是因为我们使用他们的工具,还因为我们的代理处理我们的数据。这是集中式编排层有意义的另一个原因:它可以优化数据访问,并且不依赖于供应商的 AI 就能实现成本效益。

现在的一个明智策略可能是采取双轨方法:现在使用与您的软件捆绑在一起的代理来快速获得一些成功。但与此同时,开始构建一个跨领域的 AI 编排结构,当整个过程都被代理化时,您无论如何都需要它来进行更大的 AI 项目。很快,这种更通用的 AI 将能够处理大多数专业任务。通过 观察使用数据,应该清楚哪些专业 AI 仍在被使用,以及在哪里,就像过去的 Google 一样,通用代理成为首选解决方案。

与我们人类不同,代理在塞入更多知识方面没有任何问题。他们不会厌倦吸收、处理和使用新信息。最重要的是,他们什么也不会忘记。