为什么数据治理是AI智能体成功的秘诀

3 阅读6分钟

\n\n本文探讨了数据治理在AI智能体落地中的核心作用。文章指出AI会放大现有流程的优缺点,企业需通过数据卫生、自动化审计和沙箱隔离等七步法,夯实DevOps基础以确保AI安全。

译自:Why data governance is the secret to AI agent success

作者:Rod Cope

事实是:AI 并非在取代 DevOps,而是在放大它。全球 70% 的 IT 领导者一致认为,强大的 DevOps 实践有助于在整个 SDLC(软件开发生命周期)中成功采用 AI。这一数据来自 Perforce 2026 DevOps 现状报告,听起来令人宽慰,直到你看到硬币的另一面。在 DevOps 基础尚不成熟的地方,AI 会以机器般的速度放大弱点。因此,随着 AI 智能体采用范围的扩大,包括数据治理在内的治理工作已变得比以往任何时候都更加重要,以降低风险。

一旦 AI 智能体从辅助开发者转变为代表开发者采取行动,风险将不再仅仅是糟糕的代码,还包括糟糕的数据流经自主系统的可能性。对于已经在数据治理和 DevOps 流程方面挣扎的企业来说,AI 智能体将迅速放大现有问题。

对输出的信任与可审计性不匹配

这就是为什么建立流程和工具至关重要,这些流程和工具能让我们更安全地信任 AI 输出,涵盖合规性、安全性、透明度、可审计性和可追溯性。但是,尽管 AI 的采用正在升温,却只有 39% 的组织拥有全自动化的审计追踪,尽管有 77% 的组织报告对 AI 输出充满信心。

缩小 AI 采用与全面治理之间的差距需要迅速行动。虽然许多企业仍处于 AI 的早期阶段,主要利用该技术帮助人类提高工作效率,但格局正在迅速变化。这种角色和职责的演变正在为新的操作动态奠定基础。

“一名开发者上班时可能会发现,AI 在一夜之间修改了 12,000 行代码……该开发者几乎无法对 AI 的工作进行随机抽查,更不用说掌握全貌了。”

例如,一名开发者上班时可能会发现,AI 在一夜之间修改了 12,000 行代码,运行了 10,000 个测试,编写了 200 页文档,并部署了 32 个新产品功能,且已有 100 万用户在访问它们。该开发者几乎无法对 AI 的工作进行随机抽查,更不用说掌握 AI 所做工作的全貌。

回归基础

我们经历过许多技术革命——也许没有 AI 这种规模——但作为一名领导者,我始终建议的基础之一是回归基础,审查现有 DevOps 或敏捷基础的成熟度,并优先强化或采用良好实践。这不应被视为延迟,而应被视为防止安全性薄弱、数据治理不一致或其他流程损坏的重要基础工作。这种基础工作必须现在就做,而不是在 AI 智能体广泛实施后才作为事后补救,到那时缓解问题可能会非常困难甚至不可能。

治理必须处于这种 DevOps 成熟度审查的核心,特别是对于那些处于高度受监管行业的组织。通过完全的透明度、可审计性、可追溯性和护栏来建立对 AI 信任的能力,将成为那些希望在保持竞争力的同时安全运营的组织的关键差异化因素。

改善治理的七个步骤

在实践中这意味着什么?以下是一些建议的切入点:

1. 保持良好的数据卫生

清洗数据是一项公认的实践,但组织往往会陷入将其视为一次性任务的陷阱。数据不会保持干净;它会变化和增长。因此,修复产生数据的流程至关重要,而不仅仅是修复数据本身。识别支持业务决策的特定数据流,并应用适当的治理控制。特别是,确保 AI 永远无法访问真实的客户或其他敏感数据至关重要。数据脱敏等技术可以提供逼真但绝非真实的测试数据。

“数据不会保持干净;它会变化和增长。因此,修复产生数据的流程至关重要,而不仅仅是修复数据本身。”

2. 确保稳健的测试框架到位

建立强大的单元测试、功能测试和性能测试。确保定义并执行正确的策略,包括内部或行业驱动的合规性要求。

3. 消除瓶颈

努力构建端到端顺畅运行的 CI/CD 流水线,尽量减少触发流程时的人为干预。在确保为每个 AI 系统采取适当安全措施的同时,尽可能实现自动化。

4. 让安全与合规检查更简单

目前,许多流程仍将依赖于“人在回路”(human in the loop),但要让这些步骤尽可能简单。为用户提供做出明确“是”或“否”决定所需的一切,而不是要求他们翻阅报告、登录多个系统并解释调查结果。利用 AI 进行总结:“我运行了这些检查,所有内容均已核实,这是我的结论。”

5. 追踪一切

我们正迅速走向这样一个世界:与 AI 的对话成为软件开发背后意图的一部分。这些交互必须被捕获。很快,维护一个人类和 AI 都无法修改的、一次写入、只读、不可变的单一事实来源将变得至关重要。

6. 隔离 AI

AI 智能体进行沙箱化或容器化处理,使其只能访问所需的数据和工具。防止它们修改必须保持不可变的信息,例如审计记录。

7. 循序渐进,逐步构建

先建立基础框架,然后随着组织有能力通过 AI 成熟度级别而逐步添加加速器。第一级和第二级是人类导向的,遵循人类意图并进行人在回路的审查;而第三级和第四级则是 AI 在大规模上实现多智能体自主化,具有主动的自我改进系统,且除了指导高层意图外,几乎不需要人类参与。需要注意的是,这一切都不可能一蹴而就,尤其是在人类必须密切参与的安全或任务关键型环境中。

然而,即使在这些环境中,AI 智能体的采用也将迅速加速,并推动企业走向更高成熟度的 AI 水平。这就是为什么现在就必须开始建立或强化这些基础,以 DevOps 实践(归根结底是公认的 SDLC 常识)为指南,在始终优先考虑强治理的同时,实现快速的竞争性创新。全 工智能