AI智能体赋能IT：告别浮华，直击实效人工智能代理在IT运营中潜力巨大，能自动化修复、监控、测试等，提高效率，加速ROI

人工智能代理在IT运营中潜力巨大，能自动化修复、监控、测试等，提高效率，加速ROI。建议从小处着手，在IT部门负责任地推广，最终扩展到整个企业。

译自：AI Agents in IT: From Hype To Hands-on Impact

作者：Bill Lobig

组织正争相在企业中实施人工智能，以提高生产力、增加效率并获得竞争优势。2024年，企业在人工智能领域投资了2523亿美元，但其影响褒贬不一：尽管大多数组织看到了积极的财务影响，但大多数报告的成本节约低于10%，收入增长低于5%。*

企业必须能够将人工智能项目从抽象的承诺转化为实实在在的收益，在业务用户需要时提供他们所需。其中一部分意味着构建更具弹性、更强大的应用程序，这些应用程序具有更好的吞吐量、更低的错误率和自动化修复能力，因为它们是人工智能赋能的。人工智能代理还需要整合到整个软件开发生命周期 (SDLC) 中，包括 CI/CD 流水线、可观测性平台和事件响应工具。

在许多领域，组织正在将人工智能整合到 IT 运营中，包括事件修复、预测性监控和测试生成，以支持缩短平均检测时间 (MTTD) 和平均解决时间 (MTTR)，并帮助确保应用程序的正常运行时间和性能。一份最新报告发现，通过最初将人工智能工具集中在 IT 运营中使用的应用程序上，组织可以展示价值，获得快速的投资回报 (ROI)，并对如何在企业范围内更广泛地指导未来的人工智能工作充满信心。

代理式人工智能如何重塑 IT 运营工作流

IT 工作流和用例可能是最适合代理式人工智能的领域。这些工具旨在通过关联海量信息、信号和事件，帮助企业保持在线并实现其目标。其目标是在问题影响性能和业务之前检测并解决它们。

此外，IT 运营人员习惯于自动化。与许多可能不愿将功能交给代理的业务用户不同，IT 人员更有可能迅速对代理所做的事情产生信心。因此，人工智能在 IT 运营中的采用路径比在整个企业中更为顺畅。

通过在 IT 内部从小处着手验证代理，并将其扩展到整个 IT 运营中，人工智能代理的价值可以迅速显现。在此坚实的基础上，代理可以以更高的专业水平应用于以业务为中心的任务。

毕竟，IT 人员是开发和实施人工智能的人。通过在他们日常执行的任务中展示切实的利益来让他们参与进来，是获得支持的关键一步。如果 IT 专业人员热衷于在企业中推广代理式人工智能，并且他们的努力得到 C 级高管的全力支持，那么在业务部门之间获得认可将变得容易得多。

代理式人工智能框架的关键要素

在规划代理式人工智能方案时，建立一个框架是明智之举，该框架有助于评估人工智能代理最有可能带来改进的领域，如何评估组织不同部分的人工智能就绪程度，如何管理和协调人工智能代理的行动，以及如何实施负责任的治理监督。

该框架的关键要素可能包括：

IT 运营和网络安全

自动化 IT 运营和网络安全中的最佳实践。
自动修复问题并通过自动化工作流实现进一步自动化。
通过合规即代码建议自动化合规性检查，降低审计风险和监管风险，并创建可供审计的工件。
生成零配置仪表板、警报、故障排除和修复。
在应用程序需要时为其提供精确的资源，包括在不牺牲性能的情况下优化 GPU 工作负载。
识别混合云环境中的资源拥堵和成本超支。

基于数据的建议

对数据进行评分和关联，以识别问题并实施可操作的建议。
整合分散的数据，使其能够提供洞察并生成预防问题的行动，而不仅仅是提供警报。
使用代理式人工智能提供可操作的建议、阈值和修复计划。
以可视化和自然语言交互的形式展示证据，以便用户可以验证发现、探索上下文并进行修复。

软件开发

扫描并检测可能导致安全或弹性问题的代码。
在整个监控生命周期中实现全栈应用程序可见性自动化，包括实时变更检测、映射、跟踪和性能分析。
实现自动和持续的发现、部署、配置和依赖关系映射。

传统上，这些任务需要用户在不同屏幕之间跳转，查看 CPU、内存和磁盘指标，检查日志文件以收集更多数据，并深入查找根本原因。而现在，代理可以自动化所有这些工作，并关联不同代理之间的行动来推荐操作，或者如果它们完全受信任，则可以根据预设策略采取特定行动。

用户可以首先查看证据链，了解代理式人工智能为何推荐特定操作。然后，人类可以批准该操作或进行适当调整。随着IT 运营工作负载自动化的比例越来越高，用户可以审查人工智能代理为何执行其所做的事情。通过这种方式，系统可以持续简化和改进。那些对代理式人工智能持怀疑态度的人可以逐渐对其发现产生信心，并降低监督程度。这使得 IT 部门能够从事更具战略性的行动。

人工智能代理还可以根据企业或特定应用程序的需求、优先级和偏好进行塑造。在某些情况下，性能将是首要考虑，而在其他情况下，成本节约将占据主导地位。代理可以根据企业要求进行调整，创建特定任务的策略，并根据具体情况采取预设行动。下次系统遇到已知场景时，它可以自动执行其职责。根据应用程序和业务案例，人类可以完全参与其中，完全脱离循环，或者根据他们的舒适度和信任程度进行介入和退出。

归根结底，这一切都是为了在正确的时间、正确的地点提供正确类型和数量的资源。资源供应不足会拖慢团队的效率，而资源供应过剩，尤其是昂贵的 GPU 计算资源，则是严重的金钱浪费。

现实世界中的人工智能代理：成功案例

有许多人工智能代理被用于自动化 IT 和业务运营中的任务并提供切实价值的例子。以下是一些示例。

一个站点可靠性工程 (SRE) 团队使用人工智能代理解锁了应用程序弹性的标准化和可重复方法。成果：与手动评估相比，每个应用程序在 IBM 全企业范围内的弹性态势评估中减少了 62% 的工作日；与手动生成报告相比，IBM SRE 团队在月度运营审查中花费的人时减少了 72%；并且通过打破部门壁垒，IT 变得更具生产力。此外，该企业建立了一个可扩展的框架，用于衡量、改进和维持整个组织的应用程序弹性。
在一项基准挑战中，人工智能代理帮助加速了大规模的常见漏洞和暴露 (CVE) 管理。成果：CVE 缓解速度提高了 90%，证书库存管理速度提高了 98%。
在一家全球金融服务组织的试点项目中，人工智能代理将每个实例的补丁管理时间从 90 分钟缩短到最多 20 分钟，并将关键漏洞的“补丁中位时间”从 80 小时缩短到 8 小时。

如何从小处着手，负责任地扩展

利用人工智能实现企业辉煌的竞赛正在进行中。仓促投入人工智能的企业可能会犯错，从而降低对代理式人工智能的信心。明智的做法是从小处着手，最好是在 IT 运营用例中，并在 IT 内部负责任地扩展，然后再将自动化代理推广到整个业务。

IBM Concert、Instana 和 Turbonomic 旨在为代理式人工智能提供实现快速投资回报所需的框架。它们提供集成的应用程序可观测性和风险管理，通过全面的治理框架支持的人工智能驱动自动化，帮助释放您应用程序的潜力。

了解更多关于 IBM 可观测性如何简化复杂性并扩展弹性的信息。