AI智能体赋能IT:告别浮华,直击实效

21 阅读9分钟

人工智能代理在IT运营中潜力巨大,能自动化修复、监控、测试等,提高效率,加速ROI。建议从小处着手,在IT部门负责任地推广,最终扩展到整个企业。

译自:AI Agents in IT: From Hype To Hands-on Impact

作者:Bill Lobig

组织正争相在企业中实施人工智能,以提高生产力、增加效率并获得竞争优势。2024年,企业在人工智能领域投资了2523亿美元,但其影响褒贬不一:尽管大多数组织看到了积极的财务影响,但大多数报告的成本节约低于10%,收入增长低于5%。*

企业必须能够将人工智能项目从抽象的承诺转化为实实在在的收益,在业务用户需要时提供他们所需。其中一部分意味着构建更具弹性、更强大的应用程序,这些应用程序具有更好的吞吐量、更低的错误率和自动化修复能力,因为它们是人工智能赋能的。人工智能代理还需要整合到整个软件开发生命周期 (SDLC) 中,包括 CI/CD 流水线、可观测性平台和事件响应工具。

在许多领域,组织正在将人工智能整合到 IT 运营中,包括事件修复、预测性监控和测试生成,以支持缩短平均检测时间 (MTTD) 和平均解决时间 (MTTR),并帮助确保应用程序的正常运行时间和性能。一份最新报告发现,通过最初将人工智能工具集中在 IT 运营中使用的应用程序上,组织可以展示价值,获得快速的投资回报 (ROI),并对如何在企业范围内更广泛地指导未来的人工智能工作充满信心。

代理式人工智能如何重塑 IT 运营工作流

IT 工作流和用例可能是最适合代理式人工智能的领域。这些工具旨在通过关联海量信息、信号和事件,帮助企业保持在线并实现其目标。其目标是在问题影响性能和业务之前检测并解决它们。

此外,IT 运营人员习惯于自动化。与许多可能不愿将功能交给代理的业务用户不同,IT 人员更有可能迅速对代理所做的事情产生信心。因此,人工智能在 IT 运营中的采用路径比在整个企业中更为顺畅。

通过在 IT 内部从小处着手验证代理,并将其扩展到整个 IT 运营中,人工智能代理的价值可以迅速显现。在此坚实的基础上,代理可以以更高的专业水平应用于以业务为中心的任务。

毕竟,IT 人员是开发和实施人工智能的人。通过在他们日常执行的任务中展示切实的利益来让他们参与进来,是获得支持的关键一步。如果 IT 专业人员热衷于在企业中推广代理式人工智能,并且他们的努力得到 C 级高管的全力支持,那么在业务部门之间获得认可将变得容易得多。

代理式人工智能框架的关键要素

在规划代理式人工智能方案时,建立一个框架是明智之举,该框架有助于评估人工智能代理最有可能带来改进的领域,如何评估组织不同部分的人工智能就绪程度,如何管理和协调人工智能代理的行动,以及如何实施负责任的治理监督。

该框架的关键要素可能包括:

IT 运营和网络安全

  • 自动化 IT 运营和网络安全中的最佳实践。
  • 自动修复问题并通过自动化工作流实现进一步自动化。
  • 通过合规即代码建议自动化合规性检查,降低审计风险和监管风险,并创建可供审计的工件。
  • 生成零配置仪表板、警报、故障排除和修复。
  • 在应用程序需要时为其提供精确的资源,包括在不牺牲性能的情况下优化 GPU 工作负载。
  • 识别混合云环境中的资源拥堵和成本超支。

基于数据的建议

  • 对数据进行评分和关联,以识别问题并实施可操作的建议。
  • 整合分散的数据,使其能够提供洞察并生成预防问题的行动,而不仅仅是提供警报。
  • 使用代理式人工智能提供可操作的建议、阈值和修复计划。
  • 以可视化和自然语言交互的形式展示证据,以便用户可以验证发现、探索上下文并进行修复。

软件开发

  • 扫描并检测可能导致安全或弹性问题的代码。
  • 在整个监控生命周期中实现全栈应用程序可见性自动化,包括实时变更检测、映射、跟踪和性能分析。
  • 实现自动和持续的发现、部署、配置和依赖关系映射。

传统上,这些任务需要用户在不同屏幕之间跳转,查看 CPU、内存和磁盘指标,检查日志文件以收集更多数据,并深入查找根本原因。而现在,代理可以自动化所有这些工作,并关联不同代理之间的行动来推荐操作,或者如果它们完全受信任,则可以根据预设策略采取特定行动

用户可以首先查看证据链,了解代理式人工智能为何推荐特定操作。然后,人类可以批准该操作或进行适当调整。随着IT 运营工作负载自动化的比例越来越高,用户可以审查人工智能代理为何执行其所做的事情。通过这种方式,系统可以持续简化和改进。那些对代理式人工智能持怀疑态度的人可以逐渐对其发现产生信心,并降低监督程度。这使得 IT 部门能够从事更具战略性的行动。

人工智能代理还可以根据企业或特定应用程序的需求、优先级和偏好进行塑造。在某些情况下,性能将是首要考虑,而在其他情况下,成本节约将占据主导地位。代理可以根据企业要求进行调整,创建特定任务的策略,并根据具体情况采取预设行动。下次系统遇到已知场景时,它可以自动执行其职责。根据应用程序和业务案例,人类可以完全参与其中,完全脱离循环,或者根据他们的舒适度和信任程度进行介入和退出。

归根结底,这一切都是为了在正确的时间、正确的地点提供正确类型和数量的资源。资源供应不足会拖慢团队的效率,而资源供应过剩,尤其是昂贵的 GPU 计算资源,则是严重的金钱浪费。

现实世界中的人工智能代理:成功案例

有许多人工智能代理被用于自动化 IT 和业务运营中的任务并提供切实价值的例子。以下是一些示例。

  • 一个站点可靠性工程 (SRE) 团队使用人工智能代理解锁了应用程序弹性的标准化和可重复方法。成果:与手动评估相比,每个应用程序在 IBM 全企业范围内的弹性态势评估中减少了 62% 的工作日;与手动生成报告相比,IBM SRE 团队在月度运营审查中花费的人时减少了 72%;并且通过打破部门壁垒,IT 变得更具生产力。此外,该企业建立了一个可扩展的框架,用于衡量、改进和维持整个组织的应用程序弹性。
  • 在一项基准挑战中,人工智能代理帮助加速了大规模的常见漏洞和暴露 (CVE) 管理。成果:CVE 缓解速度提高了 90%,证书库存管理速度提高了 98%。
  • 一家全球金融服务组织的试点项目中,人工智能代理将每个实例的补丁管理时间从 90 分钟缩短到最多 20 分钟,并将关键漏洞的“补丁中位时间”从 80 小时缩短到 8 小时。

如何从小处着手,负责任地扩展

利用人工智能实现企业辉煌的竞赛正在进行中。仓促投入人工智能的企业可能会犯错,从而降低对代理式人工智能的信心。明智的做法是从小处着手,最好是在 IT 运营用例中,并在 IT 内部负责任地扩展,然后再将自动化代理推广到整个业务。

IBM Concert、Instana 和 Turbonomic 旨在为代理式人工智能提供实现快速投资回报所需的框架。它们提供集成的应用程序可观测性和风险管理,通过全面的治理框架支持的人工智能驱动自动化,帮助释放您应用程序的潜力。

了解更多关于 IBM 可观测性如何简化复杂性并扩展弹性的信息。