AI Agent将如何改变工程师的DevOps工作流程

130 阅读6分钟

AI Agent革新DevOps!告别重复劳动,LLM赋能代码生成,AI Agent实现自主分析决策,提升MTTR。通过自动化事件管理、优化CI/CD,减少计划外工作,解决服务所有权挑战。AI Agent助力智能调度、连接多源数据,堪比SRE专家,解放工程师,专注创新,速来体验!

译自:How AI Agents Will Transform DevOps Workflows for Engineers

作者:João Freitas

对于工程师而言,并非所有 AI 都是一样的。

大型语言模型 (LLM) 的激增为工程师们开辟了提高生产力的新机会。LLM 已被证明能够胜任生成样板代码、单元测试和代码文档的体面工作。然而,仅靠 LLM 缺乏推理能力和上下文理解能力来解决更复杂的 DevOps 任务,并且对开发工作流程产生更大的影响。

但是,AI 已经超越了传统的聊天机器人和内容生成。AI Agent 代表着下一步,朝着动态、智能的助手发展,这些助手不仅仅用于生成代码。相反,AI Agent 为组织提供了显著提高工程师在 DevOps 任务中的生产力和效率的潜力。除了提高成本效率和潜在地减少错误之外,在运营管理中部署 AI Agent 将为工程师节省时间,使他们能够专注于推动创新,而不是反复应对相同的难题。

AI Agent 与生成式 AI 有何不同?

组织在采用 AI Agent 时有五个关键考虑因素:用例、人工输入、自主性、决策能力和适应性。

工程师们今天使用的生成式 AI 工具可以创建文本摘要和代码等内容。这些工具需要直接的人工输入才能生成结果,完全依赖于提示,并且无法做出独立的决策。一旦这些模型生成了输出,它们就需要来自人类的进一步提示来完善其输出。

另一方面,AI Agent 可以独立地分析、计划和执行任务。它们减少了获得结果所需的人工交互,具有更高的自主性,并且能够根据短期和长期记忆以及预定目标采取行动。

AI Agent 能够适应从不同工具中提取的信息并提供相关结果,即使情况发生变化也是如此。

独立运行并从个体场景中学习的能力使 AI Agent 成为工程师 DevOps 运营的完美进化,加速了生产力,并使他们能够专注于高优先级的创新和具有商业价值的任务。

减少计划外工作并提高生产力

在 IT 和 DevOps 运营的背景下,时间就是金钱。对于组织而言,每小时停机的成本可能超过 300,000 美元,因此任何可以加速事件修复并减少维护时间的工具都非常有价值。AI 提供了一个机会,可以通过智能地自动化事件管理工作,以及帮助组织变得更具预防性,从而显著改善平均修复时间 (MTTR) 等指标。通过实施 AI Agent,组织可以减少事件响应者承担的工作,最大限度地减少警报疲劳,而是自主地解决已知和重复出现的问题。此外,随着我们进入这个新的体验时代,AI Agent 可以根据过去问题的经验提供建议并采取行动。

AI Agent 还可以帮助解决与服务所有权相关的挑战。虽然这种方法可以明确代码的指定所有者,但它也迫使工程师随时待命,以拥有其代码的整个生命周期,这意味着每次出现问题时,都会要求他们修复它。这可能就像关闭内存泄漏、修复逻辑错误或修复配置错误的 API 请求一样简单。诸如此类的重复性任务非常适合 AI Agent,它可以从历史操作中学习以自动化常见的解决方案,例如回滚到稳定版本。

此外,AI Agent 还可以帮助工程师完成 CI/CD 管道,审查代码,充当顾问,并使他们能够做出更明智的、数据驱动的决策,更快地解决关键问题并专注于业务优先级。由于计划外工作、运营成本、时间紧迫的情况减少,投资回报率提高以及对创新的关注,这些生产力和效率的提高使团队负责人和经理们受益。

AI Agent 的运营管理用例

AI 代理的应用仍处于早期阶段,但先行者和早期采用者已经开始在他们的 DevOps 运营流水线 中使用它们。

AI 代理可以用来支持组织进行规划,例如,调度代理可以根据每个团队成员的可用性实时调整随叫随到的轮班,从而抢先解决调度和可用性冲突。因此,响应者可以在发生重大事件时保持可用并随叫随到,而不会在工作时间外被打断。这种更强大的调度将减少倦怠,并确保有效地管理工程师的工作量。

AI 代理还可以用于连接组织整个技术栈中多个来源的不同数据。例如,它们可以连接在 Runbook、文档和 内部开发者平台 中找到的信息,这些信息通常是在计划外和计划内的工作中需要的。通过自主识别这些数据中的模式,AI 代理可以为战略运营决策提供解决方案,并不断提高运营和业务效率。

AI 代理还可以像站点可靠性工程师这样的专家一样运作。这些类型的 AI 代理可以通过呈现有关您的基础设施或网络状态的重要上下文来支持人工响应者,并找到与过去问题相关的常见修复解决方案,以及通过建议指导响应者加速诊断和修复,从而帮助进一步降低中断造成的业务风险。

AI 代理是工程师的终极工具

工程师对于组织提供卓越客户体验的能力至关重要。他们构建吸引客户并最终创造收入的产品和能力。然而,他们仍然经常背负着重复相同操作的负担,每次他们负责的应用程序出现故障时,都会浪费时间并导致知识孤岛,迫使相同的工程师解决相同的事件。

鉴于 这些过程是多么浪费,AI 代理提供了一种组织可以运作的全新方式。AI 代理承诺消除工程师角色的繁琐工作,并使他们能够回到为组织带来客户和收入的创造性工作中。