AI驱动运营的7大“不可妥协”原则

18 阅读6分钟

人工智能和自动化对现代事件管理至关重要。需遵循7大原则:端到端管理、内置自动化、运营级AI、可操作的事件后评审、互联生态、易用性和可靠性,以实现弹性运营。

译自:The 7 Non-Negotiables of AI-Driven Operations

作者:Cristina Dias

提供无缝、始终在线的数字体验的压力从未如此之大,但数字运营团队和预算往往无法跟上这一现实。随着数字运营日益复杂,事件需要在几分钟而非几小时内解决,组织为什么需要人工智能和自动化来支持当今的实际运营,这一点比以往任何时候都更加清晰。

这些技术现已成为现代人工智能驱动运营和事件响应的支柱,它们缩短了平均恢复时间(MTTR),减少了停机时间,并增强了弹性。IDC预测,到2025年底,67%的企业人工智能投资将来自将人工智能嵌入核心运营。然而,仅靠支出是不够的。公司必须确保人工智能和自动化提供可衡量的投资回报和运营价值,以确保部署是为了产生影响,而非表面文章。

人工智能和自动化记分卡的7个不可妥协原则

为了评估人工智能和自动化投资的真正价值,组织必须努力实现人工智能驱动运营的这七个不可妥协原则:

1. 真正的端到端事件管理

当事件发生时,团队不能在不连贯的工具之间跳转或丢失上下文。孤立的系统会导致延迟、混乱和额外成本。在各个业务职能部门使用不同的工单系统、ChatOps工具、流程和实践会使事件管理变得混乱。

组织需要一个统一的人工智能和自动化层,该层支持从检测到持续学习和预防的完整事件生命周期。这一层消除了零散集成的需求,因为在零散集成中,人工智能或自动化仅处理链条的一部分,或者需要大量集成才能有效工作。

2. 内置自动化

自动化应该是嵌入式的,而非附加的。那些需要持续人工干预或仅处理单一步骤的实施方案,只会增加复杂性而非效率。自动化应与现有工作流程和谐运作,而不是与之对抗。

原生自动化能够跨团队、工具和时区进行协调,民主化自动化,让所有人都能安全访问工作流程。正确的控制措施也很重要,以确保投资可以在整个企业中安全扩展。例如,航空公司Ryanair在其事件管理生命周期中,自动化了超过25,000项日常任务,通过针对已知事件的嵌入式自动修复,每年节省了超过1,000个人工小时。

3. 运营级人工智能

为了实现有效的事件管理,人工智能必须理解IT运营,而不仅仅是分析数据。该技术应该能够检测模式、做出实时决策并精准触发警报。它应充当IT基础设施的数字孪生,减轻人工响应人员的压力,使他们能够专注于更高价值的任务。

要达到这一步,人工智能必须基于真实的运营数据进行训练,并设有保障措施以确保可靠性和集成。缺乏上下文的华而不实的人工智能在压力下会失效;运营级人工智能每次都能提供可用的洞察。

4. 可操作的事件后评审

事件应该推动学习,而不仅仅是修复。如果事件后评审无法提供可操作的洞察,那么企业注定会重复同样的错误。手动报告流程和不连贯的文档会减慢进度,应予以避免。评审必须与行动和结果挂钩。

组织需要由人工智能驱动的评审,其中包括生成式人工智能驱动的叙事能力。这些由人工智能驱动的评审将事件转化为可操作的讨论和下一次的有意义的经验教训。例如,Zendesk自动化了事件后评审,将分析时间缩短了80%,并提高了事件后分析的参与度和出勤率。

5. 互联的生态系统

最好的事件管理平台不要求IT团队改变工作方式,而是在他们当前的工作方式中提供支持。组织需要人工智能和自动化来提高敏捷性并减少摩擦。毕竟,如果工具强制你适应它们,那么它们就无助于你的数字运营团队;它们只会阻碍团队。团队需要人工智能和自动化计划,这些计划能够与已在使用的应用程序无缝集成,无论是用于可观测性、工单处理还是协作。

6. 易用性

如果人工智能或自动化难以使用,那么它就不会为事件管理工作流程增添价值。事件响应要求从第一天起就产生价值,而不是几个月或几年后。易用性意味着人工智能和自动化不应伴随繁重的实施、僵化的设置和为了跟上节奏而进行的持续返工。以Specsavers为例:在不到一年的时间里,它将自动化扩展到2,000家商店的超过120,000次执行,节省了225天的人工工作,并将服务分析师的入职时间缩短了75%。

7. 经验证的可靠性

当发生SEV 1或SEV 2事件时,响应团队需要不会加剧混乱的人工智能和自动化。可靠性是不可妥协的。IT运营要求人工智能和自动化具有高可用性和零计划外停机。没有什么比在关键业务时间发生意外中断、维护停机或间歇性运行更能迅速破坏事件响应了。企业必须拥有在压力下表现良好的经验证的记录的人工智能和自动化。

大规模构建弹性

要大规模构建弹性运营,企业必须根据这七个原则对人工智能和自动化工具进行压力测试。那些需要数月才能体现价值、缺乏可靠性保证或总拥有成本高的部署预示着脆弱性,应予以避免。对于任何具有单一故障点(例如聊天应用依赖)且没有冗余,或者需要多个附加组件才能运行的实施方案,也同样适用。通过选择在压力下表现良好的技术,组织可以标准化人工智能和自动化,做出更快更明智的决策,并将事件管理转化为竞争优势。