可观察性的常见用例

90 阅读4分钟

可观察性的常见用例

这些可观察性的用例使企业能够更深入地挖掘其系统监控和分析,以提前发现潜在的问题并提醒IT人员。

围绕技术平台的可观察性背后的想法是通过其输出了解复杂环境的状态。可观察性的深度导致了该平台上的任何问题能够被快速有效地识别和修复。

这似乎是对IT管理员一直以来所做工作的重述和重新命名--试图通过使用系统管理软件和其他工具来掌握正在发生的事情。

然而,可观察性并不是简单地重新利用现有的软件来从客户那里获得更多的钱。这是一个真正的需求,由大多数组织正在努力解决的变化所驱动--从完全拥有和控制的平台转移到拥有和共享、物理和虚拟化的基于云的平台的复杂混合环境中。涵盖这种环境的工具少之又少,但可观察性提供了一个处理许多这些领域的起点。

用例 1.底层的可观察性架构

可观察性将来自各种来源的数据汇集在一起,以便对其进行分析,并识别出问题所在或未来可能发生的地方。需要有强大的监测能力,同时还要了解被监测系统的每一部分的基础指标。必须了解平台不同部分之间的依赖关系,必须定义什么是正常和不正常。这可以通过开箱即用的设置、用户定义的设置和可观察性系统运行时的经验学习限制的混合来完成。

可观察性将来自各种来源的数据汇集在一起,以便对其进行分析,并识别出问题所在或未来可能发生的地方。

此外,可观察性应该能够识别来自零日威胁的异常活动或由不良或错误编码引起的直接问题。

用例2.数据监控、汇总和报告

公共云所有者可能不允许组织运行深入的管理软件,但他们的平台不断地创造数据,如遥测和日志数据,特别是与你自己的工作负载有关的数据。通过将这些数据与你的数据流汇总,对其进行分析并获得近乎实时的报告,企业可以在早期阶段发现问题。如果问题出现在你的平台上,你可以立即处理;如果问题出现在第三方拥有的平台上,你就可以及早了解问题,并与供应商分享数据,以便他们能够解决问题。

基于事件的自动化使IT团队,特别是网站可靠性工程团队,能够触发故障单,并将其转给正确的应用服务或人员。这使员工能够继续开展业务,为组织创造战略性的IT价值。

例如,员工可以专注于数字转型等领域,并更加相信通过深入观察的自动化补救措施将使复杂的工作流程更有可能发挥作用,并在事情发生时更快地得到修复。

用例3.平台安全和DevOps

可观察性派上用场的另一个领域是积极主动地管理安全。来自整个平台的数据输出可以监测异常活动并触发事件,以减轻或阻止安全问题的任何影响。

同样,DevOps环境可以监控异常活动,如果该行为会在工作平台上造成问题,则可以阻止工作负载的供应。即使工作负载在主平台上并开始行为失常,也可以利用可观察性来启动节制或使工作负载下线的行动,必要时用已知的工作版本取代它。

即使在 DevOps 的上游方面,开发人员也会发现可观察性很有用。处理不同的微服务和虚拟容器的输出的能力,确保这种环境在推到DevOps生产线上时为生产环境做好准备。

用例4.更长期的趋势

可观察性的一个有用的方面是跟踪应用程序或平台随时间推移的性能。变化可以被发现,目标之外的趋势也可以被发现,从而触发补救措施或请求人工干预。

例如,遭受内存泄漏的应用程序或服务,即使泄漏速度很慢,也会造成问题。由更多人使用的应用程序可以被识别,并调整资源以更好地满足他们的需求。

目前,可观察性还不能作为一种单一的现成产品来使用。但是,通过确保监控、数据汇总和分析能力到位,以支持可观察性方法,然后将事件触发器整合到服务台系统、自动化系统管理和基于云的资源管理和工作负载供应引擎,应该为企业提供他们未来所需的大部分内容。