AWS最近推出了Incident Manager,这是AWS Systems Manager的一项新功能,帮助客户准备和应对应用程序和基础设施事件。
事件管理器使用运行手册行动、事件更新和基于聊天的协作来管理自动响应计划和响应,同时自动通知指定的联系人。Julien Simon,AWS的全球技术布道者,解释了新服务的主要使用情况。
随着传呼机的疯狂运转,值班工程师争相恢复服务,分秒必争(......)你不能浪费任何时间来定位和访问适当的运行手册和程序(......)严重问题往往需要升级。虽然从团队成员那里得到帮助是件好事,但合作和快速解决需要有效的沟通。没有它,不协调的努力会导致混淆或恶化情况的意外发生。最后但并非最不重要的是,记录事件和你如何应对它同样重要。
当一个新的事件被触发时,系统管理器控制台中会自动创建一个仪表板,作为所有参与管理升级的组件的参考点。仪表板包括事件概览、CloudWatch指标和警报、事件管理器添加的所有事件的时间线以及响应者手动添加的任何自定义事件。该服务可以通过Slack通知响应者,并支持使用自动运行簿。
在一系列的两篇 文章中,AWS高级云基础设施架构师Harshitha) Putta和AWS云架构师Guyu Ye展示了客户如何使用Incident Manager来减轻故障,创建升级计划和 与Amazon CloudWatch整合 。他们解释说,新版本是来自亚马逊的一个内部项目。
客户经常问我们如何在内部管理事件。为了简化事件响应管理,我们刚刚发布了一个新的AWS系统管理器功能--事件管理器,其中包含了我们在亚马逊内部事件管理中遵循的最佳实践。
来源:aws.amazon.com/blogs/aws/r…
一些用户对AWS Systems Manager Incident Manager的正式名称提出质疑。Adobe的软件开发工程师Gabriel Mangiurea:
我很确定有一个AWS系统管理器未来产品管理器命名管理器轮财管理器,以可管理的方式管理未来产品的命名,所有的Cloudwatch日志和东西。
其他人,如在Reddit线程上,对缺乏一个随叫随到的系统感到惊讶。
我似乎不能确定它是否有待命功能?我可以看到有升级计划,但不知道你是否可以轮换联系人。
新服务定价是按响应计划和短信及语音信息的数量计算的,每个响应计划每月7美元起,包括100条短信或语音信息。