Grafana 8标志着我们对预警方式进行了重大的重新设计。我们创建了一个统一的警报体验,实现了一个跨我们所有产品的工作流程,并将Grafana面板警报和Prometheus风格的警报合并到一个玻璃窗中。我们首先将其作为一项开源功能,以确保你可以选择加入,并从第一天开始尝试,无论Grafana的哪种风格(OSS、云或企业)最适合你。
在过去的一年里,我们得到了很多关于新警报系统的社区反馈。其中一些意见是好的;许多意见是关于我们如何做得更好的建议。我们听到了你们的意见。我们已经做了很多工作来打磨这个体验,我们将继续定期进行生活质量的提升。
随着Grafana9在2022年GrafanaCONline期间的发布,Grafana警报现在是默认的警报系统,随着这一变化,我们将根据你的反馈引入重大改进,以及更强大的文档和视频内容来帮助你使用它。
一如既往,我们感谢我们的社区,感谢你们的坦诚和你们的贡献,我们很高兴展示团队所做的一些改变,以简化警报创建,提供所有警报的综合视图,并让你们能够结合来自多个数据源的数据来创建警报规则。
如果想了解更多关于Grafana警报系统的信息,并观看一些最新升级的演示,请务必报名参加6月16日(星期四)15:00 UTC的GrafanaCONline 2022会议 "Grafana 9中的警报:有哪些新的改进"。
Grafana警报的新功能是什么?
多维度的警报
用户对警报规则的期望是非常简单的:
- 你有一个单一的查询。
- 你想让这个查询触发多个警报。
- 你希望能单独控制这些警报。
在Grafana 9之前,警报需要与面板或仪表盘绑定。现在你可以单独控制一个规则所产生的警报。
警报规则可以为每个警报规则创建多个单独的警报实例,也就是多维警报。这个功能让你有能力和灵活性,只需一个多维警报就能获得整个系统的可见性。
一个规则定义了何时发出警报,但你可以对许多项目发出警报。一个现实世界的例子。想象一下,你有一个智能家居,想知道窗户什么时候打开。有了Grafana警报,你可以有一个警报,"告诉我窗户是否打开了",对于每个窗户,你都会收到 "窗户x打开了!"你不需要创建一个以上的规则。

以上。一个警报可以创建许多警报实例,用标签来区分它们。
分组和路由警报
Grafana Alerting允许你根据你定义的标签,将每个警报实例路由到一个特定的联络点。
但新的控制权带来了新的责任。当你遇到警报风暴时,你可能会被同时发射的数百个警报所轰炸。你很可能不希望在另一端出现100个通知。
通知策略是这个问题的答案。它们是一套规则,规定了在哪里、什么时候以及如何将警报传送到联络点。(这些以前被称为通知通道。)将通知策略与分组功能相结合,可以确保与系统的一个组件相关的所有警报被捆绑在一起,这样Grafana就会发送一个紧凑的通知,其中有这个警报规则的所有受影响的环境。
通知策略遵循一个树形结构,其中每个策略可以有一个或多个子策略。除了根策略之外,每个策略都可以匹配特定的警报标签。每个警报由根策略评估,随后由每个子策略评估,以便你将你的警报与多个接触点相匹配。因此,一个警报可以根据某些标签标准通知多个渠道。这多酷啊?

以上。如何使用标签创建一个通知策略来分组警报。
消除警报
俗话说的好。沉默是金 - 这尤其适用于警报。沉默允许你停止来自一个或多个警报规则的通知。有了这个新功能,你甚至可以根据某些标准部分暂停一个警报。
然而,静默只是阻止通知的创建。它们不会阻止警报规则被评估,也不会阻止警报实例在用户界面上显示。这是故意的;你可以看到评估的当前状态,但在呼叫器方面没有收到通知,所以你仍然得到完全的透明度,并保持对警报系统内发生的事情的可见性。
静音计时
静音时间是社区非常关注的问题,我们也清楚地听到了反馈意见。在Grafana 9中,Grafana Alerting现在允许你指定一个时间间隔,当你不希望生成或发送新的通知时。
例如,你现在可以为你的几条或所有路线设置静音时间,这样你就不会在周末或家庭活动期间收到传呼:

Grafana预警的下一步是什么
Grafana警报系统中新的和改进的功能现在对Grafana 9的所有用户都是默认启用的。虽然Grafana用户目前可以选择回滚到以前基于仪表盘面板的警报体验(现在被称为 "传统警报"),但我们将在Grafana 10中正式删除该功能。
下面是我们即将推出的一些Grafana警报更新的一瞥:
- 改进用户创建和管理警报的体验
- 增加基于角色的访问控制
- 基于Grafana 9.0中的新配置API,更新我们的Terraform提供商
- 改进迁移路径,以确保我们最大限度地减少数据丢失的几率
- 改进模板