我们很高兴地宣布,RabbitMQ 集成可用于Grafana 云,我们的可组合观察性平台将指标、日志和跟踪与 Grafana 结合在一起。
RabbitMQ 是最受欢迎的开源消息代理之一,在世界各地的小型初创公司和大型企业中都有使用。它很容易部署在场地和云中,并支持多种消息传输协议。鉴于它的高采用率,并基于我们社区的使用统计和客户的问题,我们决定提供这个集成。
通过该集成,Grafana Cloud 用户现在可以使用Grafana Agent 轻松监控 RabbitMQ 集群的核心指标并发出警报,Grafana Agent 是我们为向 Grafana Cloud 发送指标、日志和跟踪数据而优化的轻量级观察性数据收集器。
RabbitMQ 社区已经有了出色的仪表盘,涵盖了集群的总体健康状况概述、内存消耗和其他一些情况。
我们在前两个仪表盘的基础上做了一些工作,并将它们与额外的过滤选项打包在一起,因此您可以深入到节点级别,也可以检查汇总所有节点指标的整体集群信息。我们还使仪表板与底层基础设施无关,因为原来的仪表板是为 Kubernetes 环境定制的。
RabbitMQ-Overview 提供了 RabbitMQ 管理概述页面上的所有信息,使您能够一目了然地了解任何集群的状态:
Erlang-Memory-Allocators分解了所有分配器和调度器的内存消耗信息:
封装了一些重要的警报
警报是可观察性策略的一个重要部分,它应该以个案的方式来定制,这样就不会引发误报。但是有一些常见的问题是可以不考虑环境而发出警报的,比如说如果一个节点宕机或者许多发送的消息无法路由。考虑到这一点,我们用这个集成打包了五个警报:
- RabbitmqMemoryHigh。一个节点正在消耗 90% 的分配内存。
- RabbitmqFileDescriptorsUsage。一个节点的文件描述符用量正在达到其最大值。
- RabbitmqUnroutableMessages。集群无法将消息传递到目的地。
- RabbitmqNodeNotDistributed。一个节点失去了与集群的通信。
- RabbitmqNodeDown:一个节点已停机。
一键搞定
与 RabbitMQ 的本地集成现在可供 Grafana 云用户使用。
它旨在与 RabbitMQ 3.8 以上的版本一起使用,它提供了一个官方插件,可以轻松启用,不需要专门的基础设施,也不需要特定的单独二进制文件来运行。
如果您还没有使用Grafana Cloud,我们有免费和付费计划以满足各种使用情况 -现在就免费注册。这是开始观察指标、日志、跟踪和仪表盘的最简单方法。
有关 Grafana Cloud 和 RabbitMQ 的监控和警报的更多信息,请加入 Grafana 社区 Slack 的 #integrations 频道。

