如何用Grafana云观察你的Asterisk实例

275 阅读2分钟

可观察性和监控是联络中心环境的一个基本部分。当有成千上万的实时语音和其他多渠道互动发生时,密切关注系统是至关重要的,因为任何服务问题都会给客户体验带来即时打击。

Asterisk是一个用于构建通信应用的免费开源框架,由Sangoma赞助。它是最流行的开源IP PBX软件,用于世界各地的通信和联络中心设置。

在这里,我们将指导你如何为Grafana Cloud设置Asterisk集成,以及如何使Asterisk中的指标和日志的监控以及警报变得更加容易。

如何用Grafana Cloud配置Asterisk

Asterisk集成是基于res_prometheus模块的。这个嵌入式的Prometheus导出器是在v17版本中添加到Asterisk的。你可以通过以下简单步骤开始用Grafana Cloud监控你的Asterisk部署。

开始监控你的Asterisk实例

集成安装后,你会看到Asterisk的两个预建仪表盘和一组Asterisk相关的警报自动安装到你的Grafana Cloud账户。

Asterisk概览仪表板

这个仪表盘根据Asterisk中嵌入的Prometheus导出器所暴露的所有指标,给出了Asterisk实例的总体概览:

该仪表盘还包含了更多的部分,包括以下关键指标:

  • 渠道信息
  • 端点信息
  • 桥接信息
  • Asterisk系统信息

Asterisk日志仪表板

该仪表盘提供Asterisk日志文件的指标和细节。目前这个仪表盘只跟踪Asterisk的主要日志文件/var/log/asterisk/full:

Asterisk警报

该集成还附带了一些方便的警报:

这个警报监控asterisk_core_uptime_seconds ,如果系统在过去60秒内被重新启动,就会发出警报。这可以是计划中的重启,也可以是由于某些异常或故障而重启。

该警报监控asterisk_core_last_reload_seconds 度量,如果系统在过去60秒内被重新加载,则发出警报。这个警报对系统管理员很重要,可以提醒他们在系统中进行的任何配置修改。

  • AsteriskHighScrapeTime > 100ms (可由用户设置)

Asterisk Prometheus导出器暴露了一个指标,叫做asterisk_core_scrape_time_ms ,这是导出器收集Asterisk数据的时间,以毫秒计。刮削时间过长会导致系统的性能下降。这个值通常应该很低,所以如果搜刮时间超过100ms,这个警报就会被触发。

  • AsteriskHighActiveCallsCount > 100 (可以由用户设置)

Asterisk部署的容量会因环境不同而不同;但是,这个警报可以被配置为标记系统上异常高的活跃呼叫数。