监控平台结构的设计

226 阅读1分钟

告警平台.jpg

  1. Gether:采集器,满足被动收集和主动上报两种模式。
  2. GetherM:采集器管理器,管理采集器的安装和卸载与后台保持链接关系。
  3. Transfer:负责采集器的数据收集,主动收集的频率需要从后台获取。负责数据转化,数据格式统一化,和数据分发,分发至LogParse和Agent。
  4. LogParse:负责数据的记录,和统计。大屏数据的聚合等。
  5. Agent:实际校验告警规则的组件,指标数据是否超越阈值的检验组件。
  6. TargetParse:告警组件,根据告警的严重性和告警规则分发告警。

第三方告警的接入:

  1. 开发一个独立组件,仿照Transfer,分发至Agent和LogParse,第三方数据是不可控的,Transfer功能重要,扩展Transfer的话风险较大。

  1. 一条完整的指标数据应该携带,机器信息,指标名称,指标值,时间。
  2. 一条告警配置应该携带,机器信息,指标名称,指标值,阈值,告警规则,告警通知信息。