Loki监控指标远比你我想象中的细

357 阅读1分钟

小白在Grafana Dashboard中发现居然没有现成的Loki2.0版本监控,无奈只有自己来造个轮子😂

先来看下截图吧:

面板版本基本信息:

  • Grafana v7.3.1
  • Loki2.0.0

依赖的服务

  • Cassandra (Index)
  • S3 (Chunk)
  • Redis(Cache)

如果没有以上依赖的同学可能Dashboard里面部分存在无数据

Loki部署部分可以参考我的demo,里面有loki集群的部署和依赖服务的配置

github.com/CloudXiaoba…

使用方法

小白已将Dashboard上传到Grafana Lab,访问如下链接就能找到

grafana.com/grafana/das…

总结

当在绘制这个Dashboard时,小白发现Loki的监控指标远比我想象的要多和细,因为Loki中代码很多直接是从Cortex中移植过来的,所以它的Metrics也分成了好几个部分:

  • loki_*开头的主要是Loki组件和LogQL查询相关的性能指标
  • cortex_*开头的主要是Loki组件状态,集群状态相关的指标
  • prometheus-/*开头的主要是Alert事件通知相关指标

仍然还有大量非上述开头的指标,小白还没完全在Dashboard中绘制出来

总之,以Loki为首的云原生日志架构开始日趋完善,还是值得大家体验。


微信关注公众号「云原生小白」,回复【入群】进入Loki学习群