网络是计算机系统和应用程序中相互通信的骨干。当网络瘫痪或经历任何服务中断时,影响是广泛的,并可能导致重大服务中断和收入损失。
这就是为什么网络监控对企业来说是至关重要的。对网络性能的可见性是确保网络工程团队能够更加积极主动,并在这些问题导致中断之前发现问题的关键。
然而,中断的情况越来越多,也越来越普遍。今天的网络大得惊人,而且非常复杂,完全避免中断几乎是不可能的。互联网规模大约比云计算规模领先20年。就在2000年到2021年之间,我们看到互联网使用量的增长率接近1332%。因此,即使是一个相对较小的网络也能与你的云规模相当。
这就是为什么拥有一个坚实的网络监控解决方案对于确保网络工程师在故障发生时能够快速诊断、识别和解决问题至关重要。你需要一流的可观察性工具,而这正是Grafana可以帮助的地方。
开始使用SNMP
利用监控解决方案来捕获指标,并在CPU负载、内存利用率、端口耗尽、带宽利用率、电源健康、温度传感器等重要指标的阈值被跨越时配置警报策略,是建立健全网络监控计划的关键。
监控网络最常用的方法之一是通过使用简单网络管理协议或SNMP。SNMP于1988年首次推出,比它的名字要复杂得多。深入研究SNMP的内部工作原理不在本篇文章的范围之内,但就其核心而言,它是一个由网络管理工具用来查询无数数据变量的协议,这些数据变量集合在基于IP的设备的管理信息库(MIB)中。
在Grafana实验室,我们希望帮助促进对那些重要的网络设备的监控,并提供一些简单的方法来开始。我们的SNMP混合器是监控网络设备的一个很好的基线。mixin 是一个可配置、可重用、可扩展的包,它将Grafana仪表盘和Prometheus规则和警报捆绑在一起。
如果你使用Prometheus,你可以利用snmp_exporter,上面提到的SNMP mixin是它的一部分。这是另一种方法,可用于有效监控网络设备,并在Grafana仪表盘中可视化收集的数据。这提供了更多的灵活性,允许你导入MIB,这样你就可以随心所欲地监控任何网络设备上的任何指标。
用Grafana实现网络性能的可视化
为了给你留下可能的艺术,下面是Grafana仪表盘,显示SNMP Prometheus网络指标和被发送到Grafana Loki的Syslogs,并统一在一个视图中,以及SNMP指标和Syslog数据的并列关联视图。

上图:Unifi家庭网络仪表板。

上图:流量和数据包仪表板。

上图:每个接口的比特仪表板。

上图:肩并肩的指标与日志的关联性。
总结
我们希望这个介绍能帮助你开始监控你自己的家庭或企业网络。来吧,测试一下,让我们知道你的想法。
我们在这个SNMP系列的下一篇文章将更详细地介绍snmp_exporter,展示如何利用它来满足你的网络监控需求。我们还将指导你进行安装,并确保你得到你想在仪表盘上可视化的确切的网络指标。