使用netperf测试网络时延

2,536 阅读2分钟

「这是我参与2022首次更文挑战的第1天,活动详情查看:2022首次更文挑战」。

背景

今天有同事反馈客户的环境在 TCP 建链时偶现超时导致握手失败,希望我能帮助测试定位。那我们可以使用 netperf 工具进行时延测试,如果能够触发问题,我们就可以抓包进行分析了。

分析

前面我们已经介绍过使用 netperf 进行网络性能测试,那 netperf 其实也能够进行网络时延的测试,今天我们就结合实际问题进行 TCP 协议下的网络时延测试。

通常这种情况一般发生在数据包转发点,根据网络拓扑即可知道数据包在哪些地方进行了转发。在这些地方我们都需要进行抓包。比如客户端到外部路由器,路由器到交换机,交换机到服务器,服务器到虚机。

netperf 测试

关于 netperf 的安装我们就不再赘述,有需要的同学点这里:xxx。

首先我们在客户端和服务段都安装好 netperf,然后再服务端启动 netserver,最后在客户端发起测试即可。

启动 netserver

命令:netserver

netserver

12865 端口监听成功,说明 netserver 启动成功。

客户端发起测试

命令:

netperf -H $(对端IP) -t omni -- -d rr -O "THROUGHPUT, THROUGHPUT_UNITS, MIN_LATENCY, MAX_LATENCY, MEAN_LATENCY"

客户端测试结果

测试结果分析

从测试结果我们可以知道,最大的时延为 697us,并没有复现开始提到的问题,但是我们可以使用-t参数增加测试时间观察能否复现,同时结合抓包工具进行深度分析。

多说一句

网络问题相比其他问题而言,存在定位难度大,不确定性高,运维监控难等问题,但是我们可以结合业务场景,利用相关测试工具,再根据自己的经验来一步一步分析,是问题总能搞清楚的。