在网络运维和软考网络工程师认证考试中,网络故障排查是核心能力之一。无论是企业内网还是互联网服务,网络问题可能导致业务中断、性能下降甚至安全风险。本文将从实际场景出发,解析网络故障排查的关键技术和方法,涵盖丢包分析、路由环路、DNS解析异常、ARP欺骗等典型问题,帮助网络工程师系统掌握排查思路。
网络故障排查通用方法论
1. 分层排查法(OSI模型)
网络问题通常需要从底层到高层逐层排查:
物理层:检查网线、光模块、交换机端口状态(如link down)。
数据链路层:检查MAC地址表、VLAN配置、STP(生成树协议)是否正常。
网络层:检查IP路由、ARP表、ICMP连通性(ping/traceroute)。
传输层及以上:检查TCP/UDP端口状态、防火墙策略、应用层协议(HTTP/DNS)。
2. 关键排查工具
ping:测试基础连通性,排查丢包和延迟。
traceroute(Windows:tracert) :定位网络路径和路由问题。
arp -a:检查ARP缓存,排查IP-MAC映射问题。
netstat/ss:查看端口监听和连接状态。
Wireshark/tcpdump:抓包分析协议交互过程。