这是我参与「第五届青训营 」伴学笔记创作活动的第 13 天
2 . 9 网络稳定一故障排查
故障明确
故障止损
分段排查
出现什么故障 ? 兮沟通是前提
。 什么业务 ? 什么接囗故障 ?
· 敝障体现旺哪里 ?
· 访问具他目标是否正常 ?
· 早否早修改导致的异常 ?
先止损冉排查
· 对公司收入照分钟至秒来计算
。 组件没有容灾 。 但是统有没有 ?
客户端排查
服务排查
中间排
· 客户菇访问具他冁务没问题吗 ?
· 其他客户赫访问目标服务沿问题吗 ?
· 骺务端监控 / 指标都正常吗 ?
· 手动谝司一下正窜吗 ?
· 分组件排查
· 骺务端跟客户惴确俣都沿问颗
· 中间网路设有沿有问题 ? ( 交换机 / 路由器 / 网关 LB )
· 旁路的 DNS 有沿有问颗 ?
· 中间适路
· iptabels
· tcpdump
安徽电信某 APP 无氵去使用 . > 检测后服务正常 , 安徽电信流量突降 . > 安徽电信客 户端 ping 不通目标 、 > 电缆被挖断
某 APP 故障一 > 后务器馈服务正一 > 网转发设备异一 > 抓包一 > 路由不对称
故练 / 预案
故障降级 / 十陨
UDP 过知丢包
提示 :
1 . 字会 UDP socket* 程
2 . 先从简单的瓿 k 学习 , 客户筛等待 ack 冉发包
3 . 什么时候客户赫认为是丢包 ?
4 . 更传怎么考慮效 ?
5 . 能不能不阻塞只穿丢控的中间的段 ?
三台同内的服务器 , 椏拟实现一个路由器
方法一 : Linux 作统配首法
提示 :
1 . 了解 Linux 的路由配首方式
2 . 确保是同网段直连可达的环境 . 在三台机 器上另外配首甲网段和路出
3 . 一台机客户赫 。 一台机器做路出器 。 一台机服务赫 。
4 . 客户赫配首到达服务器的下一跳指向路出 器 , 路由器上配置到达服务赫的路由
方法二 : 用户态 5 。 ( ket 编程实现简易 route 钦件 提示 :
· 收望身旨定的包后 , 做转发
2 · 注意修改报文的 MAC 。 不杲修改 《 六
3 . 实现一个对称路由 。 这样可以实现 TCP 交互
4 . 可以通过 ping 来验证
5 . . 可 LE#traceroute 吗 ?