网络提速 网络稳定
网络稳定-容灾概念
故障发生
故障感知
自动切换
服务恢复
网络架构怎么给抖音提质 网络提速 网络稳定
2.2网络提速-怎么理解多路复用/stream ?
单个TCP链接传输 如果TCP丢包怎么办?
2.3网络提速-QUIC/HTTP3.0
TCPorUDP?
Kernel or Userspace
0RTT
弱网优势
2.4网络提速-数据中心分布
2.5网络提速-同运营商访问
2.6网络提速-静态资源(图片视频)路径优化( CDN )
2.7网络提速-动态API (播放/评论接口)路径优化(DSA)
2.9网络稳定-故障排查
故障明确
故障止损
分段排查
服务恢复
2.10网络稳定-故障明确
出现什么故障? >沟通是前提
什么业务?什么接口故障?
故障体现在哪里?
访问其他目标是否正常?
是否是修改导致的异常?
2.11网络稳定-故障止损
先止损再排查——用户体验第一;对公司收入的影响是按照分钟甚至秒来计算
如何止损——组件没有容灾,但是系统有没有? 降级
2.12网络稳定分段排查
客户端排查——客户端访问其他服务没问题吗? 其他客户端访问目标服务没问题吗?
服务端排查——服务端监控/指标都正常吗? 手动访问一下正常吗? 分组件排查
中间链路排查—— 服务端跟客户端确保都没问题 中间网络设备有没有问题? (交换机/路由器/网关LB ) 旁路的DNS有没有问题?
2.13 网络故障排查案例
1.客户端异常->服务端目测正常->网关转发异常->健康检查异常
2.个别用户报故障,生产环境大多是客户端的问题
3.安徽电信报障某APP无法使用- >检测后端服务正常,安徽电信流量突降>安徽电信客户端ping不通目标服务->电缆被挖断
4.某APP故障->后端服务器反馈服务正常- >网络转发设备异常->抓包- >路由不对称
2.14网络稳定-故障预防很重要
监控报警;故障演练/预案;故障降级/止损
总结: 网络容灾 路径提速 故障排查 高质量刷抖音 数据中心提速 QUIC提速 HTTP2.0提速