网络架构如何给抖音提质之网络提速 | 青训营

109 阅读2分钟

网络提速 网络稳定

网络稳定-容灾概念

故障发生

故障感知

自动切换

服务恢复

网络架构怎么给抖音提质 网络提速 网络稳定

2.2网络提速-怎么理解多路复用/stream ?

单个TCP链接传输 如果TCP丢包怎么办?

2.3网络提速-QUIC/HTTP3.0

TCPorUDP?

Kernel or Userspace

0RTT

弱网优势

2.4网络提速-数据中心分布

2.5网络提速-同运营商访问

2.6网络提速-静态资源(图片视频)路径优化( CDN )

2.7网络提速-动态API (播放/评论接口)路径优化(DSA)

2.9网络稳定-故障排查

故障明确

故障止损

分段排查

服务恢复

2.10网络稳定-故障明确

出现什么故障? >沟通是前提

什么业务?什么接口故障?

故障体现在哪里?

访问其他目标是否正常?

是否是修改导致的异常?

2.11网络稳定-故障止损

先止损再排查——用户体验第一;对公司收入的影响是按照分钟甚至秒来计算

如何止损——组件没有容灾,但是系统有没有? 降级

2.12网络稳定分段排查

客户端排查——客户端访问其他服务没问题吗? 其他客户端访问目标服务没问题吗?

服务端排查——服务端监控/指标都正常吗? 手动访问一下正常吗? 分组件排查

中间链路排查—— 服务端跟客户端确保都没问题 中间网络设备有没有问题? (交换机/路由器/网关LB ) 旁路的DNS有没有问题?

2.13 网络故障排查案例

1.客户端异常->服务端目测正常->网关转发异常->健康检查异常

2.个别用户报故障,生产环境大多是客户端的问题

3.安徽电信报障某APP无法使用- >检测后端服务正常,安徽电信流量突降>安徽电信客户端ping不通目标服务->电缆被挖断

4.某APP故障->后端服务器反馈服务正常- >网络转发设备异常->抓包- >路由不对称

2.14网络稳定-故障预防很重要

监控报警;故障演练/预案;故障降级/止损

总结: 网络容灾 路径提速 故障排查 高质量刷抖音 数据中心提速 QUIC提速 HTTP2.0提速