-
前言:为什么限流是系统高可用的第一道防线?
- 没有限流的系统,在高峰时只有两个结果:
挂 或 拖死整个机群 - 任何大型系统必须有“场景化限流能力”
- 没有限流的系统,在高峰时只有两个结果:
-
限流的四个层次
- 固定 QPS 限流(beginner)
- 动态 QPS 限流(adaptive)
- 热点 Key 限流(hotspot aware)
- 智能限流(AI/规则动态决策)
-
核心技术策略
- 令牌桶、漏桶
- 滑动窗口限流
- 并发度限流(线程池)
- 行为限流(按用户、租户、IP、设备)
-
限流维度
- 按用户限流
- 按租户限流
- 按业务维度限流(如上传、下单、导出)
- 按资源限流(DB、Redis、MQ)
-
企业级限流平台能力
- 配置平台化(实时调整限流阈值)
- 限流监控 + 热点 Key Dashboards
- 限流告警
- 热点自动检测(基于采样统计)
- 降级能力联动(限流 → 降级 → fallback)
-
复杂场景:导出/报表/批处理限流体系
- 如何防止大客户拖垮整个系统
- 多维度限流 + 排队队列(queue)
- 租户级限流 + 权重控制
-
总结
- 限流不是“忙的时候才用”
- 限流是高可用系统架构里必须全年运行的保护机制