服务限流体系设计 —— 如何从简单限流进化到动态、智能、场景化限流能力

32 阅读1分钟
  1. 前言:为什么限流是系统高可用的第一道防线?

    • 没有限流的系统,在高峰时只有两个结果:
      拖死整个机群
    • 任何大型系统必须有“场景化限流能力”
  2. 限流的四个层次

    1. 固定 QPS 限流(beginner)
    2. 动态 QPS 限流(adaptive)
    3. 热点 Key 限流(hotspot aware)
    4. 智能限流(AI/规则动态决策)
  3. 核心技术策略

    • 令牌桶、漏桶
    • 滑动窗口限流
    • 并发度限流(线程池)
    • 行为限流(按用户、租户、IP、设备)
  4. 限流维度

    • 按用户限流
    • 按租户限流
    • 按业务维度限流(如上传、下单、导出)
    • 按资源限流(DB、Redis、MQ)
  5. 企业级限流平台能力

    • 配置平台化(实时调整限流阈值)
    • 限流监控 + 热点 Key Dashboards
    • 限流告警
    • 热点自动检测(基于采样统计)
    • 降级能力联动(限流 → 降级 → fallback)
  6. 复杂场景:导出/报表/批处理限流体系

    • 如何防止大客户拖垮整个系统
    • 多维度限流 + 排队队列(queue)
    • 租户级限流 + 权重控制
  7. 总结

    • 限流不是“忙的时候才用”
    • 限流是高可用系统架构里必须全年运行的保护机制