令牌桶、漏斗、冷启动限流在sentinel中的应用

1,209 阅读4分钟

分布式系统为了保证系统稳定性,在服务治理的限流中会根据不同场景进行限流操作,常见的限流算法有:

  • 令牌桶:可容忍一定突发流量的速率的限流,令牌桶算法的原理是系统以恒定的速率产生令牌,然后把令牌放到令牌桶中,令牌桶有一个容量,当令牌桶满了的时候,再向其中放令牌,那么多余的令牌会被丢弃;当想要处理一个请求的时候,需要从令牌桶中取出一个令牌,如果此时令牌桶中没有令牌,那么则拒绝该请求。
  • 漏斗:固定速率限流,可以启动整流作用。

在分析sentinel限流之前,我们先看下sentinel是什么,官网说明如下:

随着微服务的流行,服务和服务之间的稳定性变得越来越重要。Sentinel 是面向分布式服务架构的流量控制组件,主要以流量为切入点,从流量控制、熔断降级、系统自适应保护等多个维度来帮助您保障微服务的稳定性。

从限流角度来看,sentinel的限流有2种控制维度,一个是qps,一个是并发数。

qps这个很好理解,也就是每秒处理请求量,当超过设定阈值时,会进行流控,策略有如下几种:拒绝、排队(一定时长)等。

并发数这个就是当前线程运行数,类似于hystrix,只不过sentinel是进行线程个数统计判断是否达到线程设定值,而hystrix是根据不同线程池来做的。

sentinel中处理流程是一个责任链,不同功能的逻辑抽象成不同的ProcessorSlot组合在一起,比如有限流的FlowSlot、打日志的LogSot、数据统计的StatisticSlot。下面重点看限流的com.alibaba.csp.sentinel.slots.block.flow.FlowSlot

public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node, int count,
                  boolean prioritized, Object... args) throws Throwable {
    // 是否触发限流检查
    checkFlow(resourceWrapper, context, node, count, prioritized);
    // 继续往下一个节点走
    fireEntry(context, resourceWrapper, node, count, prioritized, args);
}

public void checkFlow(Function<String, Collection<FlowRule>> ruleProvider, ResourceWrapper resource,
                      Context context, DefaultNode node, int count, boolean prioritized) throws BlockException {
    Collection<FlowRule> rules = ruleProvider.apply(resource.getName());
    for (FlowRule rule : rules) { // 多个限流规则检查
        if (!canPassCheck(rule, context, node, count, prioritized)) {
            throw new FlowException(rule.getLimitApp(), rule);
        }
    }
}
// canPassCheck -> passLocalCheck
private static boolean passLocalCheck(FlowRule rule, Context context, DefaultNode node, int acquireCount,
                                      boolean prioritized) {
    return rule.getRater().canPass(selectedNode, acquireCount, prioritized);
}

canPass校验目前有以下几种实现类:

image-20210130192541486

这几个实现类分别使用了如下几种限流算法:

  • DefaultController:令牌桶
  • RateLimiterController:漏斗
  • WarmUpController:冷启动的令牌桶
  • WarmUpRateLimiterController:冷启动的漏斗

sentinel中统计信息,比如qps、pass、block等信息都是在滑动时间窗口中维护的,比如时间戳是910时,统计信息会往对应800-1000的时间窗口更新,当时间戳是1001时,由于时间窗口只有5个(每个200ms),因此会复用第一个时间窗口,在使用前会先进行初始化该窗口统计值。

image-20210130192621086

对于默认的流控实现 DefaultController,其是根据时间窗口的统计值是否达到了限流值来决定是否限流的,这也是把它归为令牌桶算法的原因。漏斗算法实现RateLimiterController,会记录上一次正常通过的时间戳信息(latestPassedTime),当判断是否限流时,会根据当前时间-latestPassedTime是否大于间隔值,大于的话表示可以正常通过,小于的话表示刚刚已经有流程正常通过,此次需要排队等待,等待时间为期望时间戳-当前时间戳,并发场景下,多个线程可能都会走到等待这里,因此需要(cas操作)判断当前需等待时间是否大于某个值,大于的话直接进行限流,不再排队等待。

冷启动限流算法,即预热/冷启动方式。当系统长期处于低水位的情况下,当流量突然增加时,直接把系统拉升到高水位可能瞬间把系统压垮。通过"冷启动",让通过的流量缓慢增加,在一定时间内逐渐增加到阈值上限,给冷系统一个预热的时间,避免冷系统被压垮。

sentinel中通常冷启动的过程系统允许通过的 QPS 曲线如下图所示:

image-20210130192714303

冷启动的两种模式,令牌桶和漏斗大同小异,只不过在流量较大时,冷启动过程 令牌桶走势类似于阶梯向上直到设定的限流值,漏洞走势类似于几个斜线向上之道设定的限流值。

关于sentinel更多的知识可参考官方文档:sentinelguard.io/zh-cn/docs/…

推荐阅读