全栈杂谈第七期 接口常见的限流方式

206 阅读9分钟

随着互联网技术的快速发展,应用系统的访问量不断攀升,接口的稳定性成为保障用户体验的关键因素。为了防止接口被恶意请求或高并发流量击垮,限流成为一个重要的技术手段。限流通过对接口请求量的控制,确保服务的高可用性,并有效利用系统资源。本文将介绍常见的限流算法及其应用场景。

限流的意义

首先我们要明白,我们为什么要做限流这一举动。因为接口限流是一种通过限制接口请求速率来保护服务的手段,其主要作用包括但不限于:

  1. 防止服务过载:通过限制单位时间内的请求数量,避免系统因流量暴增而瘫痪。
  2. 保障公平性:防止单一用户或IP占用过多资源,确保其他用户的正常访问。
  3. 抵御恶意攻击:防止DDoS攻击等恶意流量对系统造成冲击。
  4. 提升用户体验:在系统接近容量极限时,避免整体失效,优雅降级。

常见限流算法

固定窗口算法(Fixed Window Algorithm)

固定窗口算法是最简单的限流算法,它将时间分成固定长度的窗口(如1秒或1分钟),并记录每个窗口内的请求数量。若请求数量超过设定的阈值,则拒绝后续请求。

优点

  • 实现简单,逻辑清晰。

缺点

  • 存在"临界请求"问题:窗口切换时可能出现瞬时流量激增。例如,一个用户在第一个窗口结束时发起大量请求,同时在下一个窗口开始时再次发起请求。

代码实现

import java.util.concurrent.atomic.AtomicInteger;

/**
 * 固定窗口限流器类,用于限制单位时间内的请求数量。
 */
public class FixedWindowRateLimiter {
    /**
     * 单位时间内允许的最大请求数。
     */
    private final int limit;
    
    /**
     * 时间窗口的大小,单位为毫秒。
     */
    private final long windowTime;
    
    /**
     * 当前时间窗口内的请求数计数器。
     */
    private final AtomicInteger requestCount;
    
    /**
     * 当前时间窗口的开始时间戳。
     */
    private long windowStart;

    /**
     * 构造函数,初始化限流器。
     *
     * @param limit      单位时间内允许的最大请求数。
     * @param windowTime 时间窗口的大小,单位为毫秒。
     */
    public FixedWindowRateLimiter(int limit, long windowTime) {
        this.limit = limit;
        this.windowTime = windowTime;
        this.requestCount = new AtomicInteger(0);
        this.windowStart = System.currentTimeMillis();
    }

    /**
     * 判断是否允许当前请求通过。
     *
     * @return 如果允许请求通过则返回true,否则返回false。
     */
    public synchronized boolean allowRequest() {
        long currentTime = System.currentTimeMillis();
        // 如果当前时间超过窗口时间,则重置窗口开始时间和请求数计数器
        if (currentTime - windowStart >= windowTime) {
            windowStart = currentTime;
            requestCount.set(0);
        }
        // 增加请求数计数器,并判断是否超过限制
        if (requestCount.incrementAndGet() <= limit) {
            return true;
        } else {
            return false;
        }
    }
}

滑动窗口算法(Sliding Window Algorithm)

滑动窗口算法改进了固定窗口的缺点。它通过细化时间窗口,将大时间窗口分成多个小窗口,每个小窗口记录请求数量。通过滑动时间窗口来统计单位时间内的请求数,从而避免固定窗口的临界问题。

优点

  • 更加平滑地统计流量,避免瞬时流量峰值。

缺点

  • 需要维护多个小窗口的数据,内存占用稍高。

代码实现

import java.util.LinkedList;
import java.util.Queue;

/**
 * 滑动窗口限流器类,用于限制单位时间内的请求数量。
 */
public class SlidingWindowRateLimiter {
    /**
     * 单位时间内允许的最大请求数。
     */
    private final int limit;
    
    /**
     * 时间窗口的大小,单位为毫秒。
     */
    private final long windowTime;
    
    /**
     * 存储请求时间戳的队列。
     */
    private final Queue<Long> requestTimestamps;

    /**
     * 构造函数,初始化限流器。
     *
     * @param limit      单位时间内允许的最大请求数。
     * @param windowTime 时间窗口的大小,单位为毫秒。
     */
    public SlidingWindowRateLimiter(int limit, long windowTime) {
        this.limit = limit;
        this.windowTime = windowTime;
        this.requestTimestamps = new LinkedList<>();
    }

    /**
     * 判断是否允许当前请求通过。
     *
     * @return 如果允许请求通过则返回true,否则返回false。
     */
    public synchronized boolean allowRequest() {
        long currentTime = System.currentTimeMillis();
        // 移除队列中所有超出时间窗口的请求时间戳
        while (!requestTimestamps.isEmpty() && (currentTime - requestTimestamps.peek() > windowTime)) {
            requestTimestamps.poll();
        }
        // 如果当前请求数量未达到限制,则允许请求并通过
        if (requestTimestamps.size() < limit) {
            requestTimestamps.add(currentTime);
            return true;
        } else {
            return false;
        }
    }
}

漏桶算法(Leaky Bucket Algorithm)

漏桶算法的核心思想是将请求按照恒定速率从桶中流出,即使请求量非常大,也不会超过设定的处理速率。

原理

  • 请求到达时放入漏桶。
  • 若桶未满,接收请求;否则拒绝请求。
  • 请求以恒定速率从桶中流出,传递给下游服务。

优点

  • 平滑流量,避免突发流量对系统造成冲击。
  • 实现简单,常用于带宽限速场景。

缺点

  • 无法很好地应对突发流量。

代码实现

public class LeakyBucketRateLimiter {
    /**
     * 漏桶的最大容量。
     */
    private final int capacity;
    
    /**
     * 漏桶的漏出速率,单位为每秒多少个请求。
     */
    private final int rate;
    
    /**
     * 当前桶中的水量。
     */
    private int water;
    
    /**
     * 上一次处理请求的时间戳。
     */
    private long lastTime;

    /**
     * 构造函数,初始化漏桶限流器。
     *
     * @param capacity 漏桶的最大容量。
     * @param rate     漏桶的漏出速率,单位为每秒多少个请求。
     */
    public LeakyBucketRateLimiter(int capacity, int rate) {
        this.capacity = capacity;
        this.rate = rate;
        this.water = 0;
        this.lastTime = System.currentTimeMillis();
    }

    /**
     * 判断是否允许当前请求通过。
     *
     * @return 如果允许请求通过则返回true,否则返回false。
     */
    public synchronized boolean allowRequest() {
        long currentTime = System.currentTimeMillis();
        // 计算并更新当前桶中的水量
        water = Math.max(0, water - (int) ((currentTime - lastTime) * rate / 1000));
        lastTime = currentTime;

        // 如果当前水量未达到最大容量,则允许请求并通过
        if (water < capacity) {
            water++;
            return true;
        } else {
            return false;
        }
    }
}

令牌桶算法(Token Bucket Algorithm)

令牌桶算法是漏桶算法的一种变体,它允许一定程度的流量突发。

原理

  • 系统按照固定速率向令牌桶中加入令牌。
  • 每个请求需获取一个令牌,若桶中有足够的令牌,则允许请求通过;否则拒绝请求。
  • 若桶满,新增的令牌会被丢弃。

优点

  • 支持流量突发,灵活性更高。
  • 广泛应用于实际生产中。

缺点

  • 实现略复杂。

代码实现

public class TokenBucketRateLimiter {
    /**
     * 令牌桶的最大容量。
     */
    private final int capacity;
    
    /**
     * 每秒补充的令牌数量。
     */
    private final int refillRate;
    
    /**
     * 当前令牌桶中的令牌数量。
     */
    private int tokens;
    
    /**
     * 上一次补充令牌的时间戳。
     */
    private long lastRefillTime;

    /**
     * 构造函数,初始化令牌桶限流器。
     *
     * @param capacity   令牌桶的最大容量。
     * @param refillRate 每秒补充的令牌数量。
     */
    public TokenBucketRateLimiter(int capacity, int refillRate) {
        this.capacity = capacity;
        this.refillRate = refillRate;
        this.tokens = capacity;
        this.lastRefillTime = System.currentTimeMillis();
    }

    /**
     * 判断是否允许当前请求通过。
     *
     * @return 如果允许请求通过则返回true,否则返回false。
     */
    public synchronized boolean allowRequest() {
        long currentTime = System.currentTimeMillis();
        long elapsedTime = currentTime - lastRefillTime;
        // 计算并补充新的令牌
        int newTokens = (int) (elapsedTime * refillRate / 1000);
        tokens = Math.min(capacity, tokens + newTokens);
        lastRefillTime = currentTime;

        // 如果当前令牌数量大于0,则允许请求并通过
        if (tokens > 0) {
            tokens--;
            return true;
        } else {
            return false;
        }
    }
}

漏桶与令牌桶的对比

特性漏桶算法令牌桶算法
流量控制恒定速率流出突发流量有限支持
实现难度简单略复杂
应用场景带宽限速等严格限流场景通用场景,允许一定突发流量

队列限流

队列限流是一种通过排队机制控制请求速率的限流方式。请求到达后进入队列,系统按设定的速率处理队列中的请求。若队列满,则拒绝新请求。

优点

  • 控制请求流量,保障系统稳定。

缺点

  • 增加了请求的延迟。

代码实现

import java.util.concurrent.BlockingQueue;
import java.util.concurrent.LinkedBlockingQueue;

/**
 * 使用阻塞队列实现的限流器类,用于限制并发请求的数量。
 */
public class QueueRateLimiter {
    /**
     * 用于存储请求的阻塞队列。
     */
    private final BlockingQueue<Runnable> queue;
    
    /**
     * 队列的最大容量,即允许的最大并发请求数。
     */
    private final int limit;

    /**
     * 构造函数,初始化限流器。
     *
     * @param limit 队列的最大容量,即允许的最大并发请求数。
     */
    public QueueRateLimiter(int limit) {
        this.limit = limit;
        this.queue = new LinkedBlockingQueue<>(limit);
    }

    /**
     * 尝试将请求添加到队列中。
     *
     * @param request 要添加的请求。
     * @return 如果请求成功添加到队列中则返回true,否则返回false。
     */
    public boolean allowRequest(Runnable request) {
        return queue.offer(request);
    }

    /**
     * 处理队列中的所有请求。
     */
    public void processRequests() {
        while (!queue.isEmpty()) {
            Runnable request = queue.poll();
            if (request != null) {
                request.run();
            }
        }
    }
}

限流的实现方式

单机限流

单机限流适用于单节点应用,通常通过内存存储请求计数器或桶来实现。例如:

  • 使用本地缓存(如Guava Cache)实现滑动窗口。
  • 使用Java的信号量(Semaphore)控制并发请求数。

分布式限流

分布式限流用于多节点应用场景,需确保各节点之间限流策略的一致性。常见方法包括:

  • Redis分布式锁:通过Redis的原子操作实现分布式计数器。
  • 令牌桶结合消息队列:使用消息队列实现令牌分发,协调多个节点的请求速率。
  • 专用限流组件:如Netflix的Hystrix、阿里的Sentinel。

限流的应用场景

API网关

  • 限制单个用户或IP的请求速率,防止恶意流量。

微服务间通信

  • 防止下游服务因上游流量暴增而崩溃。

数据库操作

  • 限制高并发查询或写操作,保护数据库性能。

支付系统

  • 控制用户提交支付请求的频率,防止重复提交。

限流中的常见问题及优化

热点问题

某些接口流量异常集中,可能导致限流失效。可以采用:

  • 动态调整限流阈值。
  • 对关键接口使用独立限流策略。

降级与熔断

在限流的基础上结合熔断机制,确保系统在高负载时优雅降级。例如,返回友好的错误提示或缓存数据。

动态配置

通过配置中心动态调整限流策略,避免频繁部署代码。例如,基于Apollo或Nacos实现限流规则的实时下发。

总结

限流算法在保障系统稳定性和优化资源利用率方面扮演着不可或缺的角色。通过合理选择限流算法,可以有效防止服务过载、优化系统性能,并提升用户体验。每种算法都有其适用场景与局限性,例如固定窗口算法适合简单场景,而令牌桶算法则支持更灵活的流量突发管理。

在实际应用中,限流不仅限于技术实现,还与系统架构设计密切相关。例如,分布式限流需要在多节点环境下确保一致性,而动态调整限流策略可以帮助应对流量的波动性。此外,结合熔断、降级等技术手段,可以进一步增强系统在高负载或异常情况下的应对能力。

欢迎关注公众号:“全栈开发指南针”

这里是技术潮流的风向标,也是你代码旅程的导航仪!🚀

Let’s code and have fun! 🎉