Redis热点问题发现及通用解决方案

微信公众号：深广大数据Club关注可了解更多大数据相关的咨询。问题或建议，请公众号留言;如果你觉得深广大数据Club对你有帮助，欢迎转发朋友圈推荐关注

每当我们拥有一个拥有大量用户的数据库时，遇到数据库中的热点并不罕见。对于Redis，频繁访问分区中的相同Key称为热点。在本文中，我们将讨论热点的常见原因，评估此问题的影响，并提出有效的解决方案来处理热点。

热点的常见原因

原因1：用户消费数据的大小远远大于生产数据的大小，包括热门项目，热门新闻，热门评论和名人直播。

在你的日常工作和生活中出现意外事件，例如：当天降价和促销某些热门商品，当其中一件物品被浏览或购买数万次时，需求会更大，并且这种情况会导致热点问题。

同样，它已经被大量的热门新闻，热门评论，明星直播等发布和观看，这些典型的无读写场景也产生了热点问题。

原因2：请求切片数超过单个服务器的性能阈值。

在服务器上访问一条数据时，通常会对数据进行拆分或切片。在此过程中，将在服务器上访问相应的Key。当访问流量超过服务器的性能阈值时，会出现热键问题。

热点问题的影响

流量集中，达到物理网络适配器的上限。
请求排队太多，导致缓存的分片服务崩溃。
数据库过载，导致服务雪崩。

如前所述，当服务器上的热点请求数超过服务器上网络适配器的上限时，由于流量过度集中，服务器停止提供其他服务。

如果热点的分布过于密集，则会缓存大量热点，从而耗尽缓存容量并导致缓存的分片服务崩溃。

缓存服务崩溃后，新生成的请求将缓存在后台数据库中。由于该数据库性能不佳，很容易因大量请求而耗尽，导致服务雪崩和性能大幅下降。

处理热点

读取热点数据

热点处理分为两个部分：写入和读取。在数据写入期间，SLB接收数据K1并通过代理将其写入Redis数据库。

如果K1在后台热点模块进行计算后成为热点，则代理会缓存热点。通过这种方式，客户端可以在下次绕过Redis时直接访问K1。

最后，因为代理可以水平扩展，所以热点数据的可访问性也可以无限增强。

发现热点数据

在发现期间，数据库首先计算在一个周期中发生的请求。当请求数达到阈值时，数据库将找到热点并将其存储在LRU列表中。当客户端通过向代理发送请求来尝试访问数据时，Redis会进入反馈阶段并在发现目标访问点是热点时标记数据。

数据库使用以下方法计算热点：

基于统计阈值的热点统计。
基于统计周期的热点统计。
基于版本号的统计信息收集方法，在使用时不需要重置初始值。
计算数据库上的热点具有最小的性能影响和轻量级内存占用。

解决方案的比较

从前面的分析可以看出，在解决热点问题时，这两种解决方案都是传统解决方案的改进。此外，读/写分离和热点数据解决方案都支持灵活的容量扩展，并且对客户端是透明的，尽管它们无法确保100％的数据一致性。

读/写分离解决方案支持存储大型热点数据卷，而基于代理的热点数据解决方案更具成本效益。

参考链接：

https：//www.alibabacloud.com/blog/redis-hotspot-key-discovery-and-common-solutions_594446?spm=a2c41.12559851.0.0https://medium.com/@Alibaba_Cloud/redis-hotspot-key-discovery-and-common-solutions-95474d27e0f8

Redis热点问题发现及通用解决方案

热点的常见原因

热点问题的影响

推荐解决方案

Server缓存解决方案

“MemCache + Redis”解决方案

本地缓存解决方案

读/写拆分解决方案

热点数据解决方案

处理热点

读取热点数据

发现热点数据

解决方案的比较

参考链接：

关注公众号