高并发系统学习 Day18 缓存穿透什么是缓存穿透：缓存穿透其实是指从缓存中没有查到数据，而不得不从后端系统（

什么是缓存穿透：
    缓存穿透其实是指从缓存中没有查到数据，而不得不从后端系统（比如数据库）中查询的情况。
    少量的缓存穿透不可避免，对系统也是没有损害的，主要有几点原因：
        一方面，互联网系统通常会面临极大数据量的考验，而缓存系统在容量上是有限的，不可能存储系统所         有的数据，那么在查询未缓存数据的时候就会发生缓存穿透。
        另一方面，互联网系统的数据访问模型一般会遵从“80/20 原则”。“80/20 原则”又称为帕累托法           则，是意大利经济学家帕累托提出的一个经济学的理论。简单来说，它是指在一组事物中，最重要的部分通         常只占 20%，而其他的 80% 并没有那么重要。把它应用到数据访问的领域，就是我们会经常访问 20% 的         热点数据，而另外的 80% 的数据则不会被经常访问。比如你买了很多衣服，很多书，但是其实经常穿的、         经常看的可能也就是其中很小的一部分。

缓存穿透的解决方案：
    回种空值。当我们从数据库中查询到空值或者发生异常时，我们可以向缓存中回种一个空值。但是因为空值并不是准确的业务数据，并且会占用缓存的空间，所以我们会给这个空值加一个比较短的过期时间，让空值在短时间之内能够快速过期淘汰。
    使用布隆过滤器。基本思路如下：把集合中的每一个值按照提供的 Hash 算法算出对应的 Hash 值，然后将 Hash 值对数组长度取模后得到需要计入数组的索引值，并且将数组这个位置的值从 0 改成 1。在判断一个元素是否存在于这个集合中时，你只需要将这个元素按照相同的算法计算出索引值，如果这个位置的值为 1 就认为这个元素在集合中，否则则认为不在集合中。

    关于布隆过滤器的使用上有几个建议：
        1）选择多个 Hash 函数计算多个 Hash 值，这样可以减少误判的几率；
        2）布隆过滤器会消耗一定的内存空间，所以在使用时需要评估你的业务场景下需要多大的内存，存储         的成本是否可以接受。

此文章为5月Day18学习笔记，内容来源于极客时间《高并发系统设计 40 问》