作用

判断数据可能存在 或 一定不存在。

好处

增加和查询元素的时间复杂度O(N)
布隆过滤器不存储元素本身，占用小，保密性强

缺点

存在误判，bit数组占用率越高，误判率越高；无法获取元素本身，很难删除元素

原理

1、Bit数组存储数据

| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |

2、Key多次Hash，获取Bit数组下标

key值经过三次hash获得三个下标，这三个位置的元素设置为 1 。
| 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |

3、查询KEY

根据Key 进行hash运算三个下标，查询三个元素是否都为1，都为1表示可能存在，存在0表示一定不存在。

4、误判率

存储 Key越多， 也就代表 Bit数组 1 越多 ， 0 越少， 误判率也就 越高。

例子：

有一个12位bit数组，存储50个key之后，bit数组元素均为1
| 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |

那么这时候，无论查询什么新的Key，都会返回三个1。

解决：

可以 适当增加Bit数组长度 ， 降低误判率 。

删除KEY

由于布隆过滤的实现和hash冲突，很难删除布隆过滤的key。
一般是重新进行查询计算布隆过滤器的数据。
如果需要删除，可以给每个Bit元素添加计数器，删除一个key就给三个元素的计数减1。（可参考 Counting Bloom Filter）

使用场景

1、缓存穿透
2、黑名单过滤
3、URL去重

【数据结构】布隆过滤器（Bloom Filter）

作用

好处

缺点

原理

1、Bit数组存储数据

2、Key多次Hash，获取Bit数组下标

3、查询KEY

4、误判率

例子：

解决：

删除KEY

使用场景

相关

【数据结构】布隆过滤器（Bloom Filter）

作用

好处

缺点

原理

1、Bit数组 存储数据

2、Key多次Hash，获取Bit数组下标

3、查询KEY

4、 误判率

例子：

解决：

删除KEY

使用场景

相关

1、Bit数组存储数据

4、误判率