1.定义

BloomFilter 是由一个固定大小的二进制向量或者位图（bitmap）和一系列映射函数组成的。用来解决一个元素是否存在一个集合里面（一般是很大的集合里），是一种算法。

2.场景

每次写入用户数据都更新一下这个长长的二进制的位图，当有请求的时候，先在这个二进制位图查询。如果有才进行数据库查询。

一个集合C里面的有n元素，把n个元素通过k个哈希函数，分别转化映射到二进制向量里面。这些位置都标识为1，当要校验某个x元素是否在集合里，只需要把x元素进行同样的哈希函数转化，查看标识1的位置与二进制向量表是否匹配，如果相同位置同时也是1 则存在。

假设有集合{'a','f','h'}，需要检查'h' 是否在集合中

这时候{'a','f','h'}映射的二进制向量已经映射好，校验'h'是否存在，只需要执行hash1('h'), 然后检查对应的位置是否已经标识为1即可。是1则存在，是0则不存在。

通过一个很长的二进制向量就能描述各种复杂的数据关系，空间复杂度极低。查询时间也比较快。

有则有可能有误差，有哈希碰撞的可能，但是没有就肯定没有。哈希函数可以有效均匀的分布在整个位图里，减少哈希碰撞。

由于有可能有误差，有哈希碰撞的可能，导致结果不精确。删除也不方便。

优化方案：可以增加hash哈希函数的数量与位图的长度。

Google的Guava类，Twitter的 Algebird 类库，Redis自带的Bitmaps二次开发。