什么是基数? 不重复的元素,可以接受误差
简介
Redis2.8.9版本更新了Hyperloglog数据结构!
Redis Hyperloglog基数统计的算法
优点:占用的内存是固定的,2^64不同元素,只需要12KB内存左右.如果从内存角度考虑,Hyperloglog是首选.
应用场景 :网页的uv(一个人访问一个网站多次,但是还是算作一个人!),在传统的方式中,set保存用户的id,然后就可以统计set的元素数量作为标准判断! 这种方式如果保存大量的用户id,就会比较麻烦!我们的目的是为了计数,而不是保存用户id;
命令
- 添加键和元素
pfadd 键 元素... - 计算元素数量
pfcount 键
- 合并元素
pfmerge 新键 键1 键2