随便写写PV/UV统计问题

819 阅读1分钟

业务场景

通常情况下,我们需要统计网站或者APP点击次数(PV),以及日活用户数(UV)

统计思路

数据记录法

记写数据日志,存储方式不定,查询数据并统计。count,大数据计算。

HashSet

利用set元素唯一去重,用户量较小时可以使用,用户量较大时内存绷不住。

Bitmap

类似标记法,比如活跃id值所在位置记为1。需要计算,内存消耗比set小很多。

Hyperlogloglog

redis数据结构,抛硬币,伯努利实验演变而来,内存占用最大为12k,最大可以统计到2的64次方数量级,但是有很低的误差,约为 0.81%,针对统计数字来说可以忽略不计。