腾讯面试题: 如何统计在线用户数前几天看面经的时候遇上了这个问题场景题: 如何在上线后统计用户数和最大用户数? 本文分

前几天看面经的时候遇上了这个问题

本文分为两部分来讨论这个问题, 并说明各个方式的弊端

因为该问题对B/S架构或C/S架构来说无差异, 因此下文中不区分客户端/浏览器端

(ps: 创作不易, 对您有帮助的话麻烦帮忙点个赞^_^)

客户端服务端采用短链接通信

网上的一般答案都是针对这种场景的.

我们来分析一下用户统计时的难点: 我们无法准确的判断出用户的退出行为.

当服务端和客户端采用短链接进行通信时, 这确实是个难点, 我们可以"假设"用户在某个时间后会退出, 记为"退出时间", 然后我们的服务端可以在收到该用户新的请求时更新这个"退出时间", 同时客户端创建一个定时任务, 在某段时间后发送一个空请求来更新"退出时间".

比如某个用户在12:00, 我们记录人数+1, 然后维护一个过期时间为12:05, 之后服务端每次收到该用户的请求时都更新过期时间为当前时间+5min, 然后客户端定时任务每4min发送一个空请求.

基于上述思路我们可以如下实现

优点:

缺点:

而且我们可以分析下1, 3两条缺点, 他们是无法解决的, 因为优化大数据查询需要索引, 而建立索引又会导致update操作耗时的增加.

基于redis的思路和基于数据库的差不多, 只不过我们把存储方式改为了基于内存, 且不再存储全部数据, 从而解决了基于数据库方式的1,3两条缺点.

我们可以如下实现

此外, 我们也可以把ZSet换成bitMap数据结构, 思路一致.

优点:

缺点

这是我个人认为最好的一种统计方式了, 我们可以通过监听API层的长连接数目来判断在线用户数.

当我们采用这种方式时, 非常容易监听到用户退出行为. 因为无论用户通过何种方式关闭客户端, OS都会发起四次挥手来关闭客户端所持有的全部连接.

唯一可能造成误判的情况就是用户主机宕机, 但这种情况相比起预估"退出时间"方式导致的误差要小太多了.

因此, 当我们需要查询在线用户数时, 只需要统计API层所有主机中, 处于"ESTAB状态"且"服务端主机作为目的主机"且"端口是我们的程序监听的端口"的连接数.

我们可以通过如下命令来做到这一点

ss -antp | grep ESTAB | awk '{print $4}' | grep <ip:port> | wc -l

其中

ss -antp | grep ESTAB

用于过滤处于ESTAB状态的长连接

awk '{print $4}

用来查询这些连接socket四元组中的目的ip:port

grep <ip:port>

用来过滤出我们程序监听的ip:port(如果程序所在主机只有一个ip地址, 那么只需要过滤:port即可)

最后通过wc -l命令来完成计数

优点:

缺点: