MySql按时、天、周、月进行数据统计

·  阅读 2992

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第8天,点击查看活动详情

最近遇到一个统计的需求场景,针对db中的数据,看一下每天的数据量情况,由于DB中时间字段采用的是int存的时间戳,所以最开始想到的是直接对时间进行按天取整,然后再Group统计数据;

除此之外,使用DATE_FORMAT函数来处理可能是更简洁的方法了,下面分别介绍下两种方式

1. 时间取整方式

假设现在有一个user表,其中create_time 为 int类型的时间戳,此时我们需要统计每天的新增用户数,第一种方式就是将create_time转换为天为单位的整数,然后group分组之后计数即可

对应的sql如下

select floor(create_time / 86400) as c, count(*) from `user` group by c
复制代码

使用上面这种方式虽然可以统计出结果,但是显示并不友好,如上面这个c实际上是距离标准起始时间过去的天数;无法直观看到每天的数量情况

2. data_format方式

接下来再介绍一下根据日期格式化这个函数来实现数据统计

函数说明

这个函数通常接收两个参数,使用姿势形如

DATE_FORMAT(date,format)
复制代码
  • date: 日期
  • format: 规定日期/时间的输出格式

注意上面的date,要求是日期格式,可我们现在的数据是int类型,怎么整?

先通过from_unixtime函数来转换为日期,然后再使用data_format来格式化分组,这样就可行了

比如按天统计的sql可以如下

select date_format(from_unixtime(create_time), '%Y-%m-%d') today, count(*) as cnt from user group by today
复制代码

返回结果形如

todaycnt
2022-07-026
2022-07-034
2022-07-044
2022-07-053
2022-07-062
2022-07-071

如果需要按周统计,也很方便,将format改成 %Y-%u

select date_format(from_unixtime(create_time), '%Y-%u') today, count(*) as cnt from user group by today
复制代码

返回结果形如

todaycnt
2022-2227
2022-2352
2022-2428
2022-2533
2022-2639
2022-2710

同样按年统计,则将format改成%Y即可

下面给出format对应的取值说明

格式描述
%a缩写星期名
%b缩写月名
%c月,数值
%D带有英文前缀的月中的天
%d月的天,数值(00-31)
%e月的天,数值(0-31)
%f微秒
%H小时 (00-23)
%h小时 (01-12)
%I小时 (01-12)
%i分钟,数值(00-59)
%j年的天 (001-366)
%k小时 (0-23)
%l小时 (1-12)
%M月名
%m月,数值(00-12)
%pAM 或 PM
%r时间,12-小时(hh:mm:ss AM 或 PM)
%S秒(00-59)
%s秒(00-59)
%T 时间24-小时 (hh:mm:ss)
%U周 (00-53) 星期日是一周的第一天
%u周 (00-53) 星期一是一周的第一天
%V周 (01-53) 星期日是一周的第一天,与 %X 使用
%v周 (01-53) 星期一是一周的第一天,与 %x 使用
%W星期名
%w 周的天 (0=星期日6=星期六)
%X年,其中的星期日是周的第一天,4 位,与 %V 使用
%x年,其中的星期一是周的第一天,4 位,与 %v 使用
%Y年,4 位
%y年,2 位

日期不连续场景补充说明

评论大佬指出上面这种统计方式有一个缺陷,当某一天没有数据时,会导致统计出来的数据不连续,简单来讲,现在8.1号3号有数据,但是2号没有数据,则统计出来的形如

2022-08-01  10
2022-08-03  20
复制代码

那么我们能实现缺的日期自动补零么?

下面给一个供大家参考的方法

SELECT data.day, IFNULL(data.count, 0) as cnt, day_list.day as date from 
	(select DATE_FORMAT(create_time, '%Y-%m-%d') day, count(id) count from u1 GROUP BY day) data
right join 
	(SELECT @date := DATE_ADD(@date, interval - 1 day) day from  (SELECT @date := DATE_ADD(CURDATE(), interval 1 day) from u1) days limit 30) day_list 
on day_list.day = data.day
复制代码

上面这个sql分了两部分,先看后面这一部分

-- 下面这个主要是构建一个日期表day_list, 只有一个成员 day, 取值为今天,昨天,前天,一直往前; 要求 u1 这个表的数据超过30条
SELECT @date := DATE_ADD(@date, interval - 1 day) day from  (SELECT @date := DATE_ADD(CURDATE(), interval 1 day) from u1) days limit 30
复制代码

其中u1是一个数据行数超过30的表,执行之后实际输出如下

image.png

前面的部分则是我们上面介绍的数据统计

-- 下面这个则是统计sql,将其余日期表进行关联
select DATE_FORMAT(create_time, '%Y-%m-%d') day, count(id) count from u1 GROUP BY day
复制代码

image.png

两个表join之后,对于null的数据自动补0,所以结果如下

image.png

一灰灰的联系方式

尽信书则不如无书,以上内容,纯属一家之言,因个人能力有限,难免有疏漏和错误之处,如发现bug或者有更好的建议,欢迎批评指正,不吝感激

分类:
后端
标签:
收藏成功!
已添加到「」, 点击更改