hive在交易流水统计中的应用

78 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第28天,点击查看活动详情

大数据分析现在贯穿在很多场景之中,比如电商中的用户画像分析,订单漏斗转化分析,用户喜好分析等等,在交易场景中应用是尤为广泛和重要的,交易是一件产品非常核心的环节,通过对交易数据的分析,可以大大的帮助提高产品成交率和成交量,当然这个分析也不是那么容易的,既要考虑业务侧的数据结构,也要考虑业务的实际需求,从而设计合理的交易数据模型,对数据做到详尽分析,并获得有用的结果。

下面讲一个具体的例子来说一说我是怎么做交易类的数据分析的。

首先基于的场景是客户签约合同,此合同可以废除重新签约,每次签约最终都只有一份合同和一个合同金额,不会记录历史的合同金额,但是在订单流水中会记录成交金额,现在要按月统计业绩,当然这里会有重新签约的场景,重新签约的话,不能按照完全的合同金额纪录,这样会影响最终的业绩,需要按照加减的方式,比如第一次签约一万,第二次签约两万,那么对于第二次的签约就是加一万,第三次又变为1.5万,那对上一次就是减少0.5万,这样最终算出的业绩就是1.5w,和第三次签约的金额一致,这样就可以按照这种方式计算每个月的业绩啦。

下面讲一下具体实现。

显示设计一张合同流水表,将每一个项目的合同额流水展示出来,第一次记得是1万,第二次记的是加1万,第三次记得是减0.5万,最终将三条数据加在一起就是1.5万,并且每次签约成功记1,就是成交量。