「这是我参与2022首次更文挑战的第12天,活动详情查看:2022首次更文挑战」。
前面一直说的是经典的维度表模型,下面介绍高级维度表模型的一些特点。
1、维度表连接,维度表之间可以互相的引用,或者被其他引用。基本维度之上会存在指向支架维度,其外键会导致该基本维度出现爆炸性的增长。
2、我们经常说多值维度,其实这是一个在经典模式中,通过桥接表也就是与每个事实表关联的维度所具有粒度一致的单一值,但某些情况下,又存在合理的多值。
3、事实表之间的关联维度随时间变化,可能需要基于缓慢变化类型2维度,例如,实现订单数据与每个账号之间的多对多关系,通常必须基于类型2的订单与账户维度,在此情况下,为防止订单与账号之间的不正确连接,多维度之间连接关系必须包含时间期限,在请求结果响应时,限制桥接表要在满足特定的时刻能生成快照。
4、在数据仓库中也存在大量的文本数据,这是维度表的描述信息。联系到标签的时间序列行为,数据挖掘通常采用聚类分析进而在进行序列行为描述时产生文字描述行为独特印记即标签,通常我们都是按照分区的作用分化周期。在此情况下,比如跨时间维度的订单就可以称为行为标签的一种序列,这样的时间序列可以时作为特殊属性存储与账户中,只要是这样通过序列完整构成的标签,在位置设计初期就已经建立,作为这样的标签是为了实现复杂并发查询。
5、数据分析就是通过数据分析行为,即行为研究分组,对于常见的客户行为,通过简单的查询可以获悉结果,但是有时候一些复杂的客户行为,就可以通过多次的行为迭代查询去执行。我们往往会将数据和BI应用结合起来,做到行为分析,控制约束用户,获取复杂的行为,这样的做法是不现实的。