缓慢变化维 && 拉链表 && 数据中台

540 阅读1分钟

1. 缓慢变化维

定义:维度的属性并不是静态的,它会随着时间的流失发生缓慢的变化

处理方案

1.1 重写

使用情况:
    1. 数据必须要正确(之前的数据为错误数据,比如人名等);
    2. 不需要考虑历史维度的变化。
优缺点:
    1. 只需要更新即可;
    2. 不需要额外增加数据,节省了存储空间;
    3. 没有保存历史数据,如果未来需要分析则无法进行。
    

1.2 增加新行

自然键:业务意义上的唯一ID,在新增数据的时候,自然键不做变化,自增键会加1

使用情况:
    历史维度变化需要保存。
    
实现方案:
    1. 自然键第一次出现的时候,createdtime为创建时间,updatedtime为9999-12-31;
    2. 发生变化的时候,将上述数据的updatedtime更新为最新的时间,并新增一条数据,createdtime为最新时间,updatedtime为9999-12-31
    

1.3 增加当前值属性 使用情况: 需要分析所有 伴随着新值或旧值的变化前后 记录的事实

参考链接: www.jianshu.com/p/d3b8d80d2…

拉链表

参考链接:blog.csdn.net/mtj66/artic…

数据中台

参考链接: www.zhihu.com/question/28…