本文已参与「新人创作礼」活动,一起开启掘金创作之路。
目录
专有名词:
粒度:事实表中一条记录所表达的业务细节程度称为粒度。通常粒度有2种表达方式:一种是维度属性组合所表示的细节程度;另一种是具体的业务含义。
事实:业务过程中产生的数值型度量,例如,销量,销售额,购买人数等。可以细分为可加性、半可加性和不可加性事实三种类型。
可加性事实指可以按照与事实表关联的任意维度进⾏汇总。
半可加性事实只能按照某些特定维度汇总,不能对所有维度汇总。例如,库存可以按照地点和商品进⾏汇总,⽽按时间维度把⼀年中每个⽉的库存累加起来则毫⽆意义。
不可加性事实是指度量完全不具备可加性。例如,⽐率型事实。
事实表类型
- 事务事实表
- 周期快照事实表
- 累计快照事实表
- 无事实事实表
- 聚集型事实表
三种主要类型事实表对比:
事实表设计原则
- 尽可能包含所有与业务过程相关的事实
- 只选择与业务过程相关的事实
- 分解不可加性事实为可加的组件
- 在选择维度和事实之前必须先声明粒度
- 在同一个事实表中不能有多种不同粒度的事实
- 事实的单位要保持一致
- 对事实的null值要处理
- 使用退化维度提升事实表的易用性
事实表设计方法
- 选择业务过程及确定事实表类型
- 声明粒度
- 确定维度
- 确定事实
- 冗余维度
总结