数仓维度建模

261 阅读1分钟

一.基本概念

维度建模是面向分析的一个模型,重点解决用户如何更快完成分析需求,同时还有较好的大规模复杂查询的响应功能,为了提高查询性能可以适当增加数据冗余,跟三范式(3NF)相反是反规范化的设计技术。

二.事实表

  • 事务事实表
  • 周期快照事实表
  • 累计快照事实表

三.维度表

  • 退化维度
  • 缓慢变化维

3.1.缓慢变化维常用几种处理方式

  • 直接覆盖原值
  • 增加属性列
  • 参考拉链表设计、至少增加三列有效截止日期,行标识(status、flag)

3.2.维度建模按数据组织可分为

  • 星型模型
  • 雪花模型
  • 星座模型

四.粒度

用于确定事实表中行表示什么,是业务最小的活动单元,或不同维度组合,业务细节程度。

五.建模工具

  • Excel Mapping

    最常用的通过Excel维护数据模型、血缘关系和元数据管理 image.png 将目标表各种属性和源表各种属性,例如字段名、表名、字段加工逻辑、表过滤条件,表关联方式、增全量方式、分区说明、主题范围、变更记录等等备注

  • PowerDesigner

​ 一款常用的建模工具,还有许多建模工具