雪花模型和星型模型在数仓建模的选择

528 阅读1分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

数仓建模维度表的雪花模型和星型模型

在维度设计时会碰到需要规范化和反规范化的情况,规范化是指使用一系列范式设计数据库的过程(如3NF),其目的是减少数据冗余,增强数据的一致性。通常情况下,规范化之后,一张表的字段会拆分到多张表。在设计维度表时,如果对其规范化,得到的维度模型称为雪花模型,这种模型的特点是维度表被拆分成更多的表,就像雪花的分支一样不断分叉。

image.png

image.png

反规范化则是将多张表的数据冗余到一张表,这样做的好处是在查询时可以减少join操作,提高查询性能。

image.png

在搭建数据仓库系统时,我们的目的主要是为了进行数据分析与统计,在大数据环境下,数据的冗余并不是用户考虑的重点。因此星型模型方便、易用且性能好的特点使得维度表常常使用该模型,因此,维度表一般是不规范的。