维度建模4步骤

294 阅读2分钟

「这是我参与2022首次更文挑战的第8天,活动详情查看:2022首次更文挑战」。

先来回顾一下前两篇讲的内容。大数据的存在就是为业务、决策人员提供汇总数据支持,高效快速准确的查询到想要的信息,并且具有安全保障。

数据仓库中涉及到的首要技术就是维度建模,包括星型模型和OLAP多维模型,简单介绍了一下维度建模中的几个重要组成:事实表、事实、粒度、维度表等。

今天主要介绍维度模型设计的4步骤。

第一 选择业务过程。

业务过程通俗点理解就是物理世界中发生的事件,比如销售产品、客服处理、注册用户、签约合同、工程完工等等。为了更好的理解业务过程,统一大家的认知,区分其属于不同组织,对业务过程有以下的特征说明:

一般是操作性系统的核心动作作为业务过程,比如电商系统的购买动作、crm系统的订单状态流转、购票系统的购买。

通常业务过程都会有头有尾,什么是有头有尾,即明确的输入和可度量的输出,看到这个可度量是不是很熟悉,没错这就是之前提到的事实,在维度模型中作为度量的事实。一系列的过程数据组合成了事实表。

第二 声明粒度

我们说事实表中每一行数据都是最细粒度的细节级别。如何声明粒度呢?比如销售事务中是每一个产品在一行中,购票系统中每一次购票在一行中表示。

第三确定维度

维度常常就是事实表中的外键,常表示成我们熟悉的六要素,即“who、what、where、when、why、how”,用六要素描述出来的事件。我们需要充分选择维度,充实每个维度表。

第四 确定事实

事实分为很多种,最常见也最重要的一种就是数值型的可加性事实。粒度相同的事实可以放在同一事实表中,反之亦然。