数据仓库的四大特征及其来源与英文原文

143 阅读1分钟

数据仓库(Data Warehouse, DW)的四大特征是由领域先驱Bill Inmon在他的著作中提出,并被广泛接受。这四大特征分别是:

  1. 主题导向(Subject-Oriented)

    • 数据仓库中的数据组织围绕业务主题,而不是应用程序。这意味着数据被分类并按业务主题进行逻辑分组,例如销售、产品、客户等。这种组织方式有助于更好地理解数据结构和关系。
  2. 集成(Integrated)

    • 数据仓库集成了来自不同源的数据。这些数据可能来自于多个不同的操作数据库和其他数据源。集成意味着数据必须经过清洗、转换和统一处理,以便在一个一致的基础上进行分析。
  3. 不可更新(Non-Volatile)

    • 一旦数据进入数据仓库,它就很少或永远不会被更改。这意味着历史数据会被保留下来,以支持长期的趋势分析和报告。这与操作型数据库形成对比,后者的数据经常被更新。
  4. 随时间变化(Time-Variant)

    • 数据仓库中的数据是随时间变化的,这意味着数据不仅包含了当前的信息,也包含了过去的信息。这使得数据仓库能够支持趋势分析、历史查询和预测建模。

这四个特征共同构成了数据仓库的基础,确保了数据仓库能够满足组织的需求,即提供历史数据的分析视图,支持决策制定过程。通过这些特性,数据仓库能够在不影响操作系统的性能的情况下,为高级分析和报告提供必要的数据支持。