数据仓库: 面向主题、集成、非易失性的信息宝库

141 阅读3分钟

数据仓库是一个统一的企业信息中心,它汇集了所有的信息,将这些信息数据抽象后存储在数据仓库中,使企业内的所有用户都可以通过数据仓库取得他们所需的信息。数据仓库具有以下特点。

(1)面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织,如顾客、商品、订单、销售等。

(2)集成性。数据仓库中的数据是从原有的数据库中抽取来的,并进行了清理、转换和集成,按照主题进行了重新组织。

(3)非易失性。数据仓库的数据主要供企业决策分析之用,数据更新并不频繁,而是将原有的数据在内存中加以集成,并将集成后的数据存储到磁盘上。

(4)时变性。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据主要面向历史数据,通过日志等手段捕获数据的当前状态,并保存企业的历史活动记录,可以说数据仓库是企业的历史数据中心。

数据仓库系统是一个数据处理系统,但由于在数据仓库中采用了与原有数据处理不同的数据处理方式和工具,从而使得数据仓库具有与传统的数据处理系统不同的数据处理特点。

(1)数据的集成性。在数据仓库系统中,虽然也存在着大量的数据,但这些数据并不面向实际的事务处理,而是对原有的数据库系统中的数据进行集中、归纳、概括后得出的综合数据,是在对原有多数据库中的数据进行提取、加工和整理后集成而来的,它大多是为了实现特定的目标而专门组织的数据集合。

(2)数据的时变性。在数据仓库中,数据是随着时间变化的,时变性是数据仓库最基本的特征。在数据仓库中,数据保存的时间越久,其价值越大。

(3)数据的随机性。操作型处理方式下,用户访问数据的方式与数据所对应的事务处理逻辑有关,可以说具有一定的随机性。但在数据仓库系统中,由于采用了一种新的查询分析工具,使得这种随机访问的特性发生了很大的变化。由于这种查询工具采用了面向分析的体系结构,因此用户可以以一种全新的视角来观察和分析数据。

(4)数据的重构性。由于数据仓库系统具有以上3个特点,因此它本身又具有重构的特性。

(5)数据的非易失性。在操作型系统中,由于需要保存中间计算过程或最终计算结果,因此不可避免地存在一定的数据易失性。而在数据仓库系统中,由于采用了一种新的数据处理方式,使得其也具有新的特点。

西格数据仓库是面向主题的、集成的、非易失的、随时间变化的数据集合,用于支持企业或组织的决策过程。它不是对所有的信息进行收集和集成,而是根据信息需求确定收集和集成的范围和内容。因此,“西格数据仓库”是一个集合名词,是一个数据处理系统,是面向主题的、集成的、非易失的、随时间变化的数据集合,不是指具体的数据。

本文由mdnice多平台发布