基础概念:
(1)ETL(Extract/Transformation/Load,清洗/转换/加载)
(2)元数据:数据源定义,目标定义,转换规则等相关的关键数据。
(3)粒度:保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。
(4)分割:结构相同的数据被分成多个数据物理单元。任何给定的数据单元属于且仅属于一个分割。
(5)数据集市:小型的,面向部门或工作组级数据仓库。
(6)ODS(Operation Data Store,操作数据存储)。四个基本特点:面向主题的、集合的、可变的、当前或接近当前的。
(7)数据模型
(8)人工关系。为了满足中高层管理人员预测、决策分析的需要,在传统数据库的基础上产生了能满足预测、决策分析需要的数据环境---数据仓库。
(1) 数据源:是数据仓库系统的基础,是整个系统的数据源泉。
(2)数据的存储与管理:是整个数据仓库系统的核心。
(3)OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。
(4)前端工具:主要包括各种查询工具、报表工具、分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。