数据仓库

117 阅读3分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

目录

数据仓库是怎么产生的\

给数据仓库下定义\

数据仓库的特点\

理解结构化


\

数据仓库是怎么产生的

Q:我们都知道,每个应用都有自己的数据库,将数据存到数据库中,如果要分析数据的话,为什么不能直接从数据库中调取数据来进行分析呢?

\

A:On-Line Transaction Processing联机事务处理过程(OLTP)是面向业务的,由前台、应用、数据库共同完成,可以即时地处理输入的数据,及时地回答。但不适合在OLTP的环境中去从数据库中读取数据来进行分析,对于操作库而言,读的压力大于写的压力,并且会挤占数据库对于业务的处理,在OLTP环境下,数据库只存储数周或数月的新数据,不能存储太旧的数据,所以这样也不利于进行数据分析,所以为了既满足数据的分析,又不影响业务,所以出现了数据仓库。\

给数据仓库下定义

数据仓库是一个用于存储,分析,报告的数据系统,构建面向分析的集成化数据环境,分析的结果为企业提供决策支持,数据仓库本身不生产任何数据,数据来源于不同的外部系统,同时数据仓库也不需要消费任何数据,其结果开放给各个外部应用使用。我们把这种面向分析,支持分析的系统称之为OLAP(联机分析处理) ,数据仓库是OLAP系统的一种实现。

\

****\

数据仓库的特点

  • 面向主题

\

  • 集成性

\

  • 非易失性

\

  • 时变性

\

理解结构化

Q:在操作数据仓库时,使用的是SQL结构化查询语言,那么结构化查询语言中的结构化是什么意思?\

\

A:结构化查询语言查询突出查询的数据是结构化数据,结构化数据与非结构化数据相对结构化数据特指由二维表结构来逻辑表达和实现的数据,通过关系型数据库进行存储和管理,非结构化数据有XML,HTML等等,本质是不同文件内的数据格式不同