OLAP|青训营笔记

136 阅读4分钟

这是我参与「第四届青训营 」笔记创作活动的第八天,今天的学习中有OLAP的简单介绍,包括在第二节课,FLink和OLAP也都提到了OLAP,那么OLAP本身到底是什么呢,经过查询百度百科,简单的做以下整理,整理如下:

1.1、OLAP 简介

  • OLAP(Online Analytical Processing)是一种联机分析处理技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。
  • 联机分析处理OLAP是一种软件技术它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。它具有FASMI(Fast Analysis of Shared Multidimensional Information),即共享多维信息的快速分析的特征。其中F是快速性(Fast),指系统能在数秒内对用户的多数分析要求做出反应;A是可分析性(Analysis),指用户无需编程就可以定义新的专门计算,将其作为分析的一部 分,并以用户所希望的方式给出报告;M是多维性(Multi—dimensional),指提供对数据分析的多维视图和分析;I是信息性(Information),指能及时获得信息,并且管理大容量信息。

1.2 基本功能

  1. 切片和切块(Slice and Dice)
  2. 钻取(Drill)
  3. 旋转(Pivoting)

广义功能

从广义上讲,任何能够有助于辅助用户理解数据的技术或者操作都可以作为OLAP功能,这些有别于基本OLAP的功能被称为广义OLAP功能。

  • 基本代理操作

    • 示警报告:定义一些条件,一旦条件满足,系统会提醒分析员去做分析。如每日报告完成或月订货完成等通知分析员作分析。
    • 时间报告:按日历和时钟提醒分析员。
    • 异常报告:当超出边界条件时提醒分析员。如销售情况已超出预定义阈值的上限或下限时提醒分析员。
  • 计算能力:计算引擎用于特定需求的计算或某种复杂计算。

  • 模型计算:增加模型,如增加系统优化、统计分析、趋势分析等模型,以提高决策分析能力。

1.3 OLAP包含什么?

概括来说,数据仓库系统是指具有综合企业数据的能力,能够对大量企业数据进行快速和准确分析,辅助做出更好的商业决策的系统。它本身包括三部分内容:

  • 数据层:实现对企业操作数据的抽取、转换、清洗和汇总,形成信息数据,并存储在企业级的中心信息数据库中。
  • 应用层:通过联机分析处理,甚至是数据挖掘等应用处理,实现对信息数据的分析。
  • 表现层:通过前台分析工具,将查询报表、统计分析、多维联机分析和数据发掘的结论展现在用户面前。

1.4 体系结构

OLAP系统按照其存储器的数据存储格式可以分为关系OLAP(RelationalOLAP,简称ROLAP)、多维OLAP(MultidimensionalOLAP,简称MOLAP)和混合型OLAP(HybridOLAP,简称HOLAP)三种类型:

  • ROLAP将分析用的多维数据存储在关系数据库中并根据应用的需要有选择的定义一批实视图作为表也存储在关系数据库中。也用作ROLAP存储器的RDBMS也针对OLAP作相应的优化,比如并行存储、并行数据管理、SQL的OLAP扩展(cube,rollup)等等。
  • MOLAP将OLAP分析所用到的多维数据物理上存储为多维数组的形式,形成“立方体”的结构。而ROLAP主要通过一些软件工具或中间软件实现,物理层仍采用关系数据库的存储结构,因此称为虚拟OLAP(VirtualOLAP)。
  • HOLAP能把MOLAP和ROLAP两种结构的优点结合起来。迄今为止,对HOLAP还没有一个正式的定义。但很明显,HOLAP结构不应该是MOLAP与ROLAP结构的简单组合,而是这两种结构技术优点的有机结合,能满足用户各种复杂的分析请求。