《数据仓库设计》笔记day01

146 阅读2分钟
    1、什么是数据库
  • 数据库(DataBase)是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。【Mysql 、Oracle、SQL Server】
  • 数据库是长期存储在计算机内、有组织的、可共享的数据集合。数据库中的额数据指的是是一定的数据模型组织、描述和储存在一起、具有尽可能小的冗余度较高的数据独立性易扩展性的特点并可在一定范围内为多个用户共享。
      2、什么是数据仓库

  • 数据仓库是面向主题的、集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。

  • 面向主题:在较高层次上将企业信息系统的数据综合归并进行分析利用的抽象概念。每个主题基本上对应一个相应的分析领域。
  • 集成的:企业级数据,同时数据要保持一致性、完整性、有效性、精确性。
  • 稳定的:从某个时间段来看是保持不变的,没有更新操作、删除操作,以查询分析为主
  • 变化的:反映历史变化。

      3、数据仓库和数据库的对比

数据范围:

  • 数据仓库存储历史的、完整的、反映历史变化的 
  • 数据库 存储当前状态数据
数据变化:

  • 数据仓库可添加、无删除、无变更、反应历史变化
  • 数据库支持频繁的增、删、改、查操作
应用场景:
  • 数据仓库面向分析、支持战略 决策
  • 数据库面向业务交易流程
设计理论:

  • 数据仓库违范式、适当冗余
  • 数据库遵循范式(第一、二、三等范式)、避免冗余
处理量
  • 数据仓库非频繁、大批量、高吞吐、有延迟
  • 数据库频繁、小批次、高并发、低延迟

面向业务的数据库常称为OLTP、面向分析的数据仓库称为OLAP