ClickHouse列存储 | 青训营笔记

68 阅读2分钟

这是我参与「 第五届青训营 」伴学笔记创作活动的第 11 天

今天学习了ClickHouse存储的一些相关知识,这是我第一次接触这个名词,以下就是我的学习笔记。

一、数据库基本概念

数据库是结构化信息或数据的有序集合.一般以电子形式存储在计算机系统中。通常由数据库管理系统(DBMS)来控制。在现实中.数据、DBMS及关联应用─起被称为数据库系统.通常简称为数据库。

数据库的类型

  1. 关系数据库:关系型数据库是把数据以表的形式进行储存,然后再各个表之间建立关系,通过这些表之间的关系来操作不同表之间的数据。
  2. 非关系数据库:NoSQL或非关系数据库,支持存储和操作非结构化及半结构化数据。相比于关系型数据库,NoSQL没有固定的表结构,且数据之间不存在表与表之间的关系,数据之间可以是独立的。
  3. 单机数据库:在一台计算机上完成数据的存储和查询的数据库系统。
  4. 分布式数据库:分布式数据库由位于不同站点的两个或多个文件组成。数据库可以存储在多台计算机上,位于同一个物理位置,或分散在不同的网络上。
  5. OLTP数据库: OLTP (Online transactional processing)数据库是一种高速分析数据库,专为多个用户执行大量事务而设计。
  6. OLAP数据库:OLAP(Online analytical processing)数据库旨在同时分析多个数据维度,帮助团队更好地理解其数据中的复杂关系

SQL

定义

SQL是一种编程语言,目前几乎所有的关系数据库都使用SQL编程语言来查询、操作和定义数据,进行数据访问控制。 对于SQL语句语法,大家应该都知道,就不介绍了。

优点

标准化、高度非过程化、语言简洁、易学易用。

列式存储的优点

数据压缩

-数据压缩可以使读的数据量更少,在Io密集型计算中获得更大的性能优势-相同类型压缩效率更高

-排序之后压缩效率更高

-可以针对不同类型使用不同的压缩算法