这是我参与「第五届青训营 」伴学笔记创作活动的第 11 天
一、目录
本节课主要分为三个部分:
1.存储与数据库简介
2.主流产品剖析
3.新技术演进
二、存储与数据库简介
存储系统
定义:提供读写与控制类接口,能够安全有效地把数据持久化的软件。
特点:性能敏感、容易受硬件影响、代码复杂。
数据库系统
定义:由数据库及其管理软件组成的系统。
特点:
1.关系型数据库结构化数据友好,支持事务,支持复杂查询语言。
2.非关系型数据库半结构化数据友好,可能支持事务和复杂的查询语言。
三、主流产品剖析
单机存储产品
本地文件系统:文件系统的管理单元为文件,需要提供接口。
Key-Value存储:如RocksDB。
分布式存储
定义:在单机上实现分布式协议,涉及大量网络交互。
HDFS:支持海量数据存储,高容错性,弱POSIX语义,性价比高。
Ceph:一切皆对象,数据写入采用主备复制模型,数据分布模型采用CRUSH算法。
单机数据库
定义:单个计算机结点上的数据库系统。事务在单机内执行,也可能通过网络交互实现分布式事务。
实例:
关系型数据库:Oracle、MySQL、PostgreSQL。
非关系型数据库:MongoDB、Redis、Elasticsearch。
分布式数据库
定义:分布式数据库系统是相对于集中式数据库系统而言的,是将数据库技术与网络技术相结合的产物。分布式数据库(Distributed DataBase,DDB)比较确切的定义是:分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力,成为场地自治,它可以执行局部应用,同时,每个结点也能通过网络通信子系统执行全局应用。
优点:解决容量问题、解决弹性问题、解决性价比问题。