存储与数据库 | 青训营笔记

90 阅读2分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 11 天

一、目录

本节课主要分为三个部分:

1.存储与数据库简介

2.主流产品剖析

3.新技术演进

二、存储与数据库简介

存储系统

定义:提供读写与控制类接口,能够安全有效地把数据持久化的软件。

特点:性能敏感、容易受硬件影响、代码复杂。

数据库系统

定义:由数据库及其管理软件组成的系统。

特点:

1.关系型数据库结构化数据友好,支持事务,支持复杂查询语言。

2.非关系型数据库半结构化数据友好,可能支持事务和复杂的查询语言。

三、主流产品剖析

单机存储产品

本地文件系统:文件系统的管理单元为文件,需要提供接口。

Key-Value存储:如RocksDB。

分布式存储

定义:在单机上实现分布式协议,涉及大量网络交互。

HDFS:支持海量数据存储,高容错性,弱POSIX语义,性价比高。

Ceph:一切皆对象,数据写入采用主备复制模型,数据分布模型采用CRUSH算法。

单机数据库

定义:单个计算机结点上的数据库系统。事务在单机内执行,也可能通过网络交互实现分布式事务。

实例:

关系型数据库:Oracle、MySQL、PostgreSQL。

非关系型数据库:MongoDB、Redis、Elasticsearch。

分布式数据库

定义:分布式数据库系统是相对于集中式数据库系统而言的,是将数据库技术与网络技术相结合的产物。分布式数据库(Distributed DataBase,DDB)比较确切的定义是:分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力,成为场地自治,它可以执行局部应用,同时,每个结点也能通过网络通信子系统执行全局应用。

优点:解决容量问题、解决弹性问题、解决性价比问题。

四、新技术演进

SPDK

人工智能

新硬件加速