- 在了解数据库之前我们先来了解什么是存储系统。
存储系统就是一个提供了读写、控制类接口,能够安全有效的把数据持久化的软件。
简单概括基本特点:
作为后端软件的底座,性能敏感
储存系统软件架构,容易受硬件影响
储存系统代码既“简单”又“复杂“
存储系统就是关系型数据库。(非关系型数据库也是存储系统但一般不要求严格的格式化)
-
主流产品大致分为五大类:
单机存储 分布式存储 单机关系型数据库 单机非关系型数据库 分布式数据库
单机存储——本地文件系统
key-value存储
常见使用方式: put(k、v)get(k)
常见数据结构:LSM-Tree从某种程度上牺牲读技能,提高写入技能。
拳头产品:RocksDB
分布式存储
在单机存储的基础上实现了分布式协议,涉及大量网络交互。 大致分两大类型
- HDFS
时代背景:专用的高级硬件很贵,同时数据存量很大,要求超高吞吐。
核心特点:支持海量数据存储;高容错性;弱POSIX语义;使用普通x86服务器,性价比高。
- Ceph
开源分布式存储的万金油
核心特点:一套系统支持对象接口、块接口、文件接口但是一切皆对象; 数据写入采用主备复制模型;数据分布模型采用CRUSH算法。
单机数据库——关系型数据库
商业产品Oracle称王,开源产品MySOL & PostgreSOL称霸
单机数据库——非关系型数据库
商业产品Oracle称王,开源产品MySOL & PostgreSOL称霸
分布式数据库
解决容量问题
单点容量有限,受硬件限制
存储节点池化,动态扩缩容
解决弹性问题
解决性价比问题
当前为止,需求拓展,软件结构变更,AI增强,新硬件革命,新技术在推进
Bypass Os kernel已经成为一种趋势