存储的本质 | 青训营笔记
这是我参与「第五届青训营 」笔记创作活动的第17天
数据的流动
存储系统
定义
提供了读写、控制类接口,能够安全有效地将数据持久化的软件,称为存储系统
系统特点
- 性能敏感:作为后端软件的基座
- 容易受到硬件的影响:存储系统软件架构与硬件密切相关
- 代码的复杂性:“简单”(保证高效),“复杂”(保证逻辑和有效)
数据如何从应用到存储介质
- 缓存:贯穿整个存储体系,起着至关重要的作用
- 拷贝:消耗高,应当尽量减少
- 同一抽象接口:对应底层的硬件设备类型的复杂
RAID技术
RAID:廉价冗余磁盘整列
数据库
- 关系型数据库是存储系统,但是在存储之外,有发展出了其他能力
- 结构化数据友好
- 支持事务(ACID)
- 支持复杂查询语句
- 非关系数据库也是存储系统,但是一般不要求严格的结构化
- 半结构化数据友好
- 可能支持事务(与各非关系型数据库的实现有关)
- 可能支持复杂查询语句(与各非关系型数据库的实现有关)
数据库与经典存储
结构化数据管理
事务能力
复杂查询能力
主流产品剖析
单机存储
指的是单个计算机节点上的存储软件系统,一边拿不涉及网络交互
-
本地文件系统:
-
key-value存储
分布式存储
指的是在单机存储基础上实现了分布式协议,涉及大量网络交互
- HDFS
- Ceph
单机数据库
指的是单个计算机节点上的数据库系统,事务在单机内执行,也可能通过网络交互实现分布式事务
-
关系型数据库
-
非关系型数据库
从单机到分布式数据库
- 解决了容量问题
- 解决了弹性问题
- 解决了性价比问题
分布式数据库亟待解决的问题
- 从单写到多写
- 从磁盘弹性到内存弹性
- 分布式事务的优化
新技术的演进方向
软件架构变更
AI增强
ai在存储方面的落地和增强
新硬件革命
硬件技术的演进
引用参考
带你认识存储 & 数据库 .pptx - 飞书云文档 (feishu.cn)