存储的本质——状态 | 青训营笔记
这是我参与「第五届青训营 」伴学笔记创作活动的第 15 天,主要记录相关的知识点。
本堂课重点内容
- 存储 & 数据库简介
- 主流产品剖析
- 新技术
存储 & 数据库简介
存储系统:一个提供了存储、控制接口,能够安全有效把数据持久化保存的软件。
- 存储系统特点:性能敏感,受硬件影响,代码“简单”且“复杂”
- 存储器层级结构:缓存、内存等
- 单机存储:使用缓存,减少拷贝
- RAID技术
数据库系统
- 关系型数据库特点:关系代数理论
- 非关系型数据库特点:不要求数据存储严格的结构化
- 数据库 vs 经典存储:数据库具有结构化管理、事务(ACID)的能力,提供了复杂查询的能力
- 数据库使用方式:SQL
主流产品剖析
单机存储:单个计算机节点上的软件存储系统,一般不会涉及到网络
- 单机文件系统:比如Linux的本地文件系统,
- 单机key-value存储:使用类似键值对的方式进行存储,数据结构有:LSM-Tree,通过get/put插入,获取数据
分布式存储产品:在单机存储系统的基础上实现了分布式协议,有大量涉及到网络
- HDFS:分布式文件系统,大数据基石,高吞吐量,支持海量数据存储,高容错性,性价比高
- Ceph:一切皆对象,数据采用主备复制模型
单机数据库产品
- 关系型数据库 —— PG、MySQL
- 非关系型数据库 —— ES、MongoDB、Redis
- Elasticsearch使用案例
分布式数据库优势:解决了单机存储系统的容量问题,弹性问题和性价比问题。
分布式数据库
- 问题与挑战:单写与多写,分布式事务优化
- 解决方案
新技术演进
- SPDK
- 人工智能
- 新硬件加速
个人总结
本次课程主要学习了:
- 存储本质