这是我参与「第五届青训营 」笔记创作活动的第12天
「带你认识存储的本质 - 状态」|青训营笔记
1.经典案例
数据的持久化
1.校验数据的合法性
2.修改内存
3.写入存储介质
一些问题:
2.存储&数据库介绍
什么是存储系统:
一个提供了读写、控制类接口,并且能够安全有效地把数据持久化的软件,就可以称为存储系统
存储系统的特点
存储系统——数据怎么从应用到存储介质
RAID技术
关系型数据库&&非关系型数据库
关系=集合:反映了事物间的关系
关系代数:对关系作运算的抽象查询语言
SQL=一种DSL=方便人类阅读的关系代数表达形式
关系型数据库——就是存储系统
对结构化数据很友好
支持事务
非关系型数据库——也是存储系统
一般不要求数据有严格的结构化
关系型数据库支持事务能力
事务具有以下特性——ACID
3.主流产品剖析
单机存储
1.本地文件系统
2.key-value存储系统
本地文件系统
Key——value
常见数据结构:LSM——Tree,某种程度上牺牲读性能,追求写入性能
分布式存储系统
在单机的基础上实现了分布式协议
分布式文件系统——HDFS(大数据时代的基石)
特点:
1.支持海量数据存储
2.高容错
3.弱POSIX语义
分布式对象存储——Ceph(开源分布式存储系统中的万金油)
一切皆对象
数据分布模型采用CRUSH算法
关系型数据库
PostgreSQL关键数据结构:B-树,B+树,LRU List
关系型数据库的一些通用组件
关键磁盘数据结构:RedoLog和Page
非关系型数据库
不会使用SQL进行交互,没有准则