这是我参与「第五届青训营」笔记创作活动的第13天。
- 案例
- 数据的产生
- 数据的流动
- 数据的持久化(1)数据的合理性(2)修改内存(3)写入存储介质 -问题:1.数据库怎么保证数据不丢?2. 数据库怎么处理多人同时修改的问题?3. 为什么用数据库,除了数据库还能存到别的存储系统吗,4. 数据库只能处理结构化数据吗?5. 有哪此操作数据库的方式,要用什么编程语言?
存储&数据库简介
存储系统一 系统概览
-
定义: 一个提供了读写、控制类接口,能够安全有效地把数据持久化的软件,就可以称为存储系统
-
系统特点:1. 作为后端软件的底座,性能敏感 2.存储系统软件架构,容易受硬件影响 3.存储系统代码,既“简单”又“复杂。
-
RAID技术 R(edundant) A(rrav) of I(nexpensive) D(isks)
- 高性能 /高性价比/高可靠性
-
- 单块大容量磁盘的价格 >多块小容量磁盘
-
- 单块磁盘的写入性能<多块磁盘的并发写入性能
-
- 单块磁盘的容错能力有限,不够安全
-
RAID O
- 多块磁盘简单组合
- 数据条带化存储,提高磁無带宽
- 没有额外的容错设计
-
RAID 1
- 一块磁盘对应一块额外镜像盘
- 直实空间利用密仅50%
- 容错能力强
-
RAID 0+1
- LA TRAID O FO RAID 1
- 真实空间利用率仅50%
- 容错能力强,写入带宽好
-
数据库
-
关系型数据库: 关系型数据库是存储系统,但是在存储之外,又发展出其他能力
- 结构化数据友好
- 支持事务 (ACID)
- 支持复杂查询语言
-
非关系型数据库 :非关系型数据库也是存储系统,但是一般不要求严格的结构化
- 半结构化数据友好
- 可能支持事务 (ACID)
- 可能支持复杂查询语言
-
事务:凸显出数据库支持「事务」的优越性 事务具有:
- A(tomicity),事务内的操作要么全做,要么不做
- C(onsistency),事务执行前后,数据状态是一致的
- I(solation),可以隔离多个并发事务,避免影响
- D(urability),事务一旦提交成功,数据保证持久性
总结
-
存储系统
- 块存储:存储软件栈里的底层系统,接口过于朴素
- 文件存備:日常使用最广泛的存储系统,接口十分友好,实现五花八门
- 对象存储:公有云上的王牌产品,immutable语义加持
- key-value存储:形式最灵活,存在大量的开源/黑盒产品
-
数据库系统
- 关系型数据库:基于关系和关系代数构建的,一般支持事务和SQL 访问,使用体验友好的存储产品
- 非关系型数据库:结构灵活,访问方式灵活,对不同场景有不同的针对性产品
-
分布式架构
- 数据分布策略:决定了数据怎么分布到集群里的多个物理节点,是否均匀,是否能做到高性能
- 数据复制协议:影响io路径的性能、机器故障场景的处理方式
- 分布式事务算法:多个数据库节点协同保障一个事务的ACID特性的算法,通常基于2pc的思想设计