存储&数据库 | 青训营笔记

78 阅读3分钟

这是我参与「第五届青训营」伴学笔记创作活动的第 15 天。

这节课主要讲述了与数据库和存储系统相关的知识。

存储系统

一个提供了读写、控制类接口,能够安全有效地把数据持久化的软件,就可以称为存储系统。

系统特点

  • 作为后端软件的底座,性能敏感 
  • 存储系统软件架构,容易受硬件影响 
  • 存储系统代码,既“简单”又“复杂”

存储器层级结构

单机存储栈

  • [缓存]很重要,贯穿整个存储体系 
  • [拷贝] 很昂贵,应该尽量减少 
  • 硬件设备五花八门,需要有抽象统一的接入层

RAID技术

R(edundant) A(rray) of I(nexpensive) D(isks) 

RAID出现的背景

  • 单块大容量磁盘的价格 >多块小容量磁盘 
  • 单块磁盘的写入性能< 多块磁盘的并发写入性能 
  • 单块磁盘的容错能力有限,不够安全

RAID 0

  • 多块磁盘简单组合 
  • 数据条带化存储,提高磁盘带宽 
  • 没有额外的容错设计 

RAID 1

  • 一块磁盘对应一块额外镜像盘 
  • 真实空间利用率仅50% 
  • 容错能力强 

RAID 0 + 1

  • 结合了RAID 0 和 RAID 1 
  • 真实空间利用率仅50% 
  • 容错能力强,写入带宽好

数据库系统

数据库系统分为关系型数据库和非关系型数据库。

关系(Relation)是什么?

  • Edgar.F.Codd于1970年提出关系模型
  • 关系 = 集合 = 任意元素组成的若干有序偶对反应了事物间的关系
  • 关系代数 =对关系作运算的抽象查询语言交、并、笛卡尔积...
  • SQL = 一种DSL = 方便人类阅读的关系代数表达形式

关系型数据库特点

关系型数据库是存储系统,但是在存储之外,又发展出其他能力。

  • 结构化数据友好
  • 支持事务(ACID)
  • 支持复杂查询语言

非关系型数据库特点

非关系型数据库也是存储系统,但是一般不要求严格的结构化 

  • 半结构化数据友好 
  • 可能支持事务(ACID)
  • 可能支持复杂查询语言

数据库优势

结构化数据管理:写入关系型数据库以表形式管理。

事务能力

  • A(tomicity):事务内的操作要么全做,要么不做。
  • C(onsistency):事务执行前后,数据状态是一致的。
  • l(solation):可以隔离多个并发事务,避免影响。

D(urability):事务一旦提交成功,数据保证持久性。

复杂查询能力

数据库使用方式

SQL

主流产品刨析

单机存储产品

单机存储 = 单个计算机节点上的存储软件系统,一般不涉及网络交互

  • 单机文件系统
  • 单机key-value存储

分布式存储产品

  • HDFS
  • Ceph

单机数据库产品

  • 关系型数据库 —— PG、MySQL
  • 非关系型数据库 —— ES、MongoDB、Redis
  • Elasticsearch使用案例

分布式数据库产品

  • 问题与挑战

  • 解决方案

新技术演进

  • SPDK

  • 人工智能

  • 新硬件加速