存储与数据库|青训营笔记

67 阅读3分钟

这是我参与「第五届青训营」笔记创作活动的第13天。

  • 案例
  1. 数据的产生
  2. 数据的流动
  3. 数据的持久化(1)数据的合理性(2)修改内存(3)写入存储介质 -问题:1.数据库怎么保证数据不丢?2. 数据库怎么处理多人同时修改的问题?3. 为什么用数据库,除了数据库还能存到别的存储系统吗,4. 数据库只能处理结构化数据吗?5. 有哪此操作数据库的方式,要用什么编程语言?

存储&数据库简介

存储系统一 系统概览

  • 定义: 一个提供了读写、控制类接口,能够安全有效地把数据持久化的软件,就可以称为存储系统

  • 系统特点:1. 作为后端软件的底座,性能敏感 2.存储系统软件架构,容易受硬件影响 3.存储系统代码,既“简单”又“复杂。

    • RAID技术 R(edundant) A(rrav) of I(nexpensive) D(isks)

      • 高性能 /高性价比/高可靠性
        1. 单块大容量磁盘的价格 >多块小容量磁盘
        1. 单块磁盘的写入性能<多块磁盘的并发写入性能
        1. 单块磁盘的容错能力有限,不够安全
    • RAID O

      1. 多块磁盘简单组合
      2. 数据条带化存储,提高磁無带宽
      3. 没有额外的容错设计
    • RAID 1

      1. 一块磁盘对应一块额外镜像盘
      2. 直实空间利用密仅50%
      3. 容错能力强
    • RAID 0+1

      1. LA TRAID O FO RAID 1
      2. 真实空间利用率仅50%
      3. 容错能力强,写入带宽好

数据库

  1. 关系型数据库: 关系型数据库是存储系统,但是在存储之外,又发展出其他能力

    • 结构化数据友好
    • 支持事务 (ACID)
    • 支持复杂查询语言
  2. 非关系型数据库 :非关系型数据库也是存储系统,但是一般不要求严格的结构化

    • 半结构化数据友好
    • 可能支持事务 (ACID)
    • 可能支持复杂查询语言
  3. 事务:凸显出数据库支持「事务」的优越性 事务具有:

  • A(tomicity),事务内的操作要么全做,要么不做
  • C(onsistency),事务执行前后,数据状态是一致的
  • I(solation),可以隔离多个并发事务,避免影响
  • D(urability),事务一旦提交成功,数据保证持久性

总结

  1. 存储系统

    • 块存储:存储软件栈里的底层系统,接口过于朴素
    • 文件存備:日常使用最广泛的存储系统,接口十分友好,实现五花八门
    • 对象存储:公有云上的王牌产品,immutable语义加持
    • key-value存储:形式最灵活,存在大量的开源/黑盒产品
  2. 数据库系统

    • 关系型数据库:基于关系和关系代数构建的,一般支持事务和SQL 访问,使用体验友好的存储产品
    • 非关系型数据库:结构灵活,访问方式灵活,对不同场景有不同的针对性产品
  3. 分布式架构

    • 数据分布策略:决定了数据怎么分布到集群里的多个物理节点,是否均匀,是否能做到高性能
    • 数据复制协议:影响io路径的性能、机器故障场景的处理方式
    • 分布式事务算法:多个数据库节点协同保障一个事务的ACID特性的算法,通常基于2pc的思想设计