存储的本质 | 青训营笔记

34 阅读2分钟

存储的本质 | 青训营笔记

这是我参与「第五届青训营 」笔记创作活动的第17天

数据的流动

image-20230210134458401

image-20230210134508372

存储系统

定义

提供了读写、控制类接口,能够安全有效地将数据持久化的软件,称为存储系统

系统特点

  • 性能敏感:作为后端软件的基座
  • 容易受到硬件的影响:存储系统软件架构与硬件密切相关
  • 代码的复杂性:“简单”(保证高效),“复杂”(保证逻辑和有效)

数据如何从应用到存储介质

image-20230210134841737

  • 缓存:贯穿整个存储体系,起着至关重要的作用
  • 拷贝:消耗高,应当尽量减少
  • 同一抽象接口:对应底层的硬件设备类型的复杂

RAID技术

RAID:廉价冗余磁盘整列

image-20230210135217071

image-20230210135224667

数据库

  • 关系型数据库是存储系统,但是在存储之外,有发展出了其他能力
    • 结构化数据友好
    • 支持事务(ACID)
    • 支持复杂查询语句
  • 非关系数据库也是存储系统,但是一般不要求严格的结构化
    • 半结构化数据友好
    • 可能支持事务(与各非关系型数据库的实现有关)
    • 可能支持复杂查询语句(与各非关系型数据库的实现有关)

数据库与经典存储

结构化数据管理

image-20230210135653334

事务能力

image-20230210135713350

复杂查询能力

image-20230210135735376

主流产品剖析

单机存储

指的是单个计算机节点上的存储软件系统,一边拿不涉及网络交互

  • 本地文件系统:

    image-20230210135912846

  • key-value存储 image-20230210135941534

分布式存储

指的是在单机存储基础上实现了分布式协议,涉及大量网络交互

  • HDFS image-20230210140109578
  • Ceph image-20230210140125769

单机数据库

指的是单个计算机节点上的数据库系统,事务在单机内执行,也可能通过网络交互实现分布式事务

  • 关系型数据库 image-20230210140249188 image-20230210140309611

  • 非关系型数据库 image-20230210140329966

    image-20230210140601134

从单机到分布式数据库

  • 解决了容量问题
  • 解决了弹性问题
  • 解决了性价比问题

分布式数据库亟待解决的问题

  • 从单写到多写
  • 从磁盘弹性到内存弹性
  • 分布式事务的优化

新技术的演进方向

软件架构变更

image-20230210140756739

AI增强

ai在存储方面的落地和增强

image-20230210140819104

新硬件革命

硬件技术的演进

image-20230210140838640

引用参考

‌‍‬⁣⁤‍⁣‬‌⁣⁣⁢‌‍‬‬⁤⁡‌⁣‬⁤⁣⁢⁡⁤‬‌⁢‍‍⁡⁢⁣⁣带你认识存储 & 数据库 .pptx - 飞书云文档 (feishu.cn)

存储与数据库的新技术演进 - 掘金 (juejin.cn)

【后端专场 学习资料六】第五届字节跳动青训营 - 掘金 (juejin.cn)