三、主流产品剖析

单机存储

单机存储🟰耽搁就三级节点上的存储软件系统，一般不涉及网络交互
Linux经典哲学：一切皆文件
文件系统的管理单元：文件
文件系统接口：文件系统繁多，但都遵循VFS的统一抽象接口
Linux文件系统的两大数据结构：Index Node & Directory Entry
Index Node 记录文件元数据
inode是一个文件的唯一标识，会被存储到磁盘上inode的总数在格式化文件系统时就固定了
Directory Entry记录文件名、inode指针、层级关系等
dentry是内存结构，与inode的关系是N：1（hardlink的实现）

键值对key- value

常见使用方式：put(k,v) & get(k)
常见数据结构：LSM-Tree，某种程度上牺牲读性能，追求写入性能
拳头产品：RocksDB

分布式存储🟰在单机存储基础上实现分布式协议，涉及大量网络交互

分布式文件系统分布式对象存储

HDFS：堪称大数据时代的基石

时代背景：专用的高级硬件很贵，同时数据存量很大，要求超高吞吐

HOFS核心特点：

支持海量数据存储
高容错性
弱POSIX语义
使用普通x86服务器，性价比高

Ceph：开源分布式存储系统里的万金油

Ceph的核心特点：一套系统支持对象借口、块接口、文件接口，但是一切皆对象

数据写入采用主备复制模型

数据分布模型采用CRUSH算法（核心思想哈希+权重+随机抽签）

单机数据库🟰单个计算机节点上的数据库系统

事务在单机内执行，也可能通过网络交互实现分布式事务

关系型数据库
非关系型数据库

商业产品Oracle称王，开源产品MySQL&PostgreSQL称霸

MongoDB、Redis、Elasticsearch三足鼎立
关系型数据库一般直接使用SQL交互，而非关系型数据库交互方式各不相同
非关系型数据库的数据结构千奇百怪，没有关系的约束后，schema相对灵活
不管是否关系型数据库，大家都在尝试支持SQL（子集）和“事务”
Elasticsearch使用案例
跟RDBMS相比，ES天然能做「模糊搜索」，还能自动算出关联程度

分布式存储

单机数据库遇到了哪些问题&挑战，需要我们引入分布式架构来解决？

容量
弹性
性价比

解决容量问题

单点容量有限，受硬件限制
存储节点池化，动态扩缩容

解决弹性问题

CPU资源紧张
扩容，访问新数据库
缩容成功，访问新数据库
缩容Disk问题难以解决

解决性价比问题

要写500GB数据，容量不够，CPU利用率仅20%
满足了容量需要，但是CPU浪费更严重
使用共享存储池，不需要扩CPU

单写VS多写

从磁盘弹性到内存弹性
分布式事务优化

四、新技术演进（拓展视野）

软件架构变更 Bypass Os kernel

AI增强智能存储格式转换新硬件革命

存储介质变更
计算单元变更
网络硬件变更

Bypass OS kernel 已经成为一种趋势

SPDK

SPDK 存储性能开发套件(Storage Performance Development Kit ）—针对于支持nvmeQ协议的SSD设备。SPDK是一种高性能的解决方案。

AI & Storage

AI领域相关技术，如Machine Learning在很多领域：如推荐、风控、视觉领域证明了有效性

在Storage领域，AI能给我们带来什么改变？

数据管理自动化：AI可以自动管理数据，包括数据的分类、标记、归档和检索等操作，从而减少人为管理的工作量和错误率。
数据存储的自动优化：AI可以分析存储数据的使用情况和需求，然后自动进行存储空间的分配、压缩、扩展和优化，提高存储的效率和性能，降低存储的成本。
数据安全的保障：AI可以自动进行数据的备份、加密、恢复和安全检测等操作，有效减少数据丢失、数据泄露和数据被攻击的风险，增强数据的安全性。
数据治理和分析：AI可以帮助存储数据的分析、挖掘和利用，从中提取出有价值的信息和知识，为企业决策和发展提供支持和指导。

综上所述，AI在Storage领域中可以带来自动化、智能化、高效化和安全化等多方面的改变，为存储应用和数据管理提供更高水平和更广阔的发展空间。

高性能硬件

RDMA网络

传统的网络协议栈，需要基于多层网络协议吹数据包，存在用户态&内核态的切换，足够通用但性能不是最佳
RDMA是kernel bypass的流派，不经过传统的网络协议栈，可以把用户态虚拟内存映射给网卡，减少拷贝开销，减少CPU开销

Persistent Memory

在NVMe SSD和Main Memory间又一种全新的存储产品：Persistent Memory
- IO时延介于SSD和Memory之间，约百纳秒量级
- 可以用作易失性内存（memory mode），也可以用作持久化介质（app- direct）

可编程交换机

P4 Switch，配有编译器、计算单元、DRAM，可以在交换机层对网络包做计算逻辑。在数据库场景下，可以实现缓存一致性协议等

CPU/GPU/DPU

CPU：从multi-core走向many-core
GPU：强大的算力＆越来越大的显存空间
DPU：异构计算，减轻CPU的wotkload

五、总结

存储系统

块存储：存储软件栈里的底层系统，接口过于朴素
文件存储：日常使用最广泛的存储系统，接口十分友好，实现五花八门

对象存储：公有云上的王牌产品，immutable语义加持

key-value存储：形式最灵活，存在大量的开源/ 黑盒产品

数据库系统

关系型数据库：基于关系和关系代数构建的，一般支持事务和SQL访问，使用体验友好的存储产品
非关系型数据库：结构灵活，针对不同场景有不同的针对性产品

分布式结构

数据分布策略：决定了数据怎么分布到集群里的多个物理节点，是否均匀，是否能做到高性能
数据复制协议：影响IO路径的性能、机器故障场景的处理方式
分布式事务算法：多个数据库节点协同保障一个事务的ACID特性的算法，通常基于2pc的思想设计

带你认识存储&数据库（二）｜青训营笔记