存储的本质——状态 | 青训营笔记

57 阅读2分钟

存储的本质——状态 | 青训营笔记

这是我参与「第五届青训营 」伴学笔记创作活动的第 15 天,主要记录相关的知识点。

本堂课重点内容

  • 存储 & 数据库简介
  • 主流产品剖析
  • 新技术

存储 & 数据库简介

存储系统:一个提供了存储、控制接口,能够安全有效把数据持久化保存的软件。

  • 存储系统特点:性能敏感,受硬件影响,代码“简单”且“复杂”
  • 存储器层级结构:缓存、内存等
  • 单机存储:使用缓存,减少拷贝
  • RAID技术

数据库系统

  • 关系型数据库特点:关系代数理论
  • 非关系型数据库特点:不要求数据存储严格的结构化
  • 数据库 vs 经典存储:数据库具有结构化管理、事务(ACID)的能力,提供了复杂查询的能力
  • 数据库使用方式:SQL

主流产品剖析

单机存储:单个计算机节点上的软件存储系统,一般不会涉及到网络

  • 单机文件系统:比如Linux的本地文件系统,
  • 单机key-value存储:使用类似键值对的方式进行存储,数据结构有:LSM-Tree,通过get/put插入,获取数据

分布式存储产品:在单机存储系统的基础上实现了分布式协议,有大量涉及到网络

  • HDFS:分布式文件系统,大数据基石,高吞吐量,支持海量数据存储,高容错性,性价比高
  • Ceph:一切皆对象,数据采用主备复制模型

单机数据库产品

  • 关系型数据库 —— PG、MySQL
  • 非关系型数据库 —— ES、MongoDB、Redis
  • Elasticsearch使用案例

分布式数据库优势:解决了单机存储系统的容量问题,弹性问题和性价比问题。

分布式数据库

  • 问题与挑战:单写与多写,分布式事务优化
  • 解决方案

新技术演进

  • SPDK
  • 人工智能
  • 新硬件加速

个人总结

本次课程主要学习了:

  • 存储本质