存储&数据库 | 青训营笔记

78 阅读2分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 15 天

存储系统——系统概览

什么是存储系统?

一个提供了读写、控制类接口,能够安全有效地把数据持久化的软件,就可以称为存储系统

存储系统——系统特点

  1. 作为后端软件的底座,性能敏感
  2. 存储系统软件架构,容易受硬件影响
  3. 存储系统代码,既“简单”又“复杂”

存储系统——存储器层级结构

image.png

存储系统——RAID技术

Q:单机存储系统怎么做到高性能/高性价比/高可靠性?

A:R(edundant) A(rray) of I(nexpensive) D(isks)

RAID出现的背景:

  • 单块大容量磁盘的价格 > 多块小容量磁盘
  • 单块磁盘的写入性能 < 多块磁盘的并发写入性能
  • 单块磁盘的容错能力有限,不够安全

数据库——概览

关系=集合=任意元素组成的若干有序偶对反映了事物间的关系

关系代数=对关系作运算的抽象查询语言

SQL=一种DSL=方便人类阅读的关系代数表达形式

关系型数据库是存储系统,但是在存储之外,又发展出其他能力

非关系型数据库也是存储系统,但是一般不要求严格的结构化

单机存储——概览

单机存储=单个计算机节点上的存储软件系统,一般不涉及网络交互

单机存储——本地文件系统

Linux经典哲学:一切皆文件

文件系统的管理单元:文件

文件系统接口:文件系统繁多,如Ext2/3/4,sysfs,rootfs等,但都遵循VFS的统一抽象接口

Linux文件系统的两大数据结构:Index Node & Directory Entry

Index Node:记录文件元数据,如id、大小、权限、磁盘位置等。inode是一个文件的唯一标识,会被存储到磁盘上,inode的总数在格式化文件系统时就固定了

Directory Entry:记录文件名、inode指针、层级关系(parent)等。dentry是内存结构,与inode的关系是N:1(harlink的实现)