存储系统与数据库入门

70 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 12 天

存储 & 数据库简介

经典案例

一条数据从产生,到数据流动,最后持久化的全生命周期

数据的产生

小明注册一个账号,填写好了数据,按下了注册按钮后,数据就从无到有地产生了,并十分快速的向后端服务器飞奔而去。

数据的流动

image-20230212205320348

数据从后端服务器存储到数据库后,就开始了持久化,并且其他系统也能访问到该数据

数据的持久化

image-20230212205449257

真正存储到硬件上,才真正做到数据的持久化

存储系统

什么是存储系统

一个提供了读写、控制类接口,能够安全有效的把数据持久化的软件,就可以称为存储系统

存储系统的特点

  • 作为后端软件的底座,性能必须顶级
  • 存储系统软件架构,容易受硬件影响
  • 存储系统代码,既简单有复杂

存储器层级结构

image-20230212210205007

数据从应用到存储介质

image-20230212210325744

  • 缓存很重要,贯穿整个存储体系
  • 拷贝很昂贵,需尽量减少
  • 硬件设备五花八门,需要统一的接入口

RAID技术

RAID 是由多个独立的高性能磁盘驱动器组成的磁盘子系统,从而提供比单个磁盘更高的存储性能和数据冗余的技术。 RAID 是一类多磁盘管理技术,其向主机环境提供了成本适中、数据可靠性高的高性能存储。

image-20230212210714223

数据库

image-20230212210940360

什么是关系

image-20230212211010222

关系型数据库的特点

  • 结构化数据友好
  • 支持事务(ACID)
  • 支持复杂查询语言

非关系型数据库的特点

  • 半结构化数据友好
  • 可能支持事务(ACID)
  • 可能支持复杂查询语言

结构化的数据管理

image-20230212211317444

事务能力

原子性(Atomicity):事务是一个不可再分割的工作单元,事务中的操作要么都发生,要么都不发生。

一致性(Consistency):数据库事务不能破坏关系数据的完整性以及业务逻辑上的一致性。

隔离性(Isolation):多个事务并发访问时,事务之间是隔离的,一个事务不应该影响其它事务运行效果。

持久性(Durability):在事务完成以后,该事务所对数据库所做的更改便持久的保存在数据库之中,并不会被回滚。

数据库的查询能力

image-20230212211454762

数据库使得查询变得统一,对任意的数据共用一套查询逻辑

主流存储产品

单机存储

单个计算机结点上的存储软件系统,一般不涉及网络交互

image-20230212211805461

本地文件系统

Linux哲学:一切皆文件

image-20230212211914747

Key-Value存储

key是你的名字,value是你的内涵

image-20230212211950148

分布式存储

在单机存储基础上实现了分布式协议,涉及大量网络交互

HDFS

大数据时代的基石

image-20230212212341286

Ceph

开源分布式存储系统里的万金油

image-20230212212405861

单机数据库

在单个计算机节点上的数据库系统

事务在单机内执行,也可通过网络交互实现分布式事务

关系型数据库

image-20230212212627308

非关系型数据库

image-20230212212809438

分布式数据库

  • 解决容量问题

    image-20230212212901541

  • 解决弹性问题

    image-20230212212931408

  • 解决性价比问题