这是我参与「第五届青训营 」伴学笔记创作活动的第 12 天
存储 & 数据库简介
经典案例
一条数据从产生,到数据流动,最后持久化的全生命周期
数据的产生
小明注册一个账号,填写好了数据,按下了注册按钮后,数据就从无到有地产生了,并十分快速的向后端服务器飞奔而去。
数据的流动
数据从后端服务器存储到数据库后,就开始了持久化,并且其他系统也能访问到该数据
数据的持久化
真正存储到硬件上,才真正做到数据的持久化
存储系统
什么是存储系统
一个提供了读写、控制类接口,能够安全有效的把数据持久化的软件,就可以称为存储系统
存储系统的特点
- 作为后端软件的底座,性能必须顶级
- 存储系统软件架构,容易受硬件影响
- 存储系统代码,既简单有复杂
存储器层级结构
数据从应用到存储介质
- 缓存很重要,贯穿整个存储体系
- 拷贝很昂贵,需尽量减少
- 硬件设备五花八门,需要统一的接入口
RAID技术
RAID 是由多个独立的高性能磁盘驱动器组成的磁盘子系统,从而提供比单个磁盘更高的存储性能和数据冗余的技术。 RAID 是一类多磁盘管理技术,其向主机环境提供了成本适中、数据可靠性高的高性能存储。
数据库
什么是关系
关系型数据库的特点
- 结构化数据友好
- 支持事务(ACID)
- 支持复杂查询语言
非关系型数据库的特点
- 半结构化数据友好
- 可能支持事务(ACID)
- 可能支持复杂查询语言
结构化的数据管理
事务能力
原子性(Atomicity):事务是一个不可再分割的工作单元,事务中的操作要么都发生,要么都不发生。
一致性(Consistency):数据库事务不能破坏关系数据的完整性以及业务逻辑上的一致性。
隔离性(Isolation):多个事务并发访问时,事务之间是隔离的,一个事务不应该影响其它事务运行效果。
持久性(Durability):在事务完成以后,该事务所对数据库所做的更改便持久的保存在数据库之中,并不会被回滚。
数据库的查询能力
数据库使得查询变得统一,对任意的数据共用一套查询逻辑
主流存储产品
单机存储
单个计算机结点上的存储软件系统,一般不涉及网络交互
本地文件系统
Linux哲学:一切皆文件
Key-Value存储
key是你的名字,value是你的内涵
分布式存储
在单机存储基础上实现了分布式协议,涉及大量网络交互
HDFS
大数据时代的基石
Ceph
开源分布式存储系统里的万金油
单机数据库
在单个计算机节点上的数据库系统
事务在单机内执行,也可通过网络交互实现分布式事务
关系型数据库
非关系型数据库
分布式数据库
-
解决容量问题
-
解决弹性问题
-
解决性价比问题