存储与数据库 | 青训营笔记

69 阅读2分钟

这是我参与「第五届青训营」伴学笔记创作活动的第16天。本篇为第五届字节跳动青训营-寒假专场-后端基础课程的笔记。

经典案例

一条数据从产生,到数据流动,最后持久化的全生命周期。

  • 数据的持久化

    • 校验数据的合法性
    • 修改内存
    • 写入存储介质
  • 潜在问题

    • 数据库怎么保证数据不丢?
    • 数据库怎么处理?
    • 为什么用数据库,除了数据库还能存到别的存储系统吗?
    • 数据库只能处理结构化数据吗?
    • 有哪些操作数据库的方式,要用什么编程语言?

2 存储与数据库介绍

存储系统

定义

存储系统是一个提供了读写、控制类接口,能够安全有效地把数据持久化的软件

特点

  • 性能敏感
  • 易受硬件影响
  • 存储系统代码,既“简单”又“复杂”

数据怎么从应用到存储介质

  • 缓存很重要,贯穿整个存储体系
  • 拷贝很昂贵,尽量减少
  • 设备多样需要有统一的接口

RAID技术

RAID出现的背景:

  • 单块大容量磁盘的价格>多块小容量磁盘
  • 单块磁盘的写入性能<多块磁盘的并发写入性能
  • 单块磁盘的容错能力有限,不够安全

数据库

  • 关系型数据库

    是存储系统,但在存储之外又发展出其他能力

    • 结构化数据友好
    • 支持事务
    • 支持复杂查询语言
  • 非关系型数据库

    也是存储系统,但是一般不要求严格的结构化

    • 半结构化数据友好

    • 可能支持事务

    • 可能支持复杂查询语言

主流产品剖析

  • 单机存储产品

    • 单机文件系统
    • 单机key-value存储
  • 分布式存储产品

    • HDFS
    • Ceph
  • 单机数据库产品

    • 关系型数据库 —— PG、MySQL
    • 非关系型数据库 —— ES、MongoDB、Redis
    • Elasticsearch使用案例
  • 分布式数据库产品

    • 问题与挑战
    • 解决方案

新技术演进

  • SPDK

  • 人工智能

  • 新硬件加速