数据库概述

219 阅读6分钟

数据库概述

1.为什么使用数据库

  • 持久化:把数据保存到可掉电式存储设备中以供之后使用。 大多数情况下,特别是企业级应用,数据持久化意味着将内存中的数据保存到硬盘上加以“固化”,而持久化的实现过程大多通过各种关系数据库来完成。
  • 持久化的主要作用是将内存中的数据存储在关系型数据库中,当然也可以存储在磁盘文件,xml数据文件中。

2.数据库和数据库管理系统

2.1数据库的相关概念

DB:数据库(Database)即存储数据的“仓库”,其本质是一个文件系统,它保存了一系列有组织的数据。

DBMS:数据库管理系统(Database Management System)是一种操纵和管理数据库的大型软件,用于建立,使用和维护数据库,对数据库进行统一管理和控制。用户通过数据库管理系统访问数据库中表内的数据。

SQL:结构化查询语言(Structured Query Language)专门用来与数据库通信的语言。

2.2数据库与数据库管理系统的关系

数据库管理系统可以管理多个数据库,一般开发人员会针对每一个应用创建一个数据库。为保存应用中实体的数据,一般会在数据库创建多个表,以保存程序中实体用户数据。

3.RDBMS与非RDBMS

关系型数据库绝对是DBMS的主流,其中使用最多的DBMS分别是Oracle,Mysql和SQL Server,这些都是关系型数据库。

3.1关系型数据库(RDBMS)

3.1.1实质

  • 这种类型的数据库是最古老的数据库类型,关系型数据库模型是把复杂的数据结构归结为简单的二元关系(即二维表格形式)。
  • 关系型数据库以行(row)和列(column)的形式存储数据,以便用户理解。
  • SQL就是关系型数据库的查询语言。

3.1.2优势

  • 复杂查询可以用SQL语句方便的在一个表以及多个表之间做非常复杂的数据查询。
  • 事务支持使得对于安全性能很高的数据访问要求得以实现。

3.2非关系型数据库(非RDBMS)

3.2.1介绍

非关系型数据库,可以看成传统关系型数据库的功能阉割版本,基于键值对存储数据,不需要经过SQL层的解析,性能非常高。同时,通过减少不常用的功能,进一步提高性能。

目前基本上大部分主流的非关系型数据库都是免费的。

3.2.2有哪些非关系型数据库

相比于SQL,NOSQL泛指非关系型数据库,包括了榜单上的键值型数据库,文档型数据库,搜索引擎和列存储等,除此以外还包括图形数据库。也只有用NoSQL一词才能将这些技术囊括起来。

键值型数据库

键值型数据库通过key-value键值的方式来存储数据,其中key和value可以是简单的对象,也可以是复杂的对象。key作为唯一的标识符,优点是查找速度快,在这方面明显优于关系型数据库,缺点是无法像关系型数据库一样使用条件过滤,如果你不知道去哪里找数据,就要遍历所有的键,这就会消耗大量的计算。

键值型数据库典型的使用场景是作为内存缓存。Redis是最流行的键值型数据库。

文档型数据库

此类数据库可存放并获取文档,可以是xml,JSON等格式。在数据库中文档作为处理信息的基本单位,一个文档就相当于一条记录。文档数据库所存放的文档,就相当于键值数据库所存放的“值”。MongoDB是最流行的文档型数据库,此外还有CouchDB。

搜索引擎数据库

虽然关系型数据库采用了索引提升检索效率,但是针对全文索引效率却极低。搜索引擎数据库是应用在搜索引擎领域的数据存储形式,由于搜索引擎会爬取大量的数据,并以特定的格式进行存储,这样在检索的时候才能保证性能最优。核心原理是“倒排索引”。

典型产品:Solr,Elasticsearch,Splunk等。

列式数据库

列式数据库是相对于行式存储的数据库,Oracle,MySQL,SQL Server等数据库都是采用的行式存储(Row-based),而行式数据库是将数据按列存储到数据库中,这样做的好处是可以大量降低系统的I/O,适合分布式文件系统,不足在于功能相对有限。典型产品:HBase等。

图形数据库

图形数据库顾名思义,就是一种存储图形关系的数据库。它利用了图这种数据结构存储了实体(对象)之间的关系。关系型数据用于存储明确关系的数据,但对于复杂关系的数据存储却有些力不从心。如社交网络中人物之间的关系,如果用关系型数据库则非常复杂,用图形数据库将非常简单。典型产品:Neo4J,InfoGrid等。

4.关系型数据库设计规则

  • 一个数据库中可以有多个表,每个表都有一个名字,用来标识自己。表名具有唯一性。
  • 表具有一些特性,这些特性定义了数据在表中如何存储,类似Java和Puthon中“类”的设计。

4.1表,记录,字段

  • E-R(entity-relationship,实体-联系)模型中有三个主要概念是:实体集,属性,联系集。
  • 一个实体集(class)对应于数据库中的一个表,一个实体则对应于数据库表中的一行,也称为一条记录。一个属性对应于数据库表中的一列,也称为一个字段。

4.2表的关联关系

  • 表与表之间的数据记录有关系。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。
  • 四种:一对一关联,一对多关联,多对多关联,自我引用。

4.2.1一对一关联

  • 在实际开发中应用不多,因为一对一可以创建成一张表。

  • 俩种建表原则

    • 外键唯一:主表的主键和从表的外键(唯一),形成主外键关系,外键唯一。
    • 外键是主键:主表的主键和从表的主键,形成主外键关系。

4.2.2一对多关系

  • 一对多建表原则:在从表(多方)创建一个字段,字段作为外键指向主表(一方)的主键

4.2.3多对多

要表示多对多关系,必须创建第三个表,该表通常称为联接表,它将多对多关系分为俩个一对多关系。将这俩个表的主键都插入到第三个表中。

4.2.4自我引用