MySQL零基础入门教程-9 数据库索引、DBA常用命令、数据库设计三范式，基础+实战什么是数据索引？它的实现原理，如何

教程来源：B站视频BV1Vy4y1z7EX

001-数据库概述_哔哩哔哩_bilibili

我听课收集整理的课程的完整笔记，供大家学习交流下载：夸克网盘分享

本文内容为完整笔记的第九篇

1、索引（index）
- 1.1、什么是索引？
  - 索引是在数据库表的字段上添加的，是为了提高查询效率存在的一种机制。
  - 一张表的一个字段可以添加一个索引，当然，多个字段联合起来也可以添加索引。
  - 索引相当于一本书的目录，是为了缩小扫描范围而存在的一种机制。
  - 对于一本字典来说，查找某个汉字有两种方式：
    - 第一种方式：一页一页挨着找，直到找到为止，这种查找方式属于全字典扫描。效率比较低。
    - 第二种方式：先通过目录（索引）去定位一个大概的位置，然后直接定位到这个位置，做局域性扫描，缩小扫描的范围，快速的查找。这种查找方式属于通过索引检索，效率较高。
  - 示例：select * from t_user where name = 'jack';
    - 以上的这条SQL语句会去name字段上扫描，为什么？
      - 因为查询条件是：name='jack'

编辑

- - - 如果name字段上没有添加索引（目录），或者说没有给name字段创建索引，
      - MySQL会进行全扫描，会将name字段上的每一个值都比对一遍。效率比较低。
  - MySQL在查询方面主要就是两种方式：
    - 第一种方式：全表扫描
    - 第二种方式：根据索引检索。
  - 注意：
    - 在实际中，汉语字典前面的目录是排序的，按照a b c d e f....排序，
    - 为什么排序呢？因为只有排序了才会有区间查找这一说！（缩小扫描范围其实就是扫描某个区间罢了！）
    - 在mysql数据库当中索引也是需要排序的，并且这个所以的排序和TreeSet数据结构相同。TreeSet（TreeMap）底层是一个自平衡的二叉树！在mysql当中索引是一个B-Tree数据结构。
    - 遵循左小右大原则存放。采用中序遍历方式遍历取数据。
- 1.2、索引的实现原理？
  - 假设有一张用户表：t_user

编辑

- - 原理示意图

编辑

- - 提醒1：在任何数据库当中主键上都会自动添加索引对象，id字段上自动有索引，因为id是PK。另外在mysql当中，一个字段上如果有unique约束的话，也会自动创建索引对象。
  - 提醒2：在任何数据库当中，任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。
  - 提醒3：在mysql当中，索引是一个单独的对象，不同的存储引擎以不同的形式存在，在MyISAM存储引擎中，索引存储在一个 .MYI文件中。在InnoDB存储引擎中索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引被存储在内存当中。不管索引存储在哪里，索引在mysql当中都是一个树的形式存在。（自平衡二叉树：B-Tree）
- 1.3、在mysql当中，主键上，以及unique字段上都会自动添加索引的！！！！
  - 什么条件下，我们会考虑给字段添加索引呢？
    - 条件1：数据量庞大（到底有多么庞大算庞大，这个需要测试，因为每一个硬件环境不同）
    - 条件2：该字段经常出现在where的后面，以条件的形式存在，也就是说这个字段总是被扫描。
    - 条件3：该字段很少的DML(insert delete update)操作。（因为DML之后，索引需要重新排序。）
    - 建议不要随意添加索引，因为索引也是需要维护的，太多的话反而会降低系统的性能。
    - 建议通过主键查询，建议通过unique约束的字段进行查询，效率是比较高的。
- 1.4、索引怎么创建？怎么删除？语法是什么？
  - 创建索引：
    - mysql> create index emp_ename_index on emp(ename);
    - 给emp表的ename字段添加索引，起名：emp_ename_index
  - 删除索引：
    - mysql> drop index emp_ename_index on emp;
    - 将emp表上的emp_ename_index索引对象删除。
- 1.5、在mysql当中，怎么查看一个SQL语句是否使用了索引进行检索？
  - mysql> explain select * from emp where ename = 'KING';

编辑

- - mysql> create index emp_ename_index on emp(ename);

编辑

- 1.6、索引有失效的时候，什么时候索引失效呢？
  - 失效的第1种情况：
    - select * from emp where ename like '%T';
    - ename上即使添加了索引，也不会走索引，为什么？
      - 原因是因为模糊匹配当中以“%”开头了！
      - 尽量避免模糊查询的时候以“%”开始。
      - 这是一种优化的手段/策略。

编辑

- - 失效的第2种情况：
    - 使用or的时候会失效，如果使用or那么要求or两边的条件字段都要有索引，才会走索引，如果其中一边有一个字段没有索引，那么另一个字段上的索引也会失效。所以这就是为什么不建议使用or的原因。

编辑

- - 失效的第3种情况：
    - 使用复合索引的时候，没有使用左侧的列查找，索引失效
    - 什么是复合索引？
      - 两个字段，或者更多的字段联合起来添加一个索引，叫做复合索引。

编辑

- - 失效的第4种情况：
    - 在where当中索引列参加了运算，索引失效。

编辑

- - 失效的第5种情况：
    - 在where当中索引列使用了函数

编辑

- - 失效的第6...
  - 失效的第7...
- 1.7、索引是各种数据库进行优化的重要手段。优化的时候优先考虑的因素就是索引。
  - 索引在数据库当中分了很多类？
    - 单一索引： 一个字段上添加索引。
    - 复合索引： 两个字段或者更多的字段上添加索引。
    - 主键索引： 主键上添加索引。
    - 唯一性索引： 具有unique约束的字段上添加索引。
    - .....
    - 注意：唯一性比较弱的字段上添加索引用处不大。
2、视图(view)
- 2.1、什么是视图？
  - view:站在不同的角度去看待同一份数据。
- 2.2、怎么创建视图对象？怎么删除视图对象？
  - 表复制：

编辑

- - 创建视图对象： create view dept2_view as select * from dept2;
  - 删除视图对象： drop view dept2_view;
  - 注意：只有DQL语句才能以view的形式创建。
  - create view view_name as 这里的语句必须是DQL语句;
- 2.3、用视图做什么？
  - //面向视图查询
    - select * from dept2_view;
  - // 面向视图插入
    - insert into dept2_view(deptno,dname,loc) values(60,'SALES', 'BEIJING');
  - // 查询原表数据
    - mysql> select * from dept2;

编辑

- - // 面向视图删除
    - mysql> delete from dept2_view;
  - // 查询原表数据
    - mysql> select * from dept2;
    - Empty set (0.00 sec)
  - // 创建视图对象

编辑

- - // 查询视图对象

编辑

- - // 面向视图更新
    - update emp_dept_view set sal = 1000 where dname = 'ACCOUNTING';
  - // 原表数据被更新
    - mysql> select * from emp;

编辑

- 2.4、视图对象在实际开发中到底有什么用？《方便，简化开发，利于维护》
  - 把复杂的SQL语句以视图对象的形式新建。

编辑

- - 假设有一条非常复杂的SQL语句，而这条SQL语句需要在不同的位置上反复使用。
  - 每一次使用这个sql语句的时候都需要重新编写，很长，很麻烦，怎么办？
    - 可以把这条复杂的SQL语句以视图对象的形式新建。
    - 在需要编写这条SQL语句的位置直接使用视图对象，可以大大简化开发。
    - 并且利于后期的维护，因为修改的时候也只需要修改一个位置就行，只需要
    - 修改视图对象所映射的SQL语句。
  - 我们以后面向视图开发的时候，使用视图的时候可以像使用table一样。
  - 可以对视图进行增删改查等操作。视图不是在内存当中，视图对象也是存储在硬盘上的，不会消失。
  - 再提醒一下：
    - 视图对应的语句只能是DQL语句。
    - 但是视图对象创建完成之后，可以对视图进行增删改查等操作。
  - 小插曲：
    - 增删改查，又叫做：CRUD。
    - CRUD是在公司中程序员之间沟通的术语。一般我们很少说增删改查。
    - 一般都说CRUD。
      - C:Create（增）
      - R:Retrive（查：检索）
      - U:Update（改）
      - D:Delete（删）
3、DBA常用命令？
- 重点掌握：
  - 数据的导入和导出（数据的备份）
  - 其它命令了解一下即可。（这个培训日志文档留着，以后忘了，可以打开文档复制粘贴。）
- 数据导出？
  - 注意：在windows的dos命令窗口中：
    - mysqldump bjpowernode>D:\bjpowernode.sql -uroot -p123456
  - 可以导出指定的表吗？
    - mysqldump bjpowernode emp>D:\bjpowernode.sql -uroot -p123456
- 数据导入？
  - 注意：需要先登录到mysql数据库服务器上。
  - 然后创建数据库：create database bjpowernode;
  - 使用数据库：use bjpowernode
  - 然后初始化数据库：source D:\bjpowernode.sql
4、数据库设计三范式
- 4.1、什么是数据库设计范式？
  - 数据库表的设计依据。教你怎么进行数据库表的设计。
- 4.2、数据库设计范式共有？
  - 3个。
  - 第一范式： 要求任何一张表必须有主键，每一个字段原子性不可再分。
  - 第二范式： 建立在第一范式的基础之上，要求所有非主键字段完全依赖主键，不要产生部分依赖。
  - 第三范式： 建立在第二范式的基础之上，要求所有非主键字段直接依赖主键，不要产生传递依赖。
  - 声明：三范式是面试官经常问的，所以一定要熟记在心！
  - 设计数据库表的时候，按照以上的范式进行，可以避免表中数据的冗余，空间的浪费。
- 4.3、第一范式：
  - 最核心，最重要的范式，所有表的设计都需要满足。
  - 必须有主键，并且每一个字段都是原子性不可再分。
  - 示例原表

编辑

- - - 以上是学生表，满足第一范式吗？
      - 不满足，第一：没有主键。第二：联系方式可以分为邮箱地址和电话
  - 修改后

编辑

- 4.4、第二范式：
  - 建立在第一范式的基础之上，
  - 要求所有非主键字段必须完全依赖主键，不要产生部分依赖。
  - 示例原表

编辑

- - - 这张表描述了学生和老师的关系：（1个学生可能有多个老师，1个老师有多个学生）
    - 这是非常典型的：多对多关系！
    - 分析以上的表是否满足第一范式？
      - 不满足第一范式。
  - 修改
    - 学生编号教师编号，两个字段联合做主键，复合主键（PK: 学生编号+教师编号）
    - 经过修改之后，以上的表满足了第一范式。但是满足第二范式吗？

编辑

- - - - 不满足，“张三”依赖1001，“王老师”依赖001，显然产生了部分依赖。
      - 产生部分依赖有什么缺点？
        
        数据冗余了。空间浪费了。“张三”重复了，“王老师”重复了。
    - 为了让以上的表满足第二范式，你需要这样设计：

编辑

- - - 多对多怎么设计？背口诀：
      - 多对多，三张表，关系表两个外键！！！！！！！！！！！！！！！
- 4.5、第三范式：
  - 第三范式建立在第二范式的基础之上
  - 要求所有非主键字典必须直接依赖主键，不要产生传递依赖。

编辑

- - 以上表的设计是描述：班级和学生的关系。很显然是1对多关系！
    - 一个教室中有多个学生。
  - 分析以上表是否满足第一范式？
    - 满足第一范式，有主键。
  - 分析以上表是否满足第二范式？
    - 满足第二范式，因为主键不是复合主键，没有产生部分依赖。主键是单一主键。
  - 分析以上表是否满足第三范式？
    - 第三范式要求：不要产生传递依赖！
    - 一年一班依赖01，01依赖1001，产生了传递依赖。
    - 不符合第三范式的要求。产生了数据的冗余。
  - 那么应该怎么设计一对多呢？

编辑

- - 背口诀：
    - 一对多，两张表，多的表加外键！！！！！！！！！！！！
- 4.6、总结表的设计？
  - 一对多：
    - 一对多，两张表，多的表加外键！！！！！！！！！！！！
  - 多对多：
    - 多对多，三张表，关系表两个外键！！！！！！！！！！！！！！！
  - 一对一：
    - 一对一放到一张表中不就行了吗？为啥还要拆分表？
    - 在实际的开发中，可能存在一张表字段太多，太庞大。这个时候要拆分表。
    - 一对一怎么设计？

编辑

- - - 口诀：一对一，外键唯一！！！！！！！！！！
- 4.7、嘱咐一句话：
  - 数据库设计三范式是理论上的。
  - 实践和理论有的时候有偏差。
  - 最终的目的都是为了满足客户的需求，有的时候会拿冗余换执行速度。
  - 因为在sql当中，表和表之间连接次数越多，效率越低。（笛卡尔积）
  - 有的时候可能会存在冗余，但是为了减少表的连接次数，这样做也是合理的，
  - 并且对于开发人员来说，sql语句的编写难度也会降低。
  - 面试的时候把这句话说上：他就不会认为你是初级程序员了！