MySQL学习笔记4【存储引擎和索引】

2025-02-08 209 阅读5分钟

MySQL学习笔记

存储引擎

1. 常用的存储引擎

InnoDB
- 特点：
  - 支持事务（遵循ACID模型）。
  - 实现行级锁，提高并发性能。
  - 支持外键约束，确保数据完整性。
- 文件结构：
  - xxx.ibd: 存储数据和索引。
  - 表结构文件（frm、sdi）也与之相关。
- 其他参数：
  - innodb_file_per_table: 决定每张表是否有独立表空间。
- 使用场景：适用于需要高可靠性和高并发访问的应用程序。
MyISAM
- 特点：
  - 不支持事务和外键。
  - 使用表级锁，不能支持行级锁。
  - 访问速度快，适合读多写少的场景。
- 文件结构：
  - xxx.sdi: 存储表结构信息。
  - xxx.MYD: 存储数据。
  - xxx.MYI: 存储索引。
- 使用场景：适用于以数据读取为主，且不需要事务支持的应用。
Memory
- 特点：
  - 数据存放在内存中，速度极快。
  - 受到硬件问题和断电的影响，适合用作临时表或缓存。
- 文件结构：存放在内存中，不生成物理文件。
- 使用场景：适用于需要快速访问的临时数据存储。

2. 存储引擎比较表

特点	InnoDB	MyISAM	Memory
存储限制	64TB	有	有
事务安全	支持	-	-
锁机制	行锁	表锁	表锁
B+树索引	支持	支持	支持
哈希索引	-	-	支持
全文索引	支持（5.6版本后）	支持	-
空间使用	高	低	N/A
内存使用	高	低	中等
批量插入速度	低	高	高
支持外键	支持	-	-

3. 相关操作

查看建表语句：
```
SHOW CREATE TABLE account;
```

建表时指定存储引擎：

CREATE TABLE 表名 (
    ...
) ENGINE=INNODB;

查看当前数据库支持的存储引擎：
```
SHOW ENGINES;
```

查看 MySQL 变量：

SHOW VARIABLES LIKE 'innodb_file_per_table';

从 .ibd 文件提取表结构数据：
```
ibd2sdi xxx.ibd
```

4. 选择

存储引擎	特点	适用场景
InnoDB	- 事务完整性要求高	如果应用对事务的完整性有比较高的要求，且在并发条件下要求数据一致性。
	- 支持多种数据操作（插入、查询、更新、删除）	适用于包括大量更新和删除操作的应用。
MyISAM	- 读操作和插入操作为主，更新和删除操作非常少	如果应用主要以读操作和插入操作为主，且对事务的完整性、并发性要求不高。
	- 不支持事务和外键	适用于不需要事务支持的场景。
Memory	- 所有数据保存在内存中，访问速度极快	适用于需要快速访问的临时表和缓存(不如Redis)。
	- 对表的大小有限制，太大的表无法缓存在内存中	Memory 的缺陷是无法保障数据的安全性。
	- 不生成物理文件

索引

	内容
索引定义	索引是帮助 MySQL 高效获取数据的数据结构，通常是有序的。
工作原理	数据库系统维护特定查找算法的数据结构以引用数据，提升查询效率。

1. 优缺点

优缺点	描述
优点	1. 提高数据检索效率，降低数据库的 I/O 成本。 2. 利用索引列对数据排序，降低排序成本，降低 CPU 的消耗。
缺点	1. 索引需要占用额外空间。 2. 更新（INSERT/UPDATE/DELETE）操作速度降低。

2. 索引结构及支持

索引结构	描述	InnoDB	MyISAM	Memory
B+Tree	最常见的索引类型，支持范围查询。	支持	支持	支持
Hash	哈希表实现，仅支持精确匹配，无法支持范围查询。	不支持	不支持	支持
R-Tree	主要用于地理空间数据，适用于范围查询。	不支持	支持	不支持
Full-Text	文本搜索，通过倒排索引快速匹配文档。	5.6版本后支持	支持	不支持

3. 数据结构比较

数据结构	描述
B-Tree	多路平衡查找树，节点可存储多个关键字。
B+Tree	所有数据在叶子节点，形成链表，适合范围查询，优化区间访问性能。

4. Hash 索引原理

特点	描述
适用场景	仅能用于等值比较（=、IN），不支持范围查询（BETWEEN、>、<）。
排序操作	无法通过索引完成排序操作。
查询效率	查询通常只需一次检索，效率高于 B+Tree 索引。

5. 存储引擎支持情况

存储引擎	特点
Memory	支持 Hash 索引。
InnoDB	自适应 Hash 功能，在特定条件下自动构建的 Hash 索引。

6. MySQL 索引分类

分类	含义	特点	关键字
主键索引	针对表中主键创建的索引	默认自动创建，只能有一个	`PRIMARY`
唯一索引	避免同一表中重复数据	可以有多个	`UNIQUE`
常规索引	快速定位特定数据	可以有多个
全文索引	根据文本中的关键词查找，而非索引中的值	可以有多个	`FULLTEXT`

7. 存储引擎中的索引形式

在 InnoDB 存储引擎中，索引还可以按照其存储形式分为以下两种：

分类	含义	特点
聚集索引	将数据存储与索引放在一起，叶子节点保存行数据	每个表必须有且只有一个，查询效率高，直接访问数据行，适合范围查询。
二级索引	将数据与索引分开存储，叶子节点关联主键	可以存在多个，查询时需进行两次查找：一次是查找二级索引，另一次是通过主键查找数据。

tip：根据特点，我们可以知道根据主键查找会更快，如果通过其他字段来查找数据，这个字段就会作为一个二级索引，查找到相应的主键（聚集索引）后，通过回表查询来再在聚集索引中查询相应的行数据。

8. 聚集索引选取规则

如果存在主键，主键索引即为聚集索引。
如果没有主键，将使用第一个唯一索引作为聚集索引。
如果表没有主键或可用的唯一索引，InnoDB 会生成一个自动隐藏的 rowid 作为聚集索引。

9.性能分析

性能分析是数据库优化的重要环节，以下是关于 MySQL 中一些常用的性能分析工具和方法：

9.1 查看执行频次

可以通过以下命令查看当前数据库中的 INSERT、UPDATE、DELETE 和 SELECT 的访问频次：

全局状态：
```
SHOW GLOBAL STATUS LIKE 'Com_______';
```
会话状态：
```
SHOW SESSION STATUS LIKE 'Com_______';
```

9.2 慢查询日志

慢查询日志用于记录执行时间超过指定阈值的 SQL 语句。配置步骤如下：

在 MySQL 配置文件（通常是 /etc/my.cnf）中添加以下配置：

# 开启慢查询日志
slow_query_log=1
# 设置慢查询时间为2秒
long_query_time=2

配置完成后，重启 MySQL 服务。慢查询日志的默认存储路径为：/var/lib/mysql/localhost-slow.log。
注意，这里的默认存储文件每个人可能不一样，如果没找到查看mysql的配置文件或者实在不行可以问AI来解决。

9.3 查看慢查询日志开关状态

SHOW VARIABLES LIKE 'slow_query_log';

9.4 Profiling

Profiling 是用于分析 SQL 查询性能的工具。

检查 MySQL 是否支持 Profiling：
```
SELECT @@have_profiling;
```
开启 Profiling（会话或全局）：
```
SET profiling = 1;
```
查看所有 SQL 语句的耗时：
```
SHOW PROFILES;
```
查看指定 query_id 的 SQL 语句耗时：
```
SHOW PROFILE FOR QUERY query_id;
```
查看指定 query_id 的 SQL 语句 CPU 使用情况：
```
SHOW PROFILE CPU FOR QUERY query_id;
```

9.5 Explain

使用 EXPLAIN 或 DESC 命令可以获取 MySQL 如何执行 SELECT 语句的信息。

语法示例：

EXPLAIN 
SELECT 字段列表 
FROM 表名 
WHERE 条件;

EXPLAIN 各字段含义：

id：查询的序列号，表示执行顺序。
select_type：表示 SELECT 的类型，如 SIMPLE、PRIMARY、UNION、SUBQUERY 等。
type：连接类型，性能由好到差依次为 NULL(不访问任何表)、system(访问系统表)、const(主键或唯一索引)、eq_ref(查询通过主键或唯一索引进行等值连接)、ref(非唯一性索引)、range(通过索引进行范围扫描)、index(查询通过扫描整个索引树来获取数据)、all(全表遍历)。(一半在优化的时候是难以达到NULL的级别，但是尽可能向左优化)。
possible_key：可能应用的索引列表。
Key：实际使用的索引，若为 NULL 则没有使用索引。
Key_len：使用的索引字节数，越短越好。
rows：估计需要执行的行数。
filtered：返回结果行数占需读取行数的百分比，值越大越好。

9.6 索引的使用

1. 语法

创建索引：

语法：

CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name, ...);

示例：

CREATE INDEX idx_user_name ON tb_user(name);
CREATE UNIQUE INDEX idx_user_phone ON tb_user (phone);
CREATE INDEX idx_user_pro_age_stat ON tb_user(profession, age, status); #联合索引
CREATE INDEX idx_user_email ON tb_user(email);

查看索引：
- 语法：
```
SHOW INDEX FROM table_name;
```
删除索引：
- 语法：
```
DROP INDEX index_name ON table_name;
```

2. 使用规则

最左前缀法则：查询条件应从索引的最左列开始，跳过某一列将导致索引的部分失效。
范围查询影响：联合索引中一旦出现范围查询（如 <, >），该范围右侧的列索引将失效。
索引失效情况：
- 在索引列上进行运算操作（例如 substring(phone, 10, 2)）。
- 字符串类型字段不加引号时索引失效（如 where phone = 17799990015）。
- 模糊查询中，前部模糊匹配将使索引失效，比如 LIKE '%工程'。
- 使用 OR 时，如果其中一个条件的列没有索引，涉及的索引都可能不会被使用。

3. SQL优化提示

使用提示：
- USE INDEX：建议使用的索引
- IGNORE INDEX：不使用的索引
- FORCE INDEX：强制使用指定的索引
覆盖索引与回表查询：
- 尽量使用覆盖索引，避免 SELECT *，以减少回表查询的次数。

4. 前缀索引

用于长字符串的索引，可以只建立部分前缀索引来节约空间，提高效率。

5. 单列索引与联合索引

建议在常用的查询条件上建立联合索引。
单列索引适用于简单查询条件。

6. 注意事项

对于频繁查询且数据量大的字段应建立索引。
使用区分度高的列作为索引可以提高效率。
避免过多索引，以免影响增删改的性能。