原理

首先，让我们通过一个简单的生活中的例子来开始这次的教学：想象一个大的图书馆。图书馆的书架上的书就像数据库中的数据，而如何找到这些书则取决于我们的索引系统。

聚集索引 (Clustered Index)：

想象聚集索引就像图书馆的书架上的书是按照ISBN编号排列的。当我们知道了某本书的ISBN，我们可以直接定位到那本书，因为整个图书馆的结构（书架上的书的物理存储顺序）是按照ISBN排序的。

特点：

聚集索引决定了数据行的物理存储顺序。
一个表只能有一个聚集索引，因为你不能以两种方式同时存储物理数据。
它是由数据页直接组成的。

优点：

数据访问速度快，因为当找到索引键值时，你已经找到了你的数据。

缺点：

插入速度可能较慢，因为它要确保物理存储顺序。

非聚集索引 (Non-Clustered Index)：

继续使用图书馆的例子。现在，除了ISBN的书架排序，图书馆还为每本书的作者、标题和发布日期等制作了卡片。这些卡片存储在一个单独的抽屉或文件中，并没有直接存储书本，而是指向书本在书架上的位置。这就是非聚集索引。

特点：

非聚集索引有一个独立于实际数据行的结构。
一个表可以有多个非聚集索引。
它指向聚集索引或数据行的指针。

优点：

提供了更多的排序和过滤选项，而不会影响数据的物理存储。
插入速度比聚集索引快，因为它不需要调整物理数据。

缺点：

数据访问可能较慢，因为一旦通过非聚集索引找到数据位置，它还需要进一步查询以获取实际数据。

总结：

聚集索引更像是图书馆的书架，决定了书（数据）的物理排列。
非聚集索引更像是图书馆的索引卡片，它不直接存储数据，而是告诉你数据在哪里。

在设计数据库时，理解何时使用聚集索引和非聚集索引非常重要，因为正确的索引选择可以大大提高查询性能。

实践

当然，通过实践来理解聚集索引和非聚集索引会更加直观和深刻。我们将使用一个简单的数据库表进行实践讲解。

建立环境

假设我们有一个名为Books的表格，它有以下字段：

BookID
Title
Author
PublicationDate

我们会为BookID和Author创建索引。

1. 创建聚集索引

通常，我们希望BookID是主键，并且它是聚集索引。这意味着数据在磁盘上的存储将按BookID的顺序排列。

CREATE TABLE Books (
    BookID INT PRIMARY KEY CLUSTERED,
    Title NVARCHAR(255),
    Author NVARCHAR(255),
    PublicationDate DATE
);

当我们按照BookID查询时，由于它是聚集索引，查询会非常快，因为数据行的物理存储顺序与BookID的顺序相同。

2. 创建非聚集索引

现在，我们还希望能够快速按作者查询书籍。但我们已经有了聚集索引，所以我们需要为Author创建一个非聚集索引。

CREATE NONCLUSTERED INDEX idx_Books_Author
ON Books (Author);

这样，当我们按照Author查询时，数据库会首先查找非聚集索引，然后再查找对应的数据行。

实践测试

插入数据：

INSERT INTO Books VALUES (1, 'Book A', 'Author X', '2022-01-01');
INSERT INTO Books VALUES (2, 'Book B', 'Author Y', '2022-01-02');
INSERT INTO Books VALUES (3, 'Book C', 'Author X', '2022-01-03');

按聚集索引查询：查询BookID为2的书籍：

SELECT * FROM Books WHERE BookID = 2;

按非聚集索引查询：查询作者为'Author X'的所有书籍：

SELECT * FROM Books WHERE Author = 'Author X';

通过这两次查询，你会发现按聚集索引查询通常更快，因为它直接定位到数据的物理位置。而按非聚集索引查询需要两步：首先在索引中查找，然后再查找实际数据。

总之，通过实践操作，你可以更深入地理解聚集索引和非聚集索引的原理和应用，并根据实际需求为你的数据库表创建合适的索引来优化查询性能。

《聚集索引和非聚集索引》

原理

实践

建立环境

1. 创建聚集索引

2. 创建非聚集索引

实践测试