堆排序不稳定性分析-“消失”的几条数据本文通过排查生产数据同步问题，追溯到 mysql 基于 file-sort 排序不

一起养成写作习惯！这是我参与「掘金日新计划 · 4 月更文挑战」的第1天，点击查看活动详情。

背景

售卖端会定期将全量门店数据同步过去做缓存，数据同步方式是通过门店域提供的分页查询接口，分批次拉取。

前两天他们反馈了一个问题：最终同步结果中总会缺几条门店的数据。

对方开发还提供了一个线索：不同的分页查询批次中存在重复数据。

问题复现

首先确认“不同分页批次中存在重复数据”这个问题是否确实存在。通过手动调接口发现难以复现问题，该问题带有一定随机性。

本地写了一个测试脚本，模拟分批查询门店，通过不断调整分页大小，在分页大小等于 5000 时，稳定复现该问题。

问题定位

现在的核心问题是：为什么分页查询会出现重复数据，网上搜索了一下，发现大量的案例都指向一个重要因素：mysql 基于 file-sort 排序的不稳定性问题。

Mysql 的官网也提到了这个问题：

If multiple rows have identical values in the ORDER BY columns, the server is free to return those rows in any order, and may do so differently depending on the overall execution plan.

如果参与排序的列中的多行具有相同的值，服务器可以以任意顺序返回这些重复行。

相关链接：dev.mysql.com/doc/refman/…

通过 explain 分析了对应的查询语句，发现确实用到了 file-sort 排序。到这里基本就可以推断就是因为该问题导致最终的同步结果中总会缺几条数据。

在我们的分页查询场景中，默认是根据记录的更新时间倒序排列，如图所示：

可以看到，前后两次查询一共得到 4 条数据，但去重之后只存在 3 条，原因是前后两次排序结果不一致，排序项值相同的记录（门店id为2，3）顺序被打乱了。

继续往下探索问题：

mysql 什么时候会触发 file-sort 排序
file-sort 排序不稳定的原因

file-sort

file-sort 是 mysql 在待排序元素本身无序的情况下（没有用到索引本身的有序性），使用的排序手段，即当排序没有用到索引时，需要额外触发 file-sort。

file-sort 基于下列三种排序算法：

堆排序，基于优先队列，通常使用 order by limit 语法时会优先触发堆排序，堆排序对 sort-buffer 的大小要求不是很高，但假如 sort-buffer 仍然不足，则还是会触发归并排序
快速排序，当 mysql 的 sort-buffer 足够放下所有待排序数据时，则使用快速排序，效率更高
归并排序，当 sort-buffer 不足以存放下所有待排序数据时，会生成临时文件，作为排序过程中的辅助存储媒介

以上三种排序算法均为不稳定的算法。

排序算法稳定性的定义：排序项值相同的记录，在排序前后的相对位置不发生变化，即为稳定的算法，反之则为不稳定算法。

而 order by limit 语法默认会使用堆排序算法，现在的问题变成了堆排序为什么是不稳定的算法。