数组的 sort() 方法详解

6,570 阅读5分钟

这是我参与更文挑战的第9天,活动详情查看: 更文挑战

纸上得来终觉浅,绝知此事要躬行!

在上一篇文章中,我们简单介绍了 arr.sort() 方法的基本使用:

const arr = [49, 5, 14, 89, 71, 3, 10];

// 一般写法
arr.sort(function (a, b) {
    return a - b;   // 按照升序排列 
});

// 箭头函数
arr.sort((a, b) => a - b);

// 结果  [3, 5, 10, 14, 49, 71, 89]

用归用,照葫芦画瓢不难,大家日常也是这么写的,没毛病!但是如果对一个方法不进行深入研究,那么就很容易踩坑,并且常常会填不了坑!

今天,我们重点聊聊比较函数 compareFunction 相关的知识。

为了接下来的思路能够更顺畅,在学习比较函数之前,我们先来了解一下有关插入排序的原理。

插入排序

插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

算法描述:

一般来说,插入排序都采用 in-place 在数组上实现:

  • 从第一个元素开始,该元素可以认为已经被排序;
  • 取出下一个元素,在已经排序的元素序列中从后向前扫描;
  • 如果该元素(已排序)大于新元素,将该元素移到下一位置;
  • 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
  • 将新元素插入到该位置后;
  • 重复步骤2~5。

动图演示

img

其实可以用一句话总结:从数组中第二个元素起(第一个元素已默认排序),每个元素都充当一次游标值,依次和它前面的(已排序)的元素相比较,如果游标值小,则将拿来比较的元素向后移一位,继续向前比较;否则,将游标值插入比较值的后面,结束比较。

关于比较函数 compareFunction

如果想要 sort() 方法按照一定的规则进行排序(比如数字大小),那么就需要给它指定比较函数 compareFunction

如果指明了 compareFunction ,那么数组会按照调用该函数的返回值排序,它有两个参数 ab,返回值如下:

  • 如果 compareFunction(a, b) 小于 0 ,那么 a 会被排列到 b 之前。

  • 如果 compareFunction(a, b) 等于 0 , a 和 b 的相对位置不变。

  • 如果 compareFunction(a, b) 大于 0 , b 会被排列到 a 之前。

  • compareFunction(a, b) 必须总是对相同的输入返回相同的比较结果,否则排序的结果将是不确定的。

question-mark-2318030_1280

compareFunction 初步探究

我们暂不做什么复杂的分析,先使用控制台打印一下看看 a 和 b 到底是什么:

const arr = [49, 5, 14, 89, 71, 3, 10];
console.log(arr);
let times = 0;
let res = [];
arr.sort((a, b) => {
    res.push({times, a, b, "a - b": a - b});
    times++;
    return a - b;
});
console.log(res);
console.log(arr);

执行结果如下:

image-20210608194739014

通过上图,我们可以看到:

  • a 的值在按照原数组中的顺序依次变化,这个排序采用的应该是插入排序法
  • a 代表的应该是游标
  • 从 b 值的变化上又可以看出,a 首次找位置时采用了二分法,a < b 则向前比较, a>b 则向后比较。

那么,其机理到底是不是我们所看到这样一个过程,还需要再探究。

compareFunction 深入探究

要想弄清楚一个问题,还有什么比从根源上着手效率更高的呢?所以我们追根溯源,先来扒一扒 v8引擎 的源码,看看它内部到底是怎么实现 sort 接口的。

下面的源码来自7.2版本之前的 v8,该版本之后的数组排序实现变化较大,暂不予讨论。

其中 array.js 文件下,关于 sort 接口实现的代码如下:

function InnerArraySort(array, length, comparefn) {
    // In-place QuickSort algorithm.
    // For short (length <= 22) arrays, insertion sort is used for efficiency.

    if (!IS_CALLABLE(comparefn)) {
        comparefn = function (x, y) {
            if (x === y) return 0;
            if (% _IsSmi(x) && % _IsSmi(y)) {
                return % SmiLexicographicCompare(x, y);
            }
            // 将数组元素转换为字符串
            x = TO_STRING(x);
            y = TO_STRING(y);
            if (x == y) return 0;
            else return x < y ? -1 : 1;
        };
    }
    var InsertionSort = function InsertionSort(a, from, to) {
        for (var i = from + 1; i < to; i++) {
            var element = a[i];
            for (var j = i - 1; j >= from; j--) {
                var tmp = a[j];
                // 调用比较函数 a: tmp, b: element
                var order = comparefn(tmp, element);
                if (order > 0) {
                    a[j + 1] = tmp;
                } else {
                    break;
                }
            }
            a[j + 1] = element;
        }
    };

    /*** some code here **/ 

    var QuickSort = function QuickSort(a, from, to) {
        /*** some code here **/ 
    };
}

function ArraySort(comparefn) {
  	CHECK_OBJECT_COERCIBLE(this, "Array.prototype.sort");

  	var array = TO_OBJECT(this);
  	var length = TO_LENGTH(array.length);
  	return InnerArraySort(array, length, comparefn);
}

// 源码我就不放了,大家有兴趣研究的话,可以点击上面的链接自行查看

代码分析:

  1. v8 中实现 sort() 方法时,采用了 ”插入排序“ 和 ”快速排序“ 两种排序方式。
  2. 对于短数组(长度 <= 22)来说,插入排序效率更高。
  3. 如果没有传入 comparefn ,则生成一个 comparefn 比较函数。
  4. 在自动生成的比较函数中,会将传入的数组元素通过 TO_STRING 方法转换为字符串,再行比较。
  5. 对比比较函数中的 b 为游标值,这一点和最新版的 chrome 浏览器表现不同。

我们在 sort 方法中传入的函数用在了这里:

var order = comparefn(tmp, element);

根据我们传入函数的返回值,数组进行排序操作:

if (order > 0) {
    a[j + 1] = tmp;
} else {
    break;
}
  • 如果返回值(a-b)大于0,即 a > b, 则将当前拿来比较的值 a 复制给它的下一位,并继续使用游标值 b 向前进行比较。
  • 如果返回值小于等于 0 ,则结束比较,并将游标值 b 填在最后一次比较值 a 的后面。

总结

不管是旧版本还是最新版本的 v8,它们的 sort() 方法的返回结果都没有发生变化,只是内部的实现机理有了改变(肯定是向着更优的方向改变)。

为了是 sort() 的返回结果符合预期,我们给它传入了一个函数作为比较规则。

在比较函数中,因 v8 版本不同,实现机制有差异,导致它的参数意义也不大相同,所以我们暂时无需关心它里面参数的具体含义。

比较函数如果写完全的话,应该是:

arr.sort((a,b) => {
    const res = a - b;
    return res > 0 ? 1 : (res < 0 ? -1 : 0 );
});

即比较函数的返回值严格来说只有三个:-1、0 和 1 。

我们主需要记住 return a - b升序排列return b - a降序排列即可。

~本文完

学习有趣的知识,结识有趣的朋友,塑造有趣的灵魂!

大家好!我是〖编程三昧〗的作者 隐逸王,我的公众号是『编程三昧』,欢迎关注,希望大家多多指教!

知识与技能并重,内力和外功兼修,理论和实践两手都要抓、两手都要硬!