LeetCode刷题笔记4寻找两个正序数组的中位数

1,023 阅读6分钟

这是我参与更文挑战的第1天,活动详情查看: 更文挑战

LeetCode刷题笔记4寻找两个正序数组的中位数

正好最近时间比较充分,打算花一定的时间来刷leetcode题目,并进行一定的总结。正好掘金进行更文挑战赛。立个flag-我的目标是本月进行18篇leetcode刷题笔记,并且6月不刷抖音,不看直播。

好了开始本篇的笔记总结:

笔记重点:更加容易理解官方划分数组方法

地址:leetcode-cn.com/problems/me…

题目描述:

给定两个大小分别为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。

示例 1:

输入:nums1 = [1,3], nums2 = [2] 输出:2.00000 解释:合并数组 = [1,2,3] ,中位数 2 示例 2:

输入:nums1 = [1,2], nums2 = [3,4] 输出:2.50000 解释:合并数组 = [1,2,3,4] ,中位数 (2 + 3) / 2 = 2.5 示例 3:

输入:nums1 = [0,0], nums2 = [0,0] 输出:0.00000 示例 4:

输入:nums1 = [], nums2 = [1] 输出:1.00000 示例 5:

输入:nums1 = [2], nums2 = [] 输出:2.00000

提示:

nums1.length == m nums2.length == n 0 <= m <= 1000 0 <= n <= 1000 1 <= m + n <= 2000 -106 <= nums1[i], nums2[i] <= 106

进阶:你能设计一个时间复杂度为 O(log (m+n)) 的算法解决此问题吗?

自我题解

思路1:直接合并两个数组,如果总长度为奇数那么就是中间那一个,如果偶数那么就是中间哪两个的平局值。

思路2:因为两个数组都是有序的,我们每次减去一个最大值和最小值,这样当剩下的数小于等于2的时候,就是中位数。

删除最大和最小值.png

因为都有序,那么最大值和最小值一定在两个数组的两端产生。

示例代码:

 public double solution1(int[] nums1, int[] nums2) {
        int leftStart = 0, leftEnd = nums1.length - 1, rightStart = 0, rightEnd = nums2.length - 1;
        int leftL = leftEnd - leftStart + 1;
        int rightL = rightEnd - rightStart + 1;
        if (rightL == 0 && leftL == rightL) {
            return 0;
        }
        while (leftL + rightL > 2) {
            if (leftStart > leftEnd) {//左侧已经没有可供选择的数
                rightStart++;
                rightEnd--;
            } else if (rightStart > rightEnd) {//右侧没有可供选择的数
                leftStart++;
                leftEnd--;
            } else {
                if (nums1[leftStart] < nums2[rightStart]) {
                    leftStart++;
                } else {
                    rightStart++;
                }
                if (nums1[leftEnd] > nums2[rightEnd]) {
                    leftEnd--;
                } else {
                    rightEnd--;
                }
            }
            leftL = leftEnd - leftStart + 1;
            rightL = rightEnd - rightStart + 1;
        }
        if (leftL == 0) {
            return (nums2[rightStart] + nums2[rightEnd]) / 2.0;
        } else if (rightL == 0) {
            return (nums1[leftStart] + nums1[leftEnd]) / 2.0;
        } else {
            return (nums1[leftStart] + nums2[rightStart]) / 2.0;
        }
    }

可以看到我们自己的方案虽然能够获取正确值,但是其时间复杂度为o(m+n),m n 分别为两个数组长度。

题目想要时间复杂度为 O(log (m+n)) 的算法,该如何做呢?

官方题解:二分查找法

因为两个数组都是有序,并且长度已知,假设我们将两个数组合并成一个有序数组,那么我们可以直接根据合并后数组的下标来确定中位数。假设 两个数组长度分别为 m n; k = (m+n)/2。官方的二分查找法就是在不合并数组的情况下,利用二分法来确定第k个元素原来数组上的位置。因为m n k 全部都是已知数,题目就转化成了,求两个有序数组合并后的第k个位置的数是哪一个

我们比较前A B 数组第 k/2 -1 个数 ,对于其中最小的数,连同自身共有k/2个数必定小于第k个元素。

官方二分查找.png

从上面的数组中我们可以知道中位数是第6个和第7个数的平均数,假设我们要求第6个数,我们只需要排除前面5个数,剩下的最小的一个就是第6个数。

以上面的数据为例:

k = 6 ; K/2-1 = 2 比较 A[2] =6; B[2] = 9、A[2] 小,即A[0]、A[1]、A[2] 都比第K个元素小。一共要排除(k-1) = 5个元素已经排除了三个 k = k - 3 = 3。此时A数组的起始位置是3

k=3, K/2-1 = 0;A[0+3] = 8、 B[0] = 5,B[0] 小,同理,排除B[0] k的总数减去1 k = k - 1 = 2 此时B数组的起始位置是1

k = 2, K/2-1 = 0; A[0+3] = 8 、B[0+1] = 6 B[1] 小 ,排除B[1] k = k - 1 = 1 此时排除的总数 = 3+1+1 = k-1 B数组的起始位置是2

比较A[3] B[2] A[3] 小,即第6个数是A[3] = 8

leetCode官方代码:

public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int length1 = nums1.length, length2 = nums2.length;
        int totalLength = length1 + length2;
        if (totalLength % 2 == 1) {
            int midIndex = totalLength / 2;
            double median = getKthElement(nums1, nums2, midIndex + 1);
            return median;
        } else {
            int midIndex1 = totalLength / 2 - 1, midIndex2 = totalLength / 2;
            double median = (getKthElement(nums1, nums2, midIndex1 + 1) + getKthElement(nums1, nums2, midIndex2 + 1)) / 2.0;
            return median;
        }
    }

    public int getKthElement(int[] nums1, int[] nums2, int k) {
        /* 主要思路:要找到第 k (k>1) 小的元素,那么就取 pivot1 = nums1[k/2-1] 和 pivot2 = nums2[k/2-1] 进行比较
         * 这里的 "/" 表示整除
         * nums1 中小于等于 pivot1 的元素有 nums1[0 .. k/2-2] 共计 k/2-1 个
         * nums2 中小于等于 pivot2 的元素有 nums2[0 .. k/2-2] 共计 k/2-1 个
         * 取 pivot = min(pivot1, pivot2),两个数组中小于等于 pivot 的元素共计不会超过 (k/2-1) + (k/2-1) <= k-2 个
         * 这样 pivot 本身最大也只能是第 k-1 小的元素
         * 如果 pivot = pivot1,那么 nums1[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums1 数组
         * 如果 pivot = pivot2,那么 nums2[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums2 数组
         * 由于我们 "删除" 了一些元素(这些元素都比第 k 小的元素要小),因此需要修改 k 的值,减去删除的数的个数
         */

        int length1 = nums1.length, length2 = nums2.length;
        int index1 = 0, index2 = 0;
        int kthElement = 0;

        while (true) {
            // 边界情况
            if (index1 == length1) {
                return nums2[index2 + k - 1];
            }
            if (index2 == length2) {
                return nums1[index1 + k - 1];
            }
            if (k == 1) {
                return Math.min(nums1[index1], nums2[index2]);
            }
            
            // 正常情况
            int half = k / 2;
            int newIndex1 = Math.min(index1 + half, length1) - 1;
            int newIndex2 = Math.min(index2 + half, length2) - 1;
            int pivot1 = nums1[newIndex1], pivot2 = nums2[newIndex2];
            if (pivot1 <= pivot2) {
                k -= (newIndex1 - index1 + 1);
                index1 = newIndex1 + 1;
            } else {
                k -= (newIndex2 - index2 + 1);
                index2 = newIndex2 + 1;
            }
        }
    }

官方题解:划分数组

相比较与二分查找,划分数组的官方题解确实有一定的理解难度。我这里不打算按照官方题解来解释这个问题。希望能够更加容易理解这个方法。

假设我们将两个数组合并成一个有序数组,并且按照下面的规则划分,

当总是是奇数,左侧的长度比右侧多1 ,当总数是偶数 左右两侧长度相等 即奇数时,中位数是左侧的最大值,偶数时是左侧最大值与右侧最小值的平均数。

官方划分数组.png

在合并后的数组中,前(m+n)/2中的数如果有 i 个来自数组A那么剩余的 j = m+n)/2 - i个必然来自n。

举例说明:(m+n)/2 = 6

当 i = 0 时 j = 6 即前6个全部来自B数组,左侧最大值为B[5] = 30 > 右侧最小值A[0] = 1 不能构成有序数组, 不符合

当 i = 1 时 j = 5 左侧最大值是 A[0] B[4] 中的较大值;B4=[15] > 右侧最小值A[1] = 3 (B[5] = 30 > A[1]) 不能构成有序数组, 不符合

当 i = 2 时 j = 4 左侧最大值为B[3] = 12 右侧最小值是 A[2] = 6 不符合

当 i = 3 时 j = 3 左侧最大值是 B[2] = 9 右侧最小值是 A[3] = 8 不符合

当 i = 4 时 j = 2 左侧最大致是 A[3] = 8 右侧最小值是 B[2] = 9 符合 因为 两个数组总长度是偶数 中位数是 (左侧最大 + 右侧最小) / 2 .0= (8 + 9) /2.0 = 8.5

明显的此时的时间复杂度为O(m) 不符合 O(log (m+n)) 的算法。

采用二分查找法来进行处理,以数组长度较小的作为定准。为什么不能以较大的呢?假设m = 20 n = 2;因为二分查找, i 的取值范围是[0,20],k = (m+2)/2 = 11 如果i取大于11的数那么j就只能取负数,明显是不合理的。因此需要用较小长度的数组作为定准。

既然采用二分法来查找i的取值,那么什么时候 这个范围向上,什么时候范围向下呢?

我们继续补全上面案例中的数据

i = 5 时 j = 1 左侧最大数 A[4] = 12 右侧最小数为 B[1] = 6 不符合

i = 6 时 j = 0 左侧最大数 A[5] = 19 右侧最小数B[0] = 1 不符合

可以发现,当A[i] <= B[j-1]的时候 i 还可以增加。否则只能减小。

数组AB都有序,i 减小,j会增加,如果此时再去减小i 那么A[i] <= B[j-1]会永远为true,只有增加I减小j。

这样我们就能理解官方的数组划分的方法了。

官方参考代码:

public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        if (nums1.length > nums2.length) {
            return findMedianSortedArrays(nums2, nums1);
        }

        int m = nums1.length;
        int n = nums2.length;
        int left = 0, right = m;
        // median1:前一部分的最大值
        // median2:后一部分的最小值
        int median1 = 0, median2 = 0;

        while (left <= right) {
            // 前一部分包含 nums1[0 .. i-1] 和 nums2[0 .. j-1]
            // 后一部分包含 nums1[i .. m-1] 和 nums2[j .. n-1]
            int i = (left + right) / 2;
            int j = (m + n + 1) / 2 - i;

            // nums_im1, nums_i, nums_jm1, nums_j 分别表示 nums1[i-1], nums1[i], nums2[j-1], nums2[j]
            int nums_im1 = (i == 0 ? Integer.MIN_VALUE : nums1[i - 1]);
            int nums_i = (i == m ? Integer.MAX_VALUE : nums1[i]);
            int nums_jm1 = (j == 0 ? Integer.MIN_VALUE : nums2[j - 1]);
            int nums_j = (j == n ? Integer.MAX_VALUE : nums2[j]);

            if (nums_im1 <= nums_j) {
                median1 = Math.max(nums_im1, nums_jm1);
                median2 = Math.min(nums_i, nums_j);
                left = i + 1;
            } else {
                right = i - 1;
            }
        }

        return (m + n) % 2 == 0 ? (median1 + median2) / 2.0 : median1;
    }

总代码参考地址:

github.com/xiaolutang/…