专题三:二分

76 阅读14分钟

0 二分查找算法简介

0.1 特点

最恶心、细节最多、最容易写出死循环的算法 --> 最简单

0.2 学习中的侧重点

0.2.1 算法原理

不仅适用于数组有序的情况

0.2.2 模板

不要死记硬背 --> 理解之后再记忆

  1. 朴素的二分模板 --> 局限
while (left <= right)
{
    // 先找到区间的中间元素
    int mid = left + (right - left) / 2;
    // 分三种情况
    if (nums[mid] > target) right = mid - 1;
    else if (nums[mid] < target) left = mid + 1;
    else return mid;
}
  1. 查找左边界的二分模板 --> 万能 --> 细节多
int left = 0, right = nums.size() - 1;
while (left < right)
{
    int mid = left + (right - left) / 2;
    if (nums[mid] < target) left = mid + 1;
    else right = mid;
}
  1. 查找右边界的二分模板 --> 万能 --> 细节多
left = 0, right = nums.size() - 1;
while (left < right)
{
    int mid = left + (right - left + 1) / 2;
    if (nums[mid] > target) right = mid - 1;
    else left = mid;
}

1 二分查找

1.1 题目链接

704. 二分查找

1.2 题目描述

给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target  ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1

示例 1:

输入: nums = [-1,0,3,5,9,12], target = 9
输出: 4
解释: 9 出现在 nums 中并且下标为 4

示例 2:

输入: nums = [-1,0,3,5,9,12], target = 2
输出: -1
解释: 2 不存在 nums 中因此返回 -1

1.3 解法

算法流程

  • a. 定义 left , right 指针,分别指向数组的左右区间。
  • b. 找到待查找区间的中间点 mid ,找到之后分三种情况讨论:
    • i. arr[mid] == target 说明正好找到,返回 mid 的值;
    • ii. arr[mid] > target 说明 [mid, right] 这段区间都是⼤于 target 的,因此舍去右边区间,在左边 [left, mid -1] 的区间继续查找,即让 right = mid - 1 ,然后重复 2 过程;
    • iii. arr[mid] < target 说明 [left, mid] 这段区间的值都是⼩于 target 的,因此舍去左边区间,在右边 [mid + 1, right] 区间继续查找,即让 left = mid + 1 ,然后重复 2 过程;
  • c. 当 left 与 right 错开时,说明整个区间都没有这个数,返回 -1 。

1.4 C++算法代码:

class Solution {
public:
    int search(vector<int>& nums, int target) {
        // 初始化 left 和 right 指针
        int left = 0, right =nums.size() - 1;
        // 由于两个指针相交时,当前元素还未判断,因此需要取等号
        while(left <= right)
        {
            // 先找到区间的中间元素
            int mid = left + (right - left) / 2;
            // 分三种情况
            if(nums[mid] > target) right = mid -1;
            else if(nums[mid] < target) left =mid + 1;
            else return mid;
        }
        // 程序如果走到这里,说明没有找到目标值,返回 -1 
        return -1;
    }
};

2 在排序数组中查找元素的第一个和最后一个位置

2.1 题目链接

34. 在排序数组中查找元素的第一个和最后一个位置

2.2 题目描述

给你一个按照非递减顺序排列的整数数组 nums,和一个目标值 target。请你找出给定目标值在数组中的开始位置和结束位置。

如果数组中不存在目标值 target,返回 [-1, -1]

你必须设计并实现时间复杂度为 O(log n) 的算法解决此问题。

 

示例 1:

输入: nums = [5,7,7,8,8,10], target = 8
输出: [3,4]

示例 2:

输入: nums = [5,7,7,8,8,10], target = 6
输出: [-1,-1]

示例 3:

输入: nums = [], target = 0
输出: [-1,-1]

2.3 解法

算法思路

⽤的还是⼆分思想,就是根据数据的性质,在某种判断条件下将区间⼀分为⼆,然后舍去其中⼀个区间,然后再另⼀个区间内查找;

⽅便叙述,⽤ x 表⽰该元素, resLeft 表⽰左边界, resRight 表⽰右边界。

寻找左边界思路

  • 寻找左边界:
    • 我们注意到以左边界划分的两个区间的特点:
      • 左边区间 [left, resLeft - 1] 都是⼩于 x 的;
      • 右边区间(包括左边界) [resLeft, right] 都是⼤于等于 x 的;
  • 因此,关于 mid 的落点,我们可以分为下⾯两种情况:
    • 当我们的 mid 落在 [left, resLeft - 1] 区间的时候,也就是 arr[mid] < target 。说明 [left, mid] 都是可以舍去的,此时更新 left 到 mid + 1 的位置,继续在 [mid + 1, right] 上寻找左边界;
    • 当 mid 落在 [resLeft, right] 的区间的时候,也就是 arr[mid] >= target 。说明 [mid + 1, right] (因为 mid 可能是最终结果,不能舍去)是可以舍去的,此时更新 right 到 mid 的位置,继续在 [left, mid] 上寻找左边界;
  • 由此,就可以通过⼆分,来快速寻找左边界;

注意:这⾥找中间元素需要向下取整

因为后续移动左右指针的时候:

  • 左指针: left = mid + 1 ,是会向后移动的,因此区间是会缩⼩的;
  • 右指针: right = mid ,可能会原地踏步(⽐如:如果向上取整的话,如果剩下 1,2 两个元素, left == 1 , right == 2 , mid == 2 。更新区间之后, left,right,mid 的值没有改变,就会陷入死循环)。

因此⼀定要注意,当 right = mid 的时候,要向下取整。

寻找右边界思路

  • 寻右左边界:
    • ⽤ resRight 表⽰右边界;
    • 我们注意到右边界的特点:
      • 左边区间 (包括右边界) [left, resRight] 都是⼩于等于 x 的;
      • 右边区间 [resRight+ 1, right] 都是⼤于 x 的;
  • 因此,关于 mid 的落点,我们可以分为下⾯两种情况:
    • 当我们的 mid 落在 [left, resRight] 区间的时候,说明 [left, mid - 1]( mid 不可以舍去,因为有可能是最终结果) 都是可以舍去的,此时更新 left 到 mid的位置◦
    • 当 mid;落在 [resRight+ 1, right] 的区间的时候,说明 [mid, right] 内的元素是可以舍去的,此时更新 right 到 mid - 1 的位置;
  • 由此,就可以通过⼆分,来快速寻找右边界;

注意:这⾥找中间元素需要向上取整。 因为后续移动左右指针的时候:

  • 左指针: left = mid ,可能会原地踏步(⽐如:如果向下取整的话,如果剩下 1,2 两个元素, left == 1, right == 2,mid == 1 。更新区间之后, left,right,mid 的值没有改变,就会陷⼊死循环)。
  • 右指针: right = mid - 1 ,是会向前移动的,因此区间是会缩⼩的;

因此一定要注意,当 right = mid 的时候,要向下取整。

2.4 C++算法代码:

class Solution {
public:
    vector<int> searchRange(vector<int>& nums, int target) {
        // 处理边界情况
        if(nums.size() == 0) return {-1, -1};

        int begin = 0;
        // 1.二分左端点
        int left = 0, right =nums.size() - 1;
        while(left < right)
        {
            int mid = left + (right -left) / 2;
            if(nums[mid] < target) left = mid + 1;
            else right = mid;
        }
        // 判断是否有结果
        if(nums[left] != target) return {-1, -1};
        else begin =left;  // 标记一下左端点

        // 2.二分右端点
        left = 0, right = nums.size() -1;
        while(left < right)
        {
            int mid =left + (right - left + 1) / 2;
            if(nums[mid] > target) right = mid -1;
            else left = mid;
        }
        return {begin, right};
    }
};

3 搜索插入位置

3.1 题目链接

35. 搜索插入位置

3.2 题目描述

给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。

请必须使用时间复杂度为 O(log n) 的算法。

 

示例 1:

输入: nums = [1,3,5,6], target = 5
输出: 2

示例 2:

输入: nums = [1,3,5,6], target = 2
输出: 1

示例 3:

输入: nums = [1,3,5,6], target = 7
输出: 4

3.3 解法(⼆分查找算法):

算法思路

  • a. 分析插⼊位置左右两侧区间上元素的特点:设插⼊位置的坐标为 index ,根据插⼊位置的特点可以知道:
    • [left, index - 1] 内的所有元素均是⼩于 target 的;
    • [index, right] 内的所有元素均是⼤于等于 target 的。
  • b. 设 left 为本轮查询的左边界, right 为本轮查询的右边界。根据 mid 位置元素的信息,分析下⼀轮查询的区间:
    • 当 nums[mid] >= target 时,说明 mid 落在了 [index, right] 区间上,mid 左边包括 mid 本⾝,可能是最终结果,所以我们接下来查找的区间在 [left,mid] 上。因此,更新 right 到 mid 位置,继续查找。
    • 当 nums[mid] < target 时,说明 mid 落在了 [left, index - 1] 区间上,mid 右边但不包括 mid 本⾝,可能是最终结果,所以我们接下来查找的区间在 [mid+ 1, right] 上。因此,更新 left 到 mid + 1 的位置,继续查找。
  • c. 直到我们的查找区间的⻓度变为 1 ,也就是 left == right 的时候, left 或者right 所在的位置就是我们要找的结果。

3.4 C++算法代码:

class Solution {
public:
    int searchInsert(vector<int>& nums, int target) {
        int left = 0, right = nums.size() - 1;
        while(left < right)
        {
            int mid = left + (right - left) / 2;
            if(nums[mid] < target) left = mid + 1;
            else right = mid;
        }
        if(nums[left] < target) return left + 1;
        return left;
    }
};

4 x 的平方根

4.1 题目链接

69. x 的平方根 

4.2 题目描述

给你一个非负整数 x ,计算并返回 x 的 算术平方根 。

由于返回类型是整数,结果只保留 整数部分 ,小数部分将被 舍去 。

注意: 不允许使用任何内置指数函数和算符,例如 pow(x, 0.5) 或者 x ** 0.5 。

 

示例 1:

输入: x = 4
输出: 2

示例 2:

输入: x = 8
输出: 2
解释: 8 的算术平方根是 2.82842..., 由于返回类型是整数,小数部分将被舍去。

4.3 解法(⼆分查找算法):

算法思路

设 x 的平⽅根的最终结果为 index :

  • a. 分析 index 左右两次数据的特点:
    • [0, index] 之间的元素,平⽅之后都是⼩于等于 x 的;
    • index + 1, x] 之间的元素,平⽅之后都是⼤于 x 的。

因此可以使⽤⼆分查找算法。

4.4 C++算法代码:

class Solution {
public:
    int mySqrt(int x) {
        if(x < 1) return 0; // 处理边界问题
        int left = 1, right = x;
        while(left < right)
        {
            long long mid = left + (right - left + 1) / 2;  // 防溢出
            if(mid * mid > x) right = mid -1;
            else left = mid;
        }
        return right;
    }
};

5 山脉数组的峰顶索引

5.1 题目链接

852. 山脉数组的峰顶索引

5.2 题目描述

给定一个长度为 n 的整数 山脉 数组 arr ,其中的值递增到一个 峰值元素 然后递减。

返回峰值元素的下标。

你必须设计并实现时间复杂度为 O(log(n)) 的解决方案。

 

示例 1:

输入: arr = [0,1,0]
输出: 1

示例 2:

输入: arr = [0,2,1,0]
输出: 1

示例 3:

输入: arr = [0,10,5,2]
输出: 1

5.3 解法(⼆分查找):

算法思路

    1. 分析峰顶位置的数据特点,以及⼭峰两旁的数据的特点:
    • 峰顶数据特点: arr[i] > arr[i - 1] && arr[i] > arr[i + 1] ;
    • 峰顶左边的数据特点: arr[i] > arr[i - 1] && arr[i] < arr[i + 1] ,也就是呈现上升趋势;
    • 峰顶右边数据的特点: arr[i] < arr[i - 1] && arr[i] > arr[i + 1] ,也就是呈现下降趋势。
    1. 因此,根据 mid 位置的信息,我们可以分为下⾯三种情况:
    • 如果 mid 位置呈现上升趋势,说明我们接下来要在 [mid + 1, right] 区间继续搜索;
    • 如果 mid 位置呈现下降趋势,说明我们接下来要在 [left, mid - 1] 区间搜索;
    • 如果 mid 位置就是⼭峰,直接返回结果。

5.4 C++算法代码:

class Solution {
public:
    int peakIndexInMountainArray(vector<int>& arr) {
        int left = 1, right = arr.size() - 2;
        while(left < right)
        {
            int mid = left + (right - left ) / 2;
            if(arr[mid] < arr[mid + 1]) left = mid + 1;
            else right = mid;
        }
        return left;
    }
};

6 寻找峰值

6.1 题目链接

162. 寻找峰值

6.2 题目描述

峰值元素是指其值严格大于左右相邻值的元素。

给你一个整数数组 nums,找到峰值元素并返回其索引。数组可能包含多个峰值,在这种情况下,返回 任何一个峰值 所在位置即可。

你可以假设 nums[-1] = nums[n] = -∞ 。

你必须实现时间复杂度为 O(log n) **的算法来解决此问题。

 

示例 1:

输入: nums = [1,2,3,1]
输出: 2
解释: 3 是峰值元素,你的函数应该返回其索引 2。

示例 2:

输入: nums = [1,2,1,3,5,6,4]
输出: 1 或 5 
解释: 你的函数可以返回索引 1,其峰值元素为 2;
     或者返回索引 5, 其峰值元素为 6。

6.3 解法(⼆分查找算法):

算法思路

  • 寻找⼆段性:
    • 任取⼀个点 i ,与下⼀个点 i + 1 ,会有如下两种情况:
      • arr[i] > arr[i + 1] :此时左侧区域⼀定会存在⼭峰(因为最左侧是负⽆穷),那么我们可以去左侧去寻找结果;
      • arr[i] < arr[i + 1] :此时右侧区域⼀定会存在⼭峰(因为最右侧是负⽆穷),那么我们可以去右侧去寻找结果。
  • 当我们找到⼆段性的时候,就可以尝试⽤⼆分查找算法来解决问题。

6.4 C++算法代码:

class Solution {
public:
    int findPeakElement(vector<int>& nums) {
        int left = 1, right = nums.size() - 2;
        while(left < right)
        {
            int mid = left + (right - left + 1) / 2;
            if(nums[mid] < nums[mid + 1]) right = mid - 1;
            else left = mid;
        }
        return right;
    }
};

7 寻找旋转排序数组中的最小值

7.1 题目链接

153. 寻找旋转排序数组中的最小值

7.2 题目描述

已知一个长度为 n 的数组,预先按照升序排列,经由 1 到 n 次 旋转 后,得到输入数组。例如,原数组 nums = [0,1,2,4,5,6,7] 在变化后可能得到:

  • 若旋转 4 次,则可以得到 [4,5,6,7,0,1,2]
  • 若旋转 7 次,则可以得到 [0,1,2,4,5,6,7]

注意,数组 [a[0], a[1], a[2], ..., a[n-1]] 旋转一次 的结果为数组 [a[n-1], a[0], a[1], a[2], ..., a[n-2]] 。

给你一个元素值 互不相同 的数组 nums ,它原来是一个升序排列的数组,并按上述情形进行了多次旋转。请你找出并返回数组中的 最小元素 。

你必须设计一个时间复杂度为 O(log n) 的算法解决此问题。

 

示例 1:

输入: nums = [3,4,5,1,2]
输出: 1
解释: 原数组为 [1,2,3,4,5] ,旋转 3 次得到输入数组。

示例 2:

输入: nums = [4,5,6,7,0,1,2]
输出: 0
解释: 原数组为 [0,1,2,4,5,6,7] ,旋转 3 次得到输入数组。

示例 3:

输入: nums = [11,13,15,17]
输出: 11
解释: 原数组为 [11,13,15,17] ,旋转 4 次得到输入数组。

7.3 解法(⼆分查找):

算法思路

题⽬中的数组规则如下图所⽰:

image.png

其中 C 点就是我们要求的点。

⼆分的本质:找到⼀个判断标准,使得查找区间能够⼀分为⼆。

通过图像我们可以发现, [A,B] 区间内的点都是严格⼤于 D 点的值的, C 点的值是严格⼩于 D 点的值的。但是当 [C,D] 区间只有⼀个元素的时候, C 点的值是可能等于 D 点的值的。

因此,初始化左右两个指针 left , right :

然后根据 mid 的落点,我们可以这样划分下⼀次查询的区间:

  • 当 mid 在 [A,B] 区间的时候,也就是 mid 位置的值严格⼤于 D 点的值,下⼀次查询区间在 [mid + 1,right] 上;
  • 当 mid 在 [C,D] 区间的时候,也就是 mid 位置的值严格⼩于等于 D 点的值,下次查询区间在 [left,mid] 上。

当区间⻓度变成 1 的时候,就是我们要找的结果。

7.4 C++算法代码:

class Solution {
public:
    int findMin(vector<int>& nums) {
        int left = 0, right = nums.size() - 1;
        while(left < right)
        {
            int mid = left + (right -left) / 2;
            if(nums[mid] > nums[nums.size() - 1]) left = mid + 1;
            else right = mid;
        }
        return nums[left];
    }
};

8 剑指 Offer 53 - II. 0〜n-1中缺失的数字

8.1 题目链接

LCR 173. 点名

8.2 题目描述

某班级 n 位同学的学号为 0 ~ n-1。点名结果记录于升序数组 records。假定仅有一位同学缺席,请返回他的学号。

 

示例 1:

输入: records = [0,1,2,3,5]
输出: 4

示例 2:

输入: records = [0, 1, 2, 3, 4, 5, 6, 8]
输出: 7

8.3 解法(⼆分查找算法):

算法思路: 关于这道题中,时间复杂度为 O(N) 的解法有很多种,⽽且也是⽐较好想的,这⾥就不再赘述。

本题只讲解⼀个最优的⼆分法,来解决这个问题。

在这个升序的数组中,我们发现:

  • 在第⼀个缺失位置的左边,数组内的元素都是与数组的下标相等的;
  • 在第⼀个缺失位置的右边,数组内的元素与数组下标是不相等的。

因此,我们可以利用这个⼆段性,来使⽤⼆分查找算法。

8.4 C++算法代码:

class Solution {
public:
    int takeAttendance(vector<int>& records) {
        int left = 0, right = records.size() - 1;
        while(left < right)
        {
            int mid = left + (right - left) / 2;
            if(records[mid] == mid) left = mid + 1;
            else right = mid;
        }
        return records[left] == left ? left + 1 : left; 
    }
};