0 二分查找算法简介
0.1 特点
最恶心、细节最多、最容易写出死循环的算法 --> 最简单
0.2 学习中的侧重点
0.2.1 算法原理
不仅适用于数组有序的情况
0.2.2 模板
不要死记硬背 --> 理解之后再记忆
- 朴素的二分模板 --> 局限
while (left <= right)
{
// 先找到区间的中间元素
int mid = left + (right - left) / 2;
// 分三种情况
if (nums[mid] > target) right = mid - 1;
else if (nums[mid] < target) left = mid + 1;
else return mid;
}
- 查找左边界的二分模板 --> 万能 --> 细节多
int left = 0, right = nums.size() - 1;
while (left < right)
{
int mid = left + (right - left) / 2;
if (nums[mid] < target) left = mid + 1;
else right = mid;
}
- 查找右边界的二分模板 --> 万能 --> 细节多
left = 0, right = nums.size() - 1;
while (left < right)
{
int mid = left + (right - left + 1) / 2;
if (nums[mid] > target) right = mid - 1;
else left = mid;
}
1 二分查找
1.1 题目链接
1.2 题目描述
给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。
示例 1:
输入: nums = [-1,0,3,5,9,12], target = 9
输出: 4
解释: 9 出现在 nums 中并且下标为 4
示例 2:
输入: nums = [-1,0,3,5,9,12], target = 2
输出: -1
解释: 2 不存在 nums 中因此返回 -1
1.3 解法
算法流程:
- a. 定义 left , right 指针,分别指向数组的左右区间。
- b. 找到待查找区间的中间点 mid ,找到之后分三种情况讨论:
- i. arr[mid] == target 说明正好找到,返回 mid 的值;
- ii. arr[mid] > target 说明 [mid, right] 这段区间都是⼤于 target 的,因此舍去右边区间,在左边 [left, mid -1] 的区间继续查找,即让 right = mid - 1 ,然后重复 2 过程;
- iii. arr[mid] < target 说明 [left, mid] 这段区间的值都是⼩于 target 的,因此舍去左边区间,在右边 [mid + 1, right] 区间继续查找,即让 left = mid + 1 ,然后重复 2 过程;
- c. 当 left 与 right 错开时,说明整个区间都没有这个数,返回 -1 。
1.4 C++算法代码:
class Solution {
public:
int search(vector<int>& nums, int target) {
// 初始化 left 和 right 指针
int left = 0, right =nums.size() - 1;
// 由于两个指针相交时,当前元素还未判断,因此需要取等号
while(left <= right)
{
// 先找到区间的中间元素
int mid = left + (right - left) / 2;
// 分三种情况
if(nums[mid] > target) right = mid -1;
else if(nums[mid] < target) left =mid + 1;
else return mid;
}
// 程序如果走到这里,说明没有找到目标值,返回 -1
return -1;
}
};
2 在排序数组中查找元素的第一个和最后一个位置
2.1 题目链接
2.2 题目描述
给你一个按照非递减顺序排列的整数数组 nums,和一个目标值 target。请你找出给定目标值在数组中的开始位置和结束位置。
如果数组中不存在目标值 target,返回 [-1, -1]。
你必须设计并实现时间复杂度为 O(log n) 的算法解决此问题。
示例 1:
输入: nums = [5,7,7,8,8,10], target = 8
输出: [3,4]
示例 2:
输入: nums = [5,7,7,8,8,10], target = 6
输出: [-1,-1]
示例 3:
输入: nums = [], target = 0
输出: [-1,-1]
2.3 解法
算法思路:
⽤的还是⼆分思想,就是根据数据的性质,在某种判断条件下将区间⼀分为⼆,然后舍去其中⼀个区间,然后再另⼀个区间内查找;
⽅便叙述,⽤ x 表⽰该元素, resLeft 表⽰左边界, resRight 表⽰右边界。
寻找左边界思路:
- 寻找左边界:
- 我们注意到以左边界划分的两个区间的特点:
- 左边区间 [left, resLeft - 1] 都是⼩于 x 的;
- 右边区间(包括左边界) [resLeft, right] 都是⼤于等于 x 的;
- 我们注意到以左边界划分的两个区间的特点:
- 因此,关于 mid 的落点,我们可以分为下⾯两种情况:
- 当我们的 mid 落在 [left, resLeft - 1] 区间的时候,也就是 arr[mid] < target 。说明 [left, mid] 都是可以舍去的,此时更新 left 到 mid + 1 的位置,继续在 [mid + 1, right] 上寻找左边界;
- 当 mid 落在 [resLeft, right] 的区间的时候,也就是 arr[mid] >= target 。说明 [mid + 1, right] (因为 mid 可能是最终结果,不能舍去)是可以舍去的,此时更新 right 到 mid 的位置,继续在 [left, mid] 上寻找左边界;
- 由此,就可以通过⼆分,来快速寻找左边界;
注意:这⾥找中间元素需要向下取整。
因为后续移动左右指针的时候:
- 左指针: left = mid + 1 ,是会向后移动的,因此区间是会缩⼩的;
- 右指针: right = mid ,可能会原地踏步(⽐如:如果向上取整的话,如果剩下 1,2 两个元素, left == 1 , right == 2 , mid == 2 。更新区间之后, left,right,mid 的值没有改变,就会陷入死循环)。
因此⼀定要注意,当 right = mid 的时候,要向下取整。
寻找右边界思路:
- 寻右左边界:
- ⽤ resRight 表⽰右边界;
- 我们注意到右边界的特点:
- 左边区间 (包括右边界) [left, resRight] 都是⼩于等于 x 的;
- 右边区间 [resRight+ 1, right] 都是⼤于 x 的;
- 因此,关于 mid 的落点,我们可以分为下⾯两种情况:
- 当我们的 mid 落在 [left, resRight] 区间的时候,说明 [left, mid - 1]( mid 不可以舍去,因为有可能是最终结果) 都是可以舍去的,此时更新 left 到 mid的位置◦
- 当 mid;落在 [resRight+ 1, right] 的区间的时候,说明 [mid, right] 内的元素是可以舍去的,此时更新 right 到 mid - 1 的位置;
- 由此,就可以通过⼆分,来快速寻找右边界;
注意:这⾥找中间元素需要向上取整。 因为后续移动左右指针的时候:
- 左指针: left = mid ,可能会原地踏步(⽐如:如果向下取整的话,如果剩下 1,2 两个元素, left == 1, right == 2,mid == 1 。更新区间之后, left,right,mid 的值没有改变,就会陷⼊死循环)。
- 右指针: right = mid - 1 ,是会向前移动的,因此区间是会缩⼩的;
因此一定要注意,当 right = mid 的时候,要向下取整。
2.4 C++算法代码:
class Solution {
public:
vector<int> searchRange(vector<int>& nums, int target) {
// 处理边界情况
if(nums.size() == 0) return {-1, -1};
int begin = 0;
// 1.二分左端点
int left = 0, right =nums.size() - 1;
while(left < right)
{
int mid = left + (right -left) / 2;
if(nums[mid] < target) left = mid + 1;
else right = mid;
}
// 判断是否有结果
if(nums[left] != target) return {-1, -1};
else begin =left; // 标记一下左端点
// 2.二分右端点
left = 0, right = nums.size() -1;
while(left < right)
{
int mid =left + (right - left + 1) / 2;
if(nums[mid] > target) right = mid -1;
else left = mid;
}
return {begin, right};
}
};
3 搜索插入位置
3.1 题目链接
3.2 题目描述
给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。
请必须使用时间复杂度为 O(log n) 的算法。
示例 1:
输入: nums = [1,3,5,6], target = 5
输出: 2
示例 2:
输入: nums = [1,3,5,6], target = 2
输出: 1
示例 3:
输入: nums = [1,3,5,6], target = 7
输出: 4
3.3 解法(⼆分查找算法):
算法思路:
- a. 分析插⼊位置左右两侧区间上元素的特点:设插⼊位置的坐标为 index ,根据插⼊位置的特点可以知道:
- [left, index - 1] 内的所有元素均是⼩于 target 的;
- [index, right] 内的所有元素均是⼤于等于 target 的。
- b. 设 left 为本轮查询的左边界, right 为本轮查询的右边界。根据 mid 位置元素的信息,分析下⼀轮查询的区间:
- 当 nums[mid] >= target 时,说明 mid 落在了 [index, right] 区间上,mid 左边包括 mid 本⾝,可能是最终结果,所以我们接下来查找的区间在 [left,mid] 上。因此,更新 right 到 mid 位置,继续查找。
- 当 nums[mid] < target 时,说明 mid 落在了 [left, index - 1] 区间上,mid 右边但不包括 mid 本⾝,可能是最终结果,所以我们接下来查找的区间在 [mid+ 1, right] 上。因此,更新 left 到 mid + 1 的位置,继续查找。
- c. 直到我们的查找区间的⻓度变为 1 ,也就是 left == right 的时候, left 或者right 所在的位置就是我们要找的结果。
3.4 C++算法代码:
class Solution {
public:
int searchInsert(vector<int>& nums, int target) {
int left = 0, right = nums.size() - 1;
while(left < right)
{
int mid = left + (right - left) / 2;
if(nums[mid] < target) left = mid + 1;
else right = mid;
}
if(nums[left] < target) return left + 1;
return left;
}
};
4 x 的平方根
4.1 题目链接
4.2 题目描述
给你一个非负整数 x ,计算并返回 x 的 算术平方根 。
由于返回类型是整数,结果只保留 整数部分 ,小数部分将被 舍去 。
注意: 不允许使用任何内置指数函数和算符,例如 pow(x, 0.5) 或者 x ** 0.5 。
示例 1:
输入: x = 4
输出: 2
示例 2:
输入: x = 8
输出: 2
解释: 8 的算术平方根是 2.82842..., 由于返回类型是整数,小数部分将被舍去。
4.3 解法(⼆分查找算法):
算法思路:
设 x 的平⽅根的最终结果为 index :
- a. 分析 index 左右两次数据的特点:
- [0, index] 之间的元素,平⽅之后都是⼩于等于 x 的;
- index + 1, x] 之间的元素,平⽅之后都是⼤于 x 的。
因此可以使⽤⼆分查找算法。
4.4 C++算法代码:
class Solution {
public:
int mySqrt(int x) {
if(x < 1) return 0; // 处理边界问题
int left = 1, right = x;
while(left < right)
{
long long mid = left + (right - left + 1) / 2; // 防溢出
if(mid * mid > x) right = mid -1;
else left = mid;
}
return right;
}
};
5 山脉数组的峰顶索引
5.1 题目链接
5.2 题目描述
给定一个长度为 n 的整数 山脉 数组 arr ,其中的值递增到一个 峰值元素 然后递减。
返回峰值元素的下标。
你必须设计并实现时间复杂度为 O(log(n)) 的解决方案。
示例 1:
输入: arr = [0,1,0]
输出: 1
示例 2:
输入: arr = [0,2,1,0]
输出: 1
示例 3:
输入: arr = [0,10,5,2]
输出: 1
5.3 解法(⼆分查找):
算法思路:
-
- 分析峰顶位置的数据特点,以及⼭峰两旁的数据的特点:
- 峰顶数据特点: arr[i] > arr[i - 1] && arr[i] > arr[i + 1] ;
- 峰顶左边的数据特点: arr[i] > arr[i - 1] && arr[i] < arr[i + 1] ,也就是呈现上升趋势;
- 峰顶右边数据的特点: arr[i] < arr[i - 1] && arr[i] > arr[i + 1] ,也就是呈现下降趋势。
-
- 因此,根据 mid 位置的信息,我们可以分为下⾯三种情况:
- 如果 mid 位置呈现上升趋势,说明我们接下来要在 [mid + 1, right] 区间继续搜索;
- 如果 mid 位置呈现下降趋势,说明我们接下来要在 [left, mid - 1] 区间搜索;
- 如果 mid 位置就是⼭峰,直接返回结果。
5.4 C++算法代码:
class Solution {
public:
int peakIndexInMountainArray(vector<int>& arr) {
int left = 1, right = arr.size() - 2;
while(left < right)
{
int mid = left + (right - left ) / 2;
if(arr[mid] < arr[mid + 1]) left = mid + 1;
else right = mid;
}
return left;
}
};
6 寻找峰值
6.1 题目链接
6.2 题目描述
峰值元素是指其值严格大于左右相邻值的元素。
给你一个整数数组 nums,找到峰值元素并返回其索引。数组可能包含多个峰值,在这种情况下,返回 任何一个峰值 所在位置即可。
你可以假设 nums[-1] = nums[n] = -∞ 。
你必须实现时间复杂度为 O(log n) **的算法来解决此问题。
示例 1:
输入: nums = [1,2,3,1]
输出: 2
解释: 3 是峰值元素,你的函数应该返回其索引 2。
示例 2:
输入: nums = [1,2,1,3,5,6,4]
输出: 1 或 5
解释: 你的函数可以返回索引 1,其峰值元素为 2;
或者返回索引 5, 其峰值元素为 6。
6.3 解法(⼆分查找算法):
算法思路:
- 寻找⼆段性:
- 任取⼀个点 i ,与下⼀个点 i + 1 ,会有如下两种情况:
- arr[i] > arr[i + 1] :此时左侧区域⼀定会存在⼭峰(因为最左侧是负⽆穷),那么我们可以去左侧去寻找结果;
- arr[i] < arr[i + 1] :此时右侧区域⼀定会存在⼭峰(因为最右侧是负⽆穷),那么我们可以去右侧去寻找结果。
- 任取⼀个点 i ,与下⼀个点 i + 1 ,会有如下两种情况:
- 当我们找到⼆段性的时候,就可以尝试⽤⼆分查找算法来解决问题。
6.4 C++算法代码:
class Solution {
public:
int findPeakElement(vector<int>& nums) {
int left = 1, right = nums.size() - 2;
while(left < right)
{
int mid = left + (right - left + 1) / 2;
if(nums[mid] < nums[mid + 1]) right = mid - 1;
else left = mid;
}
return right;
}
};
7 寻找旋转排序数组中的最小值
7.1 题目链接
7.2 题目描述
已知一个长度为 n 的数组,预先按照升序排列,经由 1 到 n 次 旋转 后,得到输入数组。例如,原数组 nums = [0,1,2,4,5,6,7] 在变化后可能得到:
- 若旋转
4次,则可以得到[4,5,6,7,0,1,2] - 若旋转
7次,则可以得到[0,1,2,4,5,6,7]
注意,数组 [a[0], a[1], a[2], ..., a[n-1]] 旋转一次 的结果为数组 [a[n-1], a[0], a[1], a[2], ..., a[n-2]] 。
给你一个元素值 互不相同 的数组 nums ,它原来是一个升序排列的数组,并按上述情形进行了多次旋转。请你找出并返回数组中的 最小元素 。
你必须设计一个时间复杂度为 O(log n) 的算法解决此问题。
示例 1:
输入: nums = [3,4,5,1,2]
输出: 1
解释: 原数组为 [1,2,3,4,5] ,旋转 3 次得到输入数组。
示例 2:
输入: nums = [4,5,6,7,0,1,2]
输出: 0
解释: 原数组为 [0,1,2,4,5,6,7] ,旋转 3 次得到输入数组。
示例 3:
输入: nums = [11,13,15,17]
输出: 11
解释: 原数组为 [11,13,15,17] ,旋转 4 次得到输入数组。
7.3 解法(⼆分查找):
算法思路:
题⽬中的数组规则如下图所⽰:
其中 C 点就是我们要求的点。
⼆分的本质:找到⼀个判断标准,使得查找区间能够⼀分为⼆。
通过图像我们可以发现, [A,B] 区间内的点都是严格⼤于 D 点的值的, C 点的值是严格⼩于 D 点的值的。但是当 [C,D] 区间只有⼀个元素的时候, C 点的值是可能等于 D 点的值的。
因此,初始化左右两个指针 left , right :
然后根据 mid 的落点,我们可以这样划分下⼀次查询的区间:
- 当 mid 在 [A,B] 区间的时候,也就是 mid 位置的值严格⼤于 D 点的值,下⼀次查询区间在 [mid + 1,right] 上;
- 当 mid 在 [C,D] 区间的时候,也就是 mid 位置的值严格⼩于等于 D 点的值,下次查询区间在 [left,mid] 上。
当区间⻓度变成 1 的时候,就是我们要找的结果。
7.4 C++算法代码:
class Solution {
public:
int findMin(vector<int>& nums) {
int left = 0, right = nums.size() - 1;
while(left < right)
{
int mid = left + (right -left) / 2;
if(nums[mid] > nums[nums.size() - 1]) left = mid + 1;
else right = mid;
}
return nums[left];
}
};
8 剑指 Offer 53 - II. 0〜n-1中缺失的数字
8.1 题目链接
8.2 题目描述
某班级 n 位同学的学号为 0 ~ n-1。点名结果记录于升序数组 records。假定仅有一位同学缺席,请返回他的学号。
示例 1:
输入: records = [0,1,2,3,5]
输出: 4
示例 2:
输入: records = [0, 1, 2, 3, 4, 5, 6, 8]
输出: 7
8.3 解法(⼆分查找算法):
算法思路: 关于这道题中,时间复杂度为 O(N) 的解法有很多种,⽽且也是⽐较好想的,这⾥就不再赘述。
本题只讲解⼀个最优的⼆分法,来解决这个问题。
在这个升序的数组中,我们发现:
- 在第⼀个缺失位置的左边,数组内的元素都是与数组的下标相等的;
- 在第⼀个缺失位置的右边,数组内的元素与数组下标是不相等的。
因此,我们可以利用这个⼆段性,来使⽤⼆分查找算法。
8.4 C++算法代码:
class Solution {
public:
int takeAttendance(vector<int>& records) {
int left = 0, right = records.size() - 1;
while(left < right)
{
int mid = left + (right - left) / 2;
if(records[mid] == mid) left = mid + 1;
else right = mid;
}
return records[left] == left ? left + 1 : left;
}
};