我们假设只有 10 个订单,订单金额分别是:8,11,19,23,27,33,45,55,67,98。现在需要找到点单金额为19的订单,查找过程如下图:
看懂了上面这个例子,总结一下什么是二分查找: 二分查找针对的是一个有序的数据集合,查找思想有点类似分治思想。每次都通过跟区间的中间元素对比,将待查找的区间缩小为之前的一半,直到找到要查找的元素,或者区间被缩小为 0。
我们假设数据大小是 n,每次查找后数据都会缩小为原来的一半,也就是会除以 2。最坏情况下,直到查找区间被缩小为空,才停止。
可以看出来,这是一个等比数列。其中 n/2k=1 时,k 的值就是总共缩小的次数。而每一次缩小操作只涉及两个数据的大小比较,所以,经过了 k 次区间缩小操作,时间复杂度就是 O(k)。通过 n/2k=1,我们可以求得 k=log2n,所以时间复杂度就是 O(logn)。
根据上面的描述,我们来是实现一下二分查找:
public int bsearch(int[] a,int n, int target) {
int low = 0;
int high = n - 1;
while (low <= high) {
int mid = low + ((high - low) >> 1);
if(a[mid] < target) {
low = mid + 1;
} else if (a[mid] > target) {
high = mid - 1;
} else {
return mid;
}
}
return -1;
}
复制代码
这里有容易出错的3个地方:
- 循环退出条件: 注意是 low<=high,而不是 low<high。
- mid 的取值: 实际上,mid=(low+high)/2 这种写法是有问题的。因为如果 low 和 high 比较大的话,两者之和就有可能会溢出。改进的方法是将 mid 的计算方式写成 low+(high-low)/2。更进一步,如果要将性能优化到极致的话,我们可以将这里的除以 2 操作转化成位运算 low+((high-low)>>1)。因为相比除法运算来说,计算机处理位运算要快得多。 3.low 和 high 的更新: low=mid+1,high=mid-1。注意这里的 +1 和 -1,如果直接写成 low=mid 或者 high=mid,就可能会发生死循环。比如,当 high=3,low=3 时,如果 a[3]不等于 value,就会导致一直循环不退出。
四种二分查找的变形:
- 查找第一个值等于给定值的元素
public int bsearch(int[] a,int n,int target) {
int low = 0;
int high = n - 1;
while(low <= high) {
int mid = low + ((high - low) >> 1);
if(a[mid] < target) {
low = mid + 1;
} else if(a[mid] > target) {
high = mid - 1;
} else {
if(mid == 0 || (a[mid] != a[mid - 1])) return mid;
else high = mid - 1;
}
}
}
复制代码
- 查找最后一个值等于给定值的元素
public int bsearch(int[] a,int n,int target) {
int low = 0;
int high = n - 1;
while(low <= high) {
int mid = low + ((high - low) >> 1);
if(a[mid] < target) {
low = mid + 1;
} else if(a[mid] > target) {
high = mid - 1;
} else {
if(mid == 0 || (a[mid] != a[mid + 1])) return mid;
else low = mid + 1;
}
}
}
复制代码
- 查找第一个大于等于给定值的元素
public int bsearch(int[] a,int n,int target) {
int low = 0;
int high = n - 1;
while(low <= high) {
int mid = low + ((high - low) >> 1);
if(a[mid] < target) {
low = mid + 1;
} else if(a[mid] >= target) {
if(mid == 0 || (a[mid - 1] < target)) return mid;
else high = mid - 1;
}
}
}
复制代码
- 查找最后一个小于等于给定值的元素
public int bsearch(int[] a,int n,int target) {
int low = 0;
int high = n - 1;
while(low <= high) {
int mid = low + ((high - low) >> 1);
if(a[mid] > target) {
high = mid - 1;
} else {
if((mid == high) || (a[mid + 1] > target)) return mid;
else low = mid + 1;
}
}
}
复制代码