彻底搞懂 - 二分查找

我们假设只有 10 个订单,订单金额分别是:8,11,19,23,27,33,45,55,67,98。现在需要找到点单金额为19的订单,查找过程如下图: 看懂了上面这个例子,总结一下什么是二分查找: 二分查找针对的是一个有序的数据集合,查找思想有点类似分治思想。每次都通过跟区间的中间元素对比,将待查找的区间缩小为之前的一半,直到找到要查找的元素,或者区间被缩小为 0。

我们假设数据大小是 n,每次查找后数据都会缩小为原来的一半,也就是会除以 2。最坏情况下,直到查找区间被缩小为空,才停止。 可以看出来,这是一个等比数列。其中 n/2k=1 时,k 的值就是总共缩小的次数。而每一次缩小操作只涉及两个数据的大小比较,所以,经过了 k 次区间缩小操作,时间复杂度就是 O(k)。通过 n/2k=1,我们可以求得 k=log2n,所以时间复杂度就是 O(logn)。

根据上面的描述,我们来是实现一下二分查找:

public int bsearch(int[] a,int n, int target) {
  int low = 0;
  int high = n - 1;
  while (low <= high) {
    int mid = low + ((high - low) >> 1);
    if(a[mid] < target) {
      low = mid + 1;
    } else if (a[mid] > target) {
      high = mid - 1;
    } else {
      return mid;
    }
  }
  return -1;
}
复制代码

这里有容易出错的3个地方:

  1. 循环退出条件: 注意是 low<=high,而不是 low<high。
  2. mid 的取值: 实际上,mid=(low+high)/2 这种写法是有问题的。因为如果 low 和 high 比较大的话,两者之和就有可能会溢出。改进的方法是将 mid 的计算方式写成 low+(high-low)/2。更进一步,如果要将性能优化到极致的话,我们可以将这里的除以 2 操作转化成位运算 low+((high-low)>>1)。因为相比除法运算来说,计算机处理位运算要快得多。 3.low 和 high 的更新: low=mid+1,high=mid-1。注意这里的 +1 和 -1,如果直接写成 low=mid 或者 high=mid,就可能会发生死循环。比如,当 high=3,low=3 时,如果 a[3]不等于 value,就会导致一直循环不退出。

四种二分查找的变形:

  1. 查找第一个值等于给定值的元素
public int bsearch(int[] a,int n,int target) {
  int low = 0;
  int high = n - 1;
  while(low <= high) {
    int mid = low + ((high - low) >> 1);
    if(a[mid] < target) {
      low = mid + 1;
    } else if(a[mid] > target) {
      high = mid - 1;
    } else {
      if(mid == 0 || (a[mid] != a[mid - 1])) return mid;
      else high = mid - 1; 
    }
  }
}
复制代码
  1. 查找最后一个值等于给定值的元素
public int bsearch(int[] a,int n,int target) {
  int low = 0;
  int high = n - 1;
  while(low <= high) {
    int mid = low + ((high - low) >> 1);
    if(a[mid] < target) {
      low = mid + 1;
    } else if(a[mid] > target) {
      high = mid - 1;
    } else {
      if(mid == 0 || (a[mid] != a[mid + 1])) return mid;
      else low = mid + 1; 
    }
  }
}
复制代码
  1. 查找第一个大于等于给定值的元素
public int bsearch(int[] a,int n,int target) {
  int low = 0;
  int high = n - 1;
  while(low <= high) {
    int mid = low + ((high - low) >> 1);
    if(a[mid] < target) {
      low = mid + 1;
    } else if(a[mid] >= target) {
      if(mid == 0 || (a[mid - 1] < target)) return mid;
      else high = mid - 1;
    }
  }
}
复制代码
  1. 查找最后一个小于等于给定值的元素
public int bsearch(int[] a,int n,int target) {
  int low = 0;
  int high = n - 1;
  while(low <= high) {
    int mid = low + ((high - low) >> 1);
    if(a[mid] > target) {
      high = mid - 1;
    } else {
      if((mid == high) || (a[mid + 1] > target)) return mid;
      else low = mid + 1;
    }
  }
}
复制代码
分类:
后端
标签: