查找算法

245 阅读8分钟

1.常用的四种查找算法

  1. 顺序(线性)查找
  2. 二分查找
  3. 差值查找
  4. 斐波那契查找

2. 线性查找算法

例:从数列 {1, 9, 11, -1, 34, 89} 中查找

要求: 如果找到了,就提示找到,并给出下标值。


public class SeqSearch {

    public static void main(String[] args) {
        int arr[] = {1, 9, 11, -1, 34, 89};

        int index = seqSearch(arr, 11);
        
        if (index == -1) {
            System.out.println("没有找到");
        } else {
            System.out.println("找到,下标为:" + index);
        }
    }

    public static int seqSearch(int[] arr, int value) {
        //线性查找是逐一比对,发现右相同值,就返回下标
        for (int i = 0; i < arr.length; i++) {
            if (arr[i] == value) {
                return i;
            }
        }
        return -1;
    }
}
output:
找到,下标为:2

3. 二分查找

3.1 二分查找的思路分析

  1. 首先确定该数组的中间的下标:

    mid = (left + right) / 2

  2. 然后让需要查找的数 findVal 和 arr[mid] 比较

    1. findVal > arr[mid] , 说明你要查找的数在 mid 的右边, 因此需要递归的向右查找。
    2. findVal < arr[mid], 说明你要查找的数在 mid 的左边, 因此需要递归的向左查找。
    3. findVal == arr[mid] 说明找到,就返回。

利用递归的方法来查找 findVal。

结束查找的时机:

  1. 找到就结束递归。
  2. 递归完整个数组,仍然没有找到findVal ,也需要结束递归,即当 left > right 时,就结束递归。

例:对有序数组 {1, 8, 10, 89, 1000, 1000, 1000, 1234} 进行二分查找

  1. 输入一个数看看该数组是否存在此数,并且求出下标,如果没有就提示"没有这个数"。

import java.util.ArrayList;
import java.util.List;

//使用二分查找的前提是:该数组是有序的
public class BinarySearch {

    public static void main(String[] args) {
        int arr[] = {1, 8, 10, 89, 1000, 1000, 1000, 1234};

        //int resIndex = binarySearch(arr, 0, arr.length - 1, 1000);
        //System.out.println("resIndex = " + resIndex);

        List<Integer> resIndexList = binarySearch2(arr, 0, arr.length - 1, 1000);
        System.out.println("resIndexList = " + resIndexList);
    }

    //二分查找算法

    /**
     * @param arr     数组
     * @param left    左边的索引
     * @param right   右边的索引
     * @param findVal 要查找的值
     * @return 如果找到就返回下标,如果没有找到,就返回-1
     */
    public static int binarySearch(int[] arr, int left, int right, int findVal) {

        //当 eft > right 时,说明递归完了整个数组,但是没有找到
        if (left > right) {
            return -1;
        }

        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {//向右递归
            return binarySearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {//向左递归
            return binarySearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }
    }

    //返回所有查找值的下标

    /**
     * 思路分析:
     * 1. 在找到mid索引值时,不要马上返回
     * 2. 向mid索引值的左边扫描,将所有查找值元素的下标,加入到集合ArrayList中
     * 3. 向mid索引值的右边扫描,将所有查找值元素的下标,加入到集合ArrayList中
     * 4. 将ArrayList返回
     */
    public static List<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {

        //当left > right 时,说明递归完了整个数组,但是没有找到
        if (left > right) {
            return new ArrayList<Integer>();
        }

        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {//向右递归
            return binarySearch2(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {//向左递归
            return binarySearch2(arr, left, mid - 1, findVal);
        } else {
            List<Integer> resIndexList = new ArrayList<>();

            int temp = mid - 1;
            while (true) {
                if (temp < 0 || arr[temp] != findVal) {//退出
                    break;
                }
                //否则,就将temp放入到resIndexList
                resIndexList.add(temp);
                temp -= 1;//temp左移
            }
            resIndexList.add(mid);

            temp = mid + 1;
            while (true) {
                if (temp > arr.length - 1 || arr[temp] != findVal) {
                    break;
                }
                //否则,就将temp放入到resIndexList
                resIndexList.add(temp);
                temp += 1;
            }
            return resIndexList;
        }
    }
}

output:
1. resIndex = 5

2. resIndexList = [4, 5, 6]

4. 有序数组中的插值查找

4.1 插值查找原理介绍

  1. 插值查找算法类似于二分查找,不同的是插值查找每次从自适应的 mid 处开始查找。
  2. 差值查找中的求 mid 索引的公式,low 表示左边索引 left,high 表示右边索引 right,key 就是前面我们讲的 findVal。
二分查找 差值差值
  1. int mid = low + (high - low) * (key - arr[low]) / (arr[high] - arr[left)

4.2 代码实现


import java.util.Arrays;

public class InsertValueSearch {

    public static void main(String[] args) {
        int[] arr = new int[100];
        for (int i = 0; i < 100; i++) {
            arr[i] = i + 1;
        }
        //System.out.println(Arrays.toString(arr));

        //int arr[] = {1, 8, 10, 89, 1000, 1000, 1000, 1234};

        int index = insertValueSearch(arr, 0, arr.length - 1, 10);
        System.out.println("index = " + index);
    }

    //编写插值查找算法
    //说明:插值查找算法,也要求数组是有序的

    /**
     * @param arr     数组
     * @param left    左边索引
     * @param right   右边索引
     * @param findVal 查找值
     * @return
     */
    public static int insertValueSearch(int[] arr, int left, int right, int findVal) {

        System.out.println("查找次数");

        //注意:findVal < arr[0] || findVal > arr[arr.length - 1]必须需要
        //否则得到的mid可能越界
        if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
            return -1;
        }

        //求出mid
        int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
        int midVal = arr[mid];
        if (findVal > midVal) {//说明应该向右递归
            return insertValueSearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {//说明应该向左递归
            return insertValueSearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }
    }
}
output:
查找次数

index = 9

4.3 差值查找注意事项

  1. 数据量较大、关键字分布比较均匀时,采用差值查找,速度较快。
  2. 关键字分布不均匀时,差值查找不一定比二分查找块。

5. 斐波那契(黄金分割)查找

5.1 斐波那契查找的原理

黄金分割:把一条线段分割为两部分,使其中一部分与全长之比等于另一部分与这部分之比。取其前三位数字的近似值是0.618。由于按此比例设计的造型十分美丽,因此称为黄金分割,也称为中外比。这是一个神奇的数字,会带来意向不大的效果。

斐波那契数列:后面的数由之前两个数相加得到,例:{1, 1, 2, 3, 5, 8, 13, 21, 34, 55}。斐波那契数列相邻两个数的比值无限接近黄金分割值0.618。

斐波那契查找:与前面两个查找的原理相似,仅仅是改变了中间节点的位置。mid 不是中间也不是由差值得到,而是位于黄金分割点附近,即 mid = low + F(k-1) - 1

5.2 对于 F(k-1) - 1 的理解

  1. 由斐波那契数列的性质中可以得到:
由:F[k] = F[k-1] + F[k-2]
得:(F[k] - 1) = (F[k-1] - 1) + (F[k-2] - 1)

上式说明:只要顺序表的长度为为 F[k]-1,则可将其分为 F[k-1]-1 和 F[k-2]-1 这两段,中间的位置为:

mid = low + F[k-1] - 1

上述过程可由下图表示:

  1. 类似的,分成两段之后的每一个子段也可按照相同的方式进行分割。
  2. 问题是顺序表的长度不一定正好就是 F[k]-1,所以当顺序表的长度较小时,需要将其长度增加,增加位置值均为最后一个数的值。利用如下代码来寻找合适大小的斐波那契数列中的数(也就是F[k]-1),其刚好大于或等于顺序表的的长度即可。
while (n > fib(k) - 1)//fib()为斐波那契数列
    k++;

5.3 代码实现


import java.util.Arrays;

public class FibonacciSearch {

    public static int maxSize = 20;

    public static void main(String[] args) {
        int[] arr = {1, 8, 10, 89, 1000, 1234};

        System.out.println(fibSearch(arr, 1));
    }

    //后面mid = low + F(k - 1) - 1,需要使用到斐波那契数列,因此需要先获取到一个斐波那契数列
    //使用非递归方法得到一个斐波那契数列
    public static int[] fib() {
        int[] f = new int[maxSize];
        f[0] = 1;
        f[1] = 1;
        for (int i = 2; i < maxSize; i++) {
            f[i] = f[i - 1] + f[i - 2];
        }
        return f;
    }

    //编写斐波那契查找算法
    //使用非递归的方式编写算法

    /**
     * @param a   数组
     * @param key 需要查找的关键码(值)
     * @return 返回对应的下标,如果没有返回-1
     */
    public static int fibSearch(int[] a, int key) {
        int low = 0;
        int high = a.length - 1;
        int k = 0;//表示斐波那契分割数值的下标
        int mid = 0;
        int f[] = fib();//获取斐波那契数列
        //获取斐波那契分割数值的下标
        while (high > f[k] - 1) {
            k++;
        }

        //因为 f[k] 的值可能大于数组a的长度,因此需要使用Arrays类,构造一个新的数组,并指向a[]
        //不足的部分会使用0来填充(即 a.length < f[k].length时)
        int[] temp = Arrays.copyOf(a, f[k]);
        //实际上需要使用a数组最后的数填充temp
        //例:temp = {1, 8, 10, 89, 1000, 1234, 0, 0, 0} -> {1, 8, 10, 89, 1000, 1234, 1234, 1234, 1234}
        for (int i = high + 1; i < temp.length; i++) {
            temp[i] = a[high];
        }

        //使用while循环进行处理,找到key
        while (low <= high) {//只要这个条件满足,就寻找
            mid = low + f[k - 1] - 1;
            if (key < temp[mid]) {//应该继续向数组的前面查找(左边)
                high = mid - 1;
                //为什么是k?
                //说明:
                //1. 全部元素 = 前面元素 + 后面元素
                //2. f[k] = f[k-1] + f[k-2]
                //因为前面右 f[k-1] 个元素,所以继续拆分为 f[k-1] = f[k-2] + f[k-3]
                //即在 f[k-1] 的前面继续查找
                //即下次循环时 mid = f[k-1-1] - 1
                k--;
            } else if (key > temp[mid]) {//应该继续向数组的后面查找(右边)
                low = mid + 1;
                //为什么是 k -= 2
                //说明:
                //1. 全部元素 = 前面元素 + 后面元素
                //2. f[k] = f[k-1] + f[k-2]
                //3. 因为后面有 f[k-1] ,所以可以继续拆分 f[k-1] = f[k-3] + f[k-4]
                //4. 即在 f[k-2] 的前面进行查找
                //5. 即下次循环 mid = f[k - 1 - 2] - 1
                k -= 2;
            } else {//找到了
                //需要确定,返回的是哪个下标
                if (mid <= high) {
                    return mid;
                } else {
                    return high;
                }
            }
        }
        return -1;
    }
}