数据结构和算法——常见的查找算法

830 阅读3分钟

一、线性查找算法

这个没什么好说的,就是遍历,挨个查看是否存在该元素。存在就返回索引,不存在就返回-1。

public class SeqSearch {
    public static void main(String[] args) {
        int[] arr = {10,4,7,3,9,14,0,5,8};
        System.out.println(seqSearch(arr, 0));
    }

    /**
     * 线性查找算法
     * @param arr   查找的数组
     * @param target    查找的元素
     * @return  所在位置的下标
     */
    public static int seqSearch(int[] arr,int target){
        for (int i = 0; i < arr.length; i++) {
            if (arr[i] == target){
                return i;
            }
        }
        //返回-1表示没找到
        return -1;
    }
}

二、二分查找算法

当我们的数组**有序(按顺序排列)**时,我们似乎可以不用线性查找算法,而采取更加简单的二分查找算法来解决问题。这种方式每次可以排除当前一半的元素,可以大大节省查找的时间。

img
public class BinarySearch {
    public static void main(String[] args) {
        int arr[]={1,8,10,89,1000,1000,1000,1000,1234};
        System.out.println(binarySearch(arr,0,arr.length-1,1000));
    }

    /**
     * 从数组中查找元素的位置,这里考虑了多个相同值的元素,所以返回List
     * @param arr   需要查找的数组
     * @param left  左位置
     * @param right 右位置
     * @param target    查找的目标
     * @return  返回的位置集合
     */
    public static List<Integer> binarySearch(int[] arr,int left,int right,int target){
        //这种情况说明,我们已经遍历完整个数组了,但没找到元素,所以返回一个空list
        if (left > right){
            return new ArrayList<>();
        }

        //找到中间位置,拿到中间位置的值
        int middle = (left + right)/2;
        int midVal = arr[middle];

        //中间位置的值和目标值比较
        //当目标值大于中间值,说明在中间值右边
        if (midVal < target){
            return binarySearch(arr,middle+1,right,target);
        }else if (midVal > target){//当目标值小于中间值,说明在中间值左边
            return binarySearch(arr,left,middle-1,target);
        }else{
            //这里说明找到相同的,但可能不只一个,但是因为有序排列,这些值肯定是连续的
            //创建存储索引值的List
            List<Integer> list = new ArrayList<>();
            //那么往左搜寻
            int temp = middle - 1;
            //循环查找
            while (true){
                //当遍历到最左边的时候,或者找到不是它的元素时就停
                if (temp < 0 || arr[temp] != target){
                    break;
                }
                list.add(temp);
                temp -= 1;
            }
            list.add(middle);

            //向右边扫描
            temp = middle + 1;
            while (true){
                if (temp > arr.length - 1 || arr[temp] != target){
                    break;
                }
                list.add(temp);
                temp += 1;
            }
            return list;
        }
    }
}

三、插值查找算法

二分法查找虽然可以效率很高的查找到,但是对于一些连续性很强的,使用二分法查找可能效率没有那么高。

这个时候就可以采用插值查找算法来解决:

image-20220123172047932

这种方式的效率可能对于连续的效率会更高一些。

public class InsertSearch {
    public static void main(String[] args) {
        int arr[]={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15};
        System.out.println(insertSearch(arr, 0, arr.length - 1, 7));
        System.out.println("--------------------------");
        System.out.println(binarySearch(arr, 0, arr.length - 1, 7));
    }

    /**
     * 插值查找算法查找元素索引
     * @param arr       查询的数组
     * @param left      查询的左下标
     * @param right     查询的右下标
     * @param target    查询的目标元素
     * @return          元素所在的位置
     */
    public static int insertSearch(int[] arr,int left,int right,int target){
        System.out.println("插值法查找的次数");
        //如果查找条件变成这样就不再查找了
        if (left > right || target < arr[0] || target > arr[arr.length - 1]){
            return -1;
        }

        //使用插值计算公式查找中间元素
        int middle = left + (right - left) * (target - arr[left]) / (arr[right] - arr[left]);
        int midValue = arr[middle];
        if (target > midValue){
            return insertSearch(arr,middle+1,right,target);
        }else if (target < midValue){
            return insertSearch(arr,left,middle-1,target);
        }else{
            return middle;
        }
    }

    public static int binarySearch(int[] arr,int left,int right,int target){
        System.out.println("二分法查找的次数");
        //如果查找条件变成这样就不再查找了
        if (left > right){
            return -1;
        }

        //使用插值计算公式查找中间元素
        int middle = (left + right)/2;
        int midValue = arr[middle];
        if (target > midValue){
            return binarySearch(arr,middle+1,right,target);
        }else if (target < midValue){
            return binarySearch(arr,left,middle-1,target);
        }else{
            return middle;
        }
    }
}

这里可以看看查找的次数的对比:

插值法查找的次数
6
--------------------------
二分法查找的次数
二分法查找的次数
二分法查找的次数
二分法查找的次数
6

四、斐波那契(黄金分割法)查找算法

我们知道黄金分割率往往是人们认为比较完美的一个数字,也就是0.618,其实斐波那契额数列的比例,恰恰无限接近于0.618。

而这里用到的斐波那契额查找算法其实和二分法和插值法区别不大,都是mid的位置有所区别。我们可以利用斐波那契额数列的特点来做区间分割:可以将一个长度为 F(n) 的数组看作左右两段,左边一段长度是 F(n-1),右边一段长度是 F(n-2)。

image-20220123210522149

那么这个中间查找的点的公式是这样的:mid=left+F(n−1)−1

完整的斐波那契查找的基本思想如下:

在斐波那契数列找一个等于或第一个大于查找表中元素个数的数 F[n],然后将原查找表的长度扩展为 Fn (如果要补充元素,则重复补充原查找表最后一个元素,直到原查找表中满足 F[n] 个元素);扩展完成后进行斐波那契分割,即 F[n] 个元素分割为前半部分 F[n-1] 个元素,后半部分 F[n-2] 个元素;接着找出要查找的元素在哪一部分并递归,直到找到。

public class FibonacciSearch {

    public static int maxSize = 20;

    public static void main(String[] args) {
        int[] arr = {1, 8, 10, 89, 1000, 1234};

        System.out.println("index=" + fibSearch(arr, 89));// 0

    }

    //因为后面我们mid=low+F(k-1)-1,需要使用到斐波那契数列,因此我们需要先获取到一个斐波那契数列
    //非递归方法得到一个斐波那契数列
    public static int[] fib() {
        int[] f = new int[maxSize];
        f[0] = 1;
        f[1] = 1;
        for (int i = 2; i < maxSize; i++) {
            f[i] = f[i - 1] + f[i - 2];
        }
        return f;
    }

    //编写斐波那契查找算法
    //使用非递归的方式编写算法

    /**
     * @param a   数组
     * @param key 我们需要查找的关键码(值)
     * @return 返回对应的下标,如果没有-1
     */
    public static int fibSearch(int[] a, int key) {
        int low = 0;
        int high = a.length - 1;
        int k = 0; //表示斐波那契分割数值的下标
        int mid = 0; //存放mid值
        int f[] = fib(); //获取到斐波那契数列
        //获取到斐波那契分割数值的下标
        while (high > f[k] - 1) {
            k++;
        }
        //因为 f[k] 值 可能大于 a 的 长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
        //不足的部分会使用0填充
        int[] temp = Arrays.copyOf(a, f[k]);
        //实际上需求使用a数组最后的数填充 temp
        //举例:
        //temp = {1,8, 10, 89, 1000, 1234, 0, 0}  => {1,8, 10, 89, 1000, 1234, 1234, 1234,}
        for (int i = high + 1; i < temp.length; i++) {
            temp[i] = a[high];
        }

        // 使用while来循环处理,找到我们的数 key
        while (low <= high) { // 只要这个条件满足,就可以找
            mid = low + f[k - 1] - 1;
            if (key < temp[mid]) { //我们应该继续向数组的前面查找(左边)
                high = mid - 1;
                //为甚是 k--
                //说明
                //1. 全部元素 = 前面的元素 + 后边元素
                //2. f[k] = f[k-1] + f[k-2]
                //因为 前面有 f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
                //即 在 f[k-1] 的前面继续查找 k--
                //即下次循环 mid = f[k-1-1]-1
                k--;
            } else if (key > temp[mid]) { // 我们应该继续向数组的后面查找(右边)
                low = mid + 1;
                //为什么是k -=2
                //说明
                //1. 全部元素 = 前面的元素 + 后边元素
                //2. f[k] = f[k-1] + f[k-2]
                //3. 因为后面我们有f[k-2] 所以可以继续拆分 f[k-1] = f[k-3] + f[k-4]
                //4. 即在f[k-2] 的前面进行查找 k -=2
                //5. 即下次循环 mid = f[k - 1 - 2] - 1
                k -= 2;
            } else { //找到
                //需要确定,返回的是哪个下标
                if (mid <= high) {
                    return mid;
                } else {
                    return high;
                }
            }
        }
        return -1;
    }
}