查找算法「Java数据结构与算法学习笔记7」

0 阅读9分钟

🔥工程代码已上传至github:github.com/doublev2026…

查找算法简介

在java中,我们常用的查找有四种:

  1. 顺序(线性)查找

  2. 二分查找/折半查找

  3. 插值查找

  4. 斐波那契查找/黄金分割法查找

线性查找算法

需求:有一个数列: {1,8, 10, 89, 1000, 1234} ,判断数列中是否包含此名称

顺序查找要求:如果找到了,就提示找到,并给出下标值。

代码实现:

package com.datastructures.search;

public class SeqSearch {
    public static void main(String[] args) {
        int[] arr = {1, 9, 11, -1, 34, 89};
        int index = seqSearch(arr, -11);
        if (index == -1) {
            System.out.println("没有找到");
        } else {
            System.out.println("找到目标值,下标为" + index);
        }
    }

    /**
     * 找到一个满足条件的值,就返回
     */
    public static int seqSearch(int[] arr, int value) {
        for (int i = 0; i < arr.length; i++) {
            if (arr[i] == value) {
                return i;
            }
        }
        return -1;
    }
}

二分查找算法

需求:对一个有序数组进行二分查找 {1,8, 10, 89, 1000, 1234} ,输入一个数看看该数组是否存在此数,并且求出下标,如果没有就提示"没有这个数"。

进阶需求: {1,8, 10, 89, 1000, 1000,1234} 当一个有序数组中,有多个相同的数值时,如何将所有的数值都查找到,比如这里的 1000。

算法思路

二分查找的思路分析:

  1. 首先确定该数组的中间的下标 mid = (left + right) / 2
  2. 然后让需要查找的数 findVal 和 arr[mid] 比较
    1. findVal > arr[mid],说明你要查找的数在mid的右边, 因此需要递归的向右查找
    2. findVal < arr[mid],说明你要查找的数在mid的左边, 因此需要递归的向左查找
    3. findVal == arr[mid],说明找到,就返回

什么时候我们需要结束递归:

  1. 找到就结束递归
  2. 递归完整个数组,仍然没有找到findVal,也需要结束递归。当 left>right 就需要退出

代码实现

package com.datastructures.search;

import java.util.ArrayList;
import java.util.List;

/**
 * 二分查找,前提是该数组有序
 */
public class BinarySearch {
    public static void main(String[] args) {
        int[] arr = {1, 8, 10, 89, 1000, 1000, 1234};
        int index = binarySearch(arr, 0, arr.length - 1, 1000);
        System.out.println("index = " + index);

        List<Integer> indexList = binarySearchPlus(arr, 0, arr.length - 1, 1000);
        System.out.println("indexList = " + indexList);
    }

    /**
     * 二分查找算法
     *
     * @param arr     数组
     * @param left    左边索引
     * @param right   右边索引
     * @param findVal 要查找的值
     * @return 如果找到就返回下标,如果没找到就返回-1
     */
    public static int binarySearch(int[] arr, int left, int right, int findVal) {
        // 当 left>right,说明递归整个数组,但是没有找到
        if (left > right) {
            return -1;
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {
            return binarySearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
            return binarySearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }
    }

    /**
     * 有多个相同的数值时,将所有的数值都查找到
     *
     * @param arr
     * @param left
     * @param right
     * @param findVal
     * @return
     */
    public static List<Integer> binarySearchPlus(int[] arr, int left, int right, int findVal) {
        // 当 left>right,说明递归整个数组,但是没有找到
        if (left > right) {
            return new ArrayList<>();
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {
            return binarySearchPlus(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
            return binarySearchPlus(arr, left, mid - 1, findVal);
        } else {
            /**
             * 找到 mid 不要马上返回(因为是有序的,相同数字就在旁边)
             * 向 mid 索引值的左边扫描,将所有满足1000的元素的下标,加入到集合中
             * 向 mid 索引值的右边扫描,将所有满足1000的元素的下标,加入到集合中
             * 再将 ArrayList 返回
             */
            List<Integer> indexList = new ArrayList<>();
            // 向 mid 索引值的左边扫描
            int temp = mid - 1;
            while (true) {
                if (temp < 0 || arr[temp] != findVal) {
                    break; // 退出
                }
                // 否则,就将temp放入到indexList
                indexList.add(temp);
                temp -= 1; // temp左移
            }

            // 中间的要加入结果
            indexList.add(mid);

            // 向 mid 索引值的右边扫描
            temp = mid + 1;
            while (true) {
                if (temp > arr.length - 1 || arr[temp] != findVal) {
                    break; // 退出
                }
                // 否则,就将temp放入到indexList
                indexList.add(temp);
                temp += 1; // temp右移
            }

            return indexList;
        }
    }
}

插值查找算法

算法思路

  1. 原理介绍:插值查找算法类似于二分查找,不同的是插值查找每次从自适应mid处开始查找
  2. 将折半查找中的求mid 索引的公式,low 表示左边索引left,high表示右边索引right,key就是前面我们讲的 findVal

画板

  1. int mid = low + (high - low) * (key - arr[low]) / (arr[high] - arr[low]) ;/*插值索引*/

举例说明插值查找算法 1-100 的数组:

画板

代码实现

需求:对一个有序数组进行二分查找 {1,8, 10, 89, 1000, 1234} ,输入一个数看看该数组是否存在此数,并且求出下标,如果没有就提示"没有这个数"。

package com.datastructures.search;

public class InsertValueSearch {
    public static void main(String[] args) {
        int[] arr = {1, 8, 10, 89, 1000, 1000, 1234};
        int index = insertValueSearch(arr, 0, arr.length - 1, 1000);
        System.out.println("index = " + index);

        int[] arr2 = new int[100];
        for (int i = 0; i < arr2.length; i++) {
            arr2[i] = i + 1;
        }
        int index2 = insertValueSearch(arr2, 0, arr2.length - 1, 77);
        System.out.println("index2 = " + index2);
    }

    /**
     * 插值查找算法(同样要求数组有序)
     *
     * @param arr     数组
     * @param left    左边索引
     * @param right   右边索引
     * @param findVal 查找值
     * @return 如果找到就返回下标,如果没找到就返回-1
     */
    public static int insertValueSearch(int[] arr, int left, int right, int findVal) {
        System.out.println("插值查找次数统计");
        if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
            return -1;
        }

        // 求出 mid自适应
        int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
        int midVal = arr[mid];

        if (findVal > midVal) {
            return insertValueSearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
            return insertValueSearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }
    }
}

插值查找注意事项:

  1. 对于数据量较大,关键字分布比较均匀的查找表来说,采用插值查找, 速度较快
  2. 关键字分布不均匀的情况下,该方法不一定比折半查找要好

斐波那契查找算法

基本介绍

  1. 黄金分割点是指把一条线段分割为两部分,使其中一部分与全长之比等于另一部分与这部分之比。取其前三位数字的近似值是0.618。由于按此比例设计的造型十分美丽,因此称为黄金分割,也称为中外比。这是一个神奇的数字,会带来意向不大的效果。
  2. 斐波那契数列 {1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 发现斐波那契数列的两个相邻数的比例,无限接近黄金分割值0.618

算法思路

斐波那契查找原理与前两种相似,仅仅改变了中间结点(mid)的位置,mid不再是中间或插值得到,而是位于黄金分割点附近,即 mid=low+F(k-1)-1(F代表斐波那契数列),如下图所示:

F(k-1)-1的理解:

  1. 由斐波那契数列F[k]=F[k-1]+F[k-2] 的性质,可以得到F[k]-1=(F[k-1]-1) + (F[k-2]-1) +1

    1. 该式说明:只要顺序表的长度为F[k]-1,则可以将该表分成长度为F[k-1]-1F[k-2]-1的两段,即如上图所示。从而中间位置为mid=low+F(k-1)-1
  2. 类似的,每一子段也可以用相同的方式分割

  3. 但顺序表长度n不一定刚好等于F[k]-1,所以需要将原来的顺序表长度n增加至F[k]-1。这里的k值只要能使得F[k]-1恰好大于或等于n即可,由以下代码得到,顺序表长度增加后,新增的位置(从n+1到F[k]-1位置),都赋为n位置的值即可。

while(n > fib(k)-1)
    k++;

代码实现

需求:对一个有序数组进行二分查找 {1,8, 10, 89, 1000, 1234} ,输入一个数看看该数组是否存在此数,并且求出下标,如果没有就提示"没有这个数"。

package com.datastructures.search;

import java.util.Arrays;

public class FibonacciSearch {
    public static void main(String[] args) {
        int[] arr = {1, 8, 10, 89, 1000, 1000, 1234};
        int search = fibonacciSearch(arr, 1000);
        System.out.println("search=" + search);
    }

    /**
     * 斐波那契查找算法,使用非递归的方式编写
     *
     * @param arr 数组
     * @param key 需要查找的值
     * @return 如果找到就返回下标,如果没找到就返回-1
     */
    public static int fibonacciSearch(int[] arr, int key) {
        int low = 0; // low=0
        int high = arr.length - 1; // high=6
        int k = 0; // 表示斐波那契分割数值的下标
        int mid = 0; // 存放mid值
        int[] f = fib();
        // 获取到斐波那契分割数值的下标
        while (high > f[k] - 1) {
            k++;
        } // k = 5
        // 此时 f[k] 就是黄金分割点,f[k] = f[5] = 8
        // 因为 f[k] 值可能大于 arr 的长度,因此我们需要使用 Arrays 类,构造一个新的数组,并指向 temp[]
        // 不足的部分会使用 0 填充
        int[] temp = Arrays.copyOf(arr, f[k]);
        // 实际上需求使用 arr 数组最后的数填充temp
        for (int i = high + 1; i < temp.length; i++) {
            temp[i] = arr[high];
        } // 填充完后,此时 temp[] = {1, 8, 10, 89, 1000, 1000, 1234, 1234, 1234}

        // 使用 while 循环,找到我们的数 key
        while (low <= high) { // 只要这个条件满足就可以一直找
            mid = low + f[k - 1] - 1; // mid = 0 + f(4) - 1 = 4
            if (key < temp[mid]) { // 继续向数组的前面查找(也就是左边)
                high = mid - 1;
                /**
                 * 全部元素 = 前面的元素 + 后面的元素
                 * f[k] = f[k-1] + f[k-2]
                 * 因为前面有 f[k-1] 个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
                 * 即 在 f[k-1] 的前面继续查找 k--
                 * 即 下次循环:mid = f[k-1-1] - 1
                 */
                k--;
            } else if (key > temp[mid]) { // 继续向数组的后面查找(也就是右边)
                low = mid + 1;
                /**
                 * 全部元素 = 前面的元素 + 后面的元素
                 * f[k] = f[k-1] + f[k-2]
                 * 因为后面有 f[k-2] 个元素,所以可以继续拆分 f[k-2] = f[k-3] + f[k-4]
                 * 即 在 f[k-2] 的前面继续查找 k-=2
                 * 即 下次循环:mid = f[k-1-2] - 1
                 */
                k -= 2;
            } else { // 此时代表找到了。需要确定返回的是哪个下标
                if (mid <= high) {
                    return mid;
                } else {
                    return high;
                }
            }
        }
        return -1;
    }

    // mid=low+F(k-1)-1,需要使用到斐波那契数列
    // 非递归方法得到一个斐波那契数列。先写死20个
    public static int[] fib() {
        int[] f = new int[20];
        f[0] = 1;
        f[1] = 1;
        for (int i = 2; i < 20; i++) {
            f[i] = f[i - 1] + f[i - 2];
        }
        return f;
    }
}