7.数据结构和算法[查找算法]

163 阅读2分钟

在java中,我们常用的查找有四种:

  1. 顺序(线性)查找
  2. 二分查找/折半查找
  3. 插值查找
  4. 斐波那契查找

顺序(线性)查找

线性查找是逐一比对,发现有相同值,就返回下标

/**
 * 这里我们实现的线性查找是找到一个满足条件的值,就返回
 * @param arr
 * @param value
 * @return
 */
public static int seqSearch(int[] arr, int value) {
    // 线性查找是逐一比对,发现有相同值,就返回下标
    for (int i = 0; i < arr.length; i++) {
        if(arr[i] == value) {
            return i;
        }
    }
    return -1;
}

二分查找算法

元素必须是有序的,如果是无序的则要先进行排序操作。
也称为是折半查找,属于有序查找算法。用给定值k先与中间结点的关键字比较,中间结点把线形表分成两个子表,若相等则查找成功;若不相等,再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表,这样递归进行,直到查找到或查找结束发现表中没有这样的结点

折半查找的前提条件是需要有序表顺序存储,对于静态查找表,一次排序后不再变化,折半查找能得到不错的效率。但对于需要频繁执行插入或删除操作的数据集来说,维护有序的排序会带来不小的工作量,那就不建议使用。——《大话数据结构》

//二分查找(折半查找),循环版
int BinarySearch1(int a[], int value, int n)
{
    int low, high, mid;
    low = 0;
    high = n-1;
    while(low<=high)
    {
        mid = (low+high)/2;
        if(a[mid]==value)
            return mid;
        if(a[mid]>value)
            high = mid-1;
        if(a[mid]<value)
            low = mid+1;
    }
    return -1;
}

/**
 * 二分查找(折半查找),递归版
 * @param arr  数组
 * @param left 左边的索引
 * @param right 右边的索引
 * @param findVal 要查找的值
 * @return 如果找到就返回下标,如果没有找到,就返回 -1
 */
public static int binarySearch(int[] arr, int left, int right, int findVal) {
    // 当 left > right 时,说明递归整个数组,但是没有找到
    if (left > right) {
        return -1;
    }
    int mid = (left + right) / 2;
    int midVal = arr[mid];
    if (findVal > midVal) { // 向右递归
        return binarySearch(arr, mid + 1, right, findVal);
    } else if (findVal < midVal) { // 向左递归
        return binarySearch(arr, left, mid - 1, findVal);
    } else {
        return mid;
    }

}

插值查找

比如要在取值范围1 ~ 10000 之间 100 个元素从小到大均匀分布的数组中查找5, 我们自然会考虑从数组下标较小的开始查找
经过以上分析,折半查找这种查找方式,不是自适应的(也就是说是傻瓜式的)。二分查找中查找点计算如下: mid=(low+high)/2
插值查找算法的 举例说明
数组 arr = [1, 2, 3, ......., 100]
假如我们需要查找的值 1
使用二分查找的话,我们需要多次递归,才能找到 1
使用插值查找算法
int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left])
int mid = 0 + (99 - 0) * (1 - 1)/ (100 - 1) = 0 + 99 * 0 / 99 = 0
比如我们查找的值 100
int mid = 0 + (99 - 0) * (100 - 1) / (100 - 1) = 0 + 99 * 99 / 99 = 0 + 99 = 99

/**
 * 
 * @param arr 数组
 * @param left 左边索引
 * @param right 右边索引
 * @param findVal 查找值
 * @return 如果找到,就返回对应的下标,如果没有找到,返回-1
 */
public static int insertValueSearch(int[] arr, int left, int right, int findVal) { 
    System.out.println("插值查找次数~~");
    //注意:findVal < arr[0]  和  findVal > arr[arr.length - 1] 必须需要
    //否则我们得到的 mid 可能越界
    if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
        return -1;
    }
    // 求出mid, 自适应
    int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
    int midVal = arr[mid];
    if (findVal > midVal) { // 说明应该向右边递归
        return insertValueSearch(arr, mid + 1, right, findVal);
    } else if (findVal < midVal) { // 说明向左递归查找
        return insertValueSearch(arr, left, mid - 1, findVal);
    } else {
        return mid;
    }
}

对于数据量较大,关键字分布比较均匀的查找表来说,采用插值查找, 速度较快.
关键字分布不均匀的情况下,该方法不一定比折半查找要好

斐波那契(黄金分割法)查找算法

斐波那契数列 {1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 发现斐波那契数列的两个相邻数 的比例,无限接近 黄金分割值0.618 仅仅改变了中间结点(mid)的位置,mid不再是中间或插值得到,而是位于黄金分割点附近,即mid=low+F(k-1)-1

//因为后面我们mid=low+F(k-1)-1,需要使用到斐波那契数列,因此我们需要先获取到一个斐波那契数列
//非递归方法得到一个斐波那契数列
public static int[] fib() {
    int[] f = new int[maxSize];
    f[0] = 1;
    f[1] = 1;
    for (int i = 2; i < maxSize; i++) {
        f[i] = f[i - 1] + f[i - 2];
    }
    return f;
}

//编写斐波那契查找算法
//使用非递归的方式编写算法
/**
 * 
 * @param a  数组
 * @param key 我们需要查找的关键码(值)
 * @return 返回对应的下标,如果没有-1
 */
public static int fibSearch(int[] a, int key) {
    int low = 0;
    int high = a.length - 1;
    int k = 0; //表示斐波那契分割数值的下标
    int mid = 0; //存放mid值
    int f[] = fib(); //获取到斐波那契数列
    //获取到斐波那契分割数值的下标
    while(high > f[k] - 1) {
        k++;
    }
    //因为 f[k] 值 可能大于 a 的 长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
    //不足的部分会使用0填充
    int[] temp = Arrays.copyOf(a, f[k]);
    //实际上需求使用a数组最后的数填充 temp
    //举例:
    //temp = {1,8, 10, 89, 1000, 1234, 0, 0}  => {1,8, 10, 89, 1000, 1234, 1234, 1234}
    for(int i = high + 1; i < temp.length; i++) {
        temp[i] = a[high];
    }

    // 使用while来循环处理,找到我们的数 key
    while (low <= high) { // 只要这个条件满足,就可以找
        mid = low + f[k - 1] - 1;
        if(key < temp[mid]) { //我们应该继续向数组的前面查找(左边)
            high = mid - 1;
            //为甚是 k--
            //说明
            //1. 全部元素 = 前面的元素 + 后边元素
            //2. f[k] = f[k-1] + f[k-2]
            //因为 前面有 f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
            //即 在 f[k-1] 的前面继续查找 k--
            //即下次循环 mid = f[k-1-1]-1
            k--;
        } else if ( key > temp[mid]) { // 我们应该继续向数组的后面查找(右边)
            low = mid + 1;
            //为什么是k -=2
            //说明
            //1. 全部元素 = 前面的元素 + 后边元素
            //2. f[k] = f[k-1] + f[k-2]
            //3. 因为后面我们有f[k-2] 所以可以继续拆分 f[k-1] = f[k-3] + f[k-4]
            //4. 即在f[k-2] 的前面进行查找 k -=2
            //5. 即下次循环 mid = f[k - 1 - 2] - 1
            k -= 2;
        } else { //找到
            //需要确定,返回的是哪个下标
            if(mid <= high) {
                return mid;
            } else {
                return high;
            }
        }
    }
    return -1;
}