数据结构基础---查找

155 阅读3分钟

一、查找

1.1.基本概念

  • 给定一个值K,在含有n个记录的文件中进行搜索,寻找一个关键字值等于K的记录,如找到则输出该记录,否则输出查找不成功的信息

1.2.查找算法的优劣

  • 用比较次数的平均值来评估算法的优劣,称为平均查找长度ASL

二、静态查找表

2.1.顺序查找

  • 用逐一比较的办法顺序查找关键字
  • 性能分析:顺序查找平均查找长度为:(n+1)/2,时间效率为O(n)
  • 优点:算法简单、适应面广,对查找表的结构没有要求,无论记录是否按关键字有序排列均可使用
  • 缺点:在n值较大时,平均查找长度较大,查找效率较低

2.2.折半查找(二分查找)

  • 先给数据排序,形成有序表,把待查数据值与查找范围的中间元素值进行比较,会有四种情况出现

    • 待查找值与中间元素值相等,返回中间元素值的索引
    • 带查找数值比中间元素值小,则以整个查找范围的前半部分作为新的查找范围,执行1,直到找到相等的值
    • 待查找数值比中间元素值大,则以整个查找范围的后半部分作为新的查找范围,执行1,直到找到相等的值
    • 如果最后找不到相等的值,则返回错误提示信息
  • 平均查找长度:(n+1)/n * log2(n+1) - 1 = log2(n+1) - 1

  • 折半查找比顺序查找效率要高,但它要求查找表进行顺序存储并且按关键字有序排列,因此对表进行元素的插入和删除时,需要移动大量的元素,所以折半查找适用于表不易变动,且又经常进行查找的情况

2.3.分块查找

  • 索引顺序查找,首先把表分成若干块,每一块中的关键字不一定有序,但块之间是有序的,即后一块中所有记录的关键字均大于前一块中最大的关键字,还建立了一个索引表,索引表按关键字有序

  • 查找步骤分两步:

    • 对索引表使用折半查找法
    • 确定了待查关键字所在的子表后,在子表内采用顺序查找法

三、哈希表

3.1.基本概念

  • 根据关键码值(key value)而直接进行访问的数据结构,由关键码的值决定数据的存储地址,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表
  • 优点:查找速度极快(O(1)),查找效率与元素个数n无关!

3.2.哈希冲突

  • 通常关键码的集合比哈希地址集合大得多,因为经过哈希函数变换后,可能将不同的关键码映射到同一个哈希地址上,这种现象称为冲突

  • 避免哈希冲突的方法:

    • 构造好的哈希函数

      • 所选函数尽可能简单,以便提高转换速度
      • 所选函数对关键码计算出的地址,应在哈希地址内集中并大致均匀分布,以减少空间浪费
    • 制定一个好的解决冲突的方案

      • 查找时,如果从哈希函数计算出的地址中查不到关键码,则应当依据解决冲突的规则,有规律的查询其他相关单元