Hash表的哈希冲突问题

161 阅读3分钟

本文已参与[新人创作礼]活动,一起开启掘金创作之路
在前一篇文章blog.csdn.net/weixin_4030…中说到,利用哈希函数y=k%11来建立一张hash表,此时存在一个问题,当这个表不断增大时,会出现越来越多映射重复,比如当k=11、22、33……等等这些时候得到的y=0,这就是哈希冲突,如何解决冲突问题便是本文的内容。 Hash算法解决冲突的方法一般有以下几种常用的解决方法 1、开放定址法: 当一个key和另一个key发生冲突的时候,在表中找到另一个可以用的地址 如下图: 首先假定探查方式为(冲突之后寻找下一个可用地址的方法): y = (k+p(i))%11,其中p(i)是探查函数i是探查次数,令p(i) = i 最先输入的A5、A2、A3此时表中为空,不发生冲突; 接着输入B5、A9、B2,此时B5、B2发生冲突,B5找到下一个可用地址(index=6,此时i=1),同理B2找到可用地址(index=4,此时i=2); 最后输入B9、C2,两个都冲突了,B9找到下一个可用地址(index=0,此时i=1,到底了之后重头搜索),同理C2找到可用地址(index=7,此时i=5); 性能问题: 图(b)可看出从2~6为数据聚集块,数据聚集块之后的地址被占有的概率更高,这会导致聚集块越来越大(从吐c可以看出这种趋势),这会导致性能降低,因此应该选用更合适的探测函数p(i) ;开放定址法会产生溢出 在这里插入图片描述 2、链接法: 每个哈希表节点都有一个next指针,多个哈希表节点可以用next指针构成一个单向链表,被分配到同一个索引上的多个节点可以用这个单向 链表连接起来,如下图: A2、B2、C2 映射的key值对应的都在2 性能问题: 链接法永远不会产生溢出现象;对于短链表 链接法效率是很高的;随着链表长度的增加,检索时的效率会出现明显降低。 在这里插入图片描述 3、桶定址: 把发生冲突的元素放在同一个同一个位置,因此可以为表中的每个地址关联一个桶,这里的桶指一个足够大的存储空间,用来放置多个冲突项。 桶定址也存在溢出现象,此时可以使用开放定址法,如下图10-7 性能问题: 同开放定址法会产生溢出 在这里插入图片描述 4、再哈希法: 有多个不同的Hash函数,当发生冲突时,使用第二个,第三个,….,等哈希函数计算地址,直到无冲突。 性能问题: 虽然不易发生聚集,但是增加了计算时间。

如果上面描述有误,欢迎私聊 谢谢! ^ V ^