HashSet如何实现内部元素不重复?

49 阅读2分钟

本文已参与「新人创作礼」活动, 一起开启掘金创作之路。

HashSet如何实现内部元素不重复?

HashSet原理:

使用Set集合地需要去掉重复元素的,如果在存储的时候逐个用equals()比较,效率较低,哈希算法提高了去重复的效率,降低了使用equals()方法的次数;

当HashSet调用add()方法存储对象的时候,先调用对象的hashCode()方法得到一个哈希值,然后再集合中查找是否有哈希值相同的对象;

如果没有哈希值相同的对象就直接存入集合;

如果有哈希值相同的对象,就和哈希值相同的对象逐个金象equals()比较,结果为false就存入,true则不存;

 

将自定义类的对象存入HashSet去重复

类中必须重写hashCode()和equals()方法

HashCode():属性相同的对象返回值必须相同,属性不同的返回值尽量不同(提高效率)

Equals():属性相同返回false,属性不同返回false,返回false的时候存储

哈希表:

数组存储区间是连续的,占用内存严重,故空间复杂的很大。但数组的二分查找时间复杂度小,为O(1);

数组的特点是:寻址容易,插入和删除困难;

链表存储区间离散,占用内存比较宽松,故空间复杂度很小,但时间复杂度很大,达O(N)。

链表的特点是:寻址困难,插入和删除容易。

综合这两者的优点,摒弃缺点,哈希表就诞生了,既满足了数据查找方面的特点,占用的空间也不大。

哈希表可以说是数组链表,只不过数组的每一项是一个链表,

在这个数组中,每个元素存储的其实是一个链表的头,元素的存储位置一般情况是通过hash(key)%len获得,也就是元素的key的哈希值对数组长度取模得到。比如上述哈希表中,12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都存储在数组下标为12的位置。