本文已参与「新人创作礼」活动, 一起开启掘金创作之路。
HashSet如何实现内部元素不重复?
HashSet原理:
使用Set集合地需要去掉重复元素的,如果在存储的时候逐个用equals()比较,效率较低,哈希算法提高了去重复的效率,降低了使用equals()方法的次数;
当HashSet调用add()方法存储对象的时候,先调用对象的hashCode()方法得到一个哈希值,然后再集合中查找是否有哈希值相同的对象;
如果没有哈希值相同的对象就直接存入集合;
如果有哈希值相同的对象,就和哈希值相同的对象逐个金象equals()比较,结果为false就存入,true则不存;
将自定义类的对象存入HashSet去重复
类中必须重写hashCode()和equals()方法
HashCode():属性相同的对象返回值必须相同,属性不同的返回值尽量不同(提高效率)
Equals():属性相同返回false,属性不同返回false,返回false的时候存储
哈希表:
数组存储区间是连续的,占用内存严重,故空间复杂的很大。但数组的二分查找时间复杂度小,为O(1);
数组的特点是:寻址容易,插入和删除困难;
链表存储区间离散,占用内存比较宽松,故空间复杂度很小,但时间复杂度很大,达O(N)。
链表的特点是:寻址困难,插入和删除容易。
综合这两者的优点,摒弃缺点,哈希表就诞生了,既满足了数据查找方面的特点,占用的空间也不大。
哈希表可以说是数组链表,只不过数组的每一项是一个链表,
在这个数组中,每个元素存储的其实是一个链表的头,元素的存储位置一般情况是通过hash(key)%len获得,也就是元素的key的哈希值对数组长度取模得到。比如上述哈希表中,12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都存储在数组下标为12的位置。