14: 从源码看HashSet:一文看懂HashSet

273 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

前言

HashSet是基于Hash表的Set接口实现,允许空值和空键,非线程安全的Set。HashSet是一个无序集合,无序不仅仅是指存储顺序可能与插入顺序不同,还包括元素的存储位置可能会随着对实例的使用而变换。

阅读这篇博文之前,请先阅读13: 从源码看HashMap:一文看懂HashMap - 掘金 (juejin.cn),因为HashSet是通过HashMap实现的。

1 HashSet的继承关系

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable

可以看到HashSet继承了AbstractSet类,并实现了Set,Cloneable,Serializable接口,这说明HashSet是一个标准Set,且允许克隆和序列化。

2 HashSet的参数

private transient HashMap<E,Object> map;
private static final Object PRESENT = new Object();

HashSet内部维护了两个参数,一个是作为数据容器的map,类型为HashMap,HashSet的所有操作都是通过HashMap实现的。另一个是空对象PRESENT ,HashSet的元素为map的key,PRESENT就作为map的value。

3 HashSet的构造

3.1 无参构造

public HashSet() {
    map = new HashMap<>();
}

平平无奇,初始化了作为容器的map

3.2 带有初始元素的构造

public HashSet(Collection<? extends E> c) {
    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
}

同样是复制map,但是因为有初始元素,所以要考虑到size,容量,和装载因子之间的关系,计算出存储元素所要保证的最小容量,同时HashMap的最小容量是16,因此HashMap的初始容量值就是最小容量和16之间的较大值。

然后再调用addAll方法

public boolean addAll(Collection<? extends E> c) {
    boolean modified = false;
    for (E e : c)
        if (add(e))
            modified = true;
    return modified;
}

addAll方法实现在AbstractCollection,就是循环调用add

3.3 带有初始容量和装载因子的构造

public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}

平平无奇,直接调用HashMap的构造函数初始化了作为容器的map

3.4 带有初始容量的构造

public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}

同样的,直接调用HashMap的构造函数初始化了作为容器的map

4 HashSet的方法

public Iterator<E> iterator() {
    return map.keySet().iterator();
}
public int size() {
    return map.size();
}
public boolean isEmpty() {
    return map.isEmpty();
}
public boolean contains(Object o) {
    return map.containsKey(o);
}
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}
    public boolean remove(Object o) {
    return map.remove(o)==PRESENT;
}
    public void clear() {
    map.clear();
}

可以看到,都是直接调用HashMap的相关方法

总结

HashSet并没有什么特别需要注意的,他可以看做是一个value为固定值PRESENT的HashMap.如果理解了HashMap,那也就理解了HashSet。

PS:
开发成长之旅 [持续更新中...]
上篇导航:13: 从源码看HashMap:一文看懂HashMap - 掘金 (juejin.cn)
下篇导航:15: 从源码看ConcurrentHashMap:一文看懂ConcurrentHashMap - 掘金 (juejin.cn)
欢迎关注...