HashSet源码

1,244 阅读3分钟

​ HashSet实现了Set接口,其内部是通过持有一个HashMap的实例实现的。HashSet内部的元素是无序的,同时hashset允许存放为null的元素。HashSet不是线程安全的,因此多个线程并发的访问同一个hashset实例的时候可能会存在线程安全问题,需要在外部使用一定的锁同步机制。

声明

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    //代码
}

​ HashSet继承自AbstractSet,并实现了Set接口,这就意味着所有的Set接口中规定的方法,HashSet都给予了实现。

成员变量

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    //用于序列化和反序列化
    static final long serialVersionUID = -5024744406713321676L;

    //内部持有一个hashmap的实例
    private transient HashMap<E,Object> map;

    // 所有的key所对应的value都是这个present,这个跟redis的set还是不大一样的,
    //那个是set对应的值为null。
    private static final Object PRESENT = new Object();    
}

构造方法

/**
 * 构造一个空的hashmap,其底层的hashmap使用初始容量为16,负载因子为0.75来初始化
 */
public HashSet() 
{
    map = new HashMap<>();
}

/**
 * 如何设置初始容量:(想要设置的初始容量/0.75)+1就可以了
 * 这样可以尽量少的避免rehash操作的发生。
 * 调用其顶层父类的addAll添加到集合中,顶层类又调用了子类重写的add方法。
 * addAll方法后面再看,它是通过遍历c中元素然后调用add方法插入到当前的set中的
 */
public HashSet(Collection<? extends E> c) 
{
    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
}

/**
 * 根据给定的初始容量和负载因子初始化底层的hashmap
 */
public HashSet(int initialCapacity, float loadFactor)
{
    map = new HashMap<>(initialCapacity, loadFactor);
}
/**
 * 根据给定的初始容量初始化底层hashmap。
 */
public HashSet(int initialCapacity) 
{
    map = new HashMap<>(initialCapacity);
}

/**
 * 创建一个空的linked hash set ,底层使用LinkedHashMap实现(因为它是Hashmap的子类)。
 * dummy只是用来区分其他的构造方法的,该方法并不是public的,通常使用用于LinkedHashSet。
 */
HashSet(int initialCapacity, float loadFactor, boolean dummy)
{
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

​ 可以发现HashSet的初始化基本上就是对底层使用的HashMap的初始化。这就是HashSet的构造方法完成的工作。

迭代器相关

iterator方法

public Iterator<E> iterator() 
{
    return map.keySet().iterator();
}

常用的方法

获取信息

size方法

/**
 * 返回set中的key的数量
 */
public int size() 
{
    return map.size();
}

isEmpty方法

/**
 * 判断set是否为空
 */
public boolean isEmpty() 
{
    return map.isEmpty();
}

contains方法

/**
 * 判断集合中是否有给定的值
 */
public boolean contains(Object o) 
{
    return map.containsKey(o);
}

添加元素

add方法

/**
 * 将元素e添加到集合中,实际上是添加到持有的map中,值为present
 */
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

删除元素

remove方法

/**
 * 将元素从集合中删除
 */
public boolean remove(Object o) 
{
    return map.remove(o)==PRESENT;
}

clear方法

/**
 * 清空整个集合,实际是清空底层的map
 */
public void clear()
{
    map.clear();
}

其他方法

/**
 * 返回该set的一个浅复制,其内部的元素并没有复制。
 */
@SuppressWarnings("unchecked")
public Object clone()
{
    try
    {
        HashSet<E> newSet = (HashSet<E>) super.clone();
        newSet.map = (HashMap<E, Object>) map.clone();
        return newSet;
    }
    catch (CloneNotSupportedException e) 
    {
        throw new InternalError(e);
    }
}

序列化

/**
 * 保存hashset的状态到流中
 */
private void writeObject(java.io.ObjectOutputStream s)
    throws java.io.IOException 
{
    // Write out any hidden serialization magic
    s.defaultWriteObject();

    // Write out HashMap capacity and load factor
    s.writeInt(map.capacity());
    s.writeFloat(map.loadFactor());

    // Write out size
    s.writeInt(map.size());

    // Write out all elements in the proper order.
    for (E e : map.keySet())
        s.writeObject(e);
}

/**
 * 从流中重建hashset
 */
private void readObject(java.io.ObjectInputStream s)
    throws java.io.IOException, ClassNotFoundException 
{
    // Read in any hidden serialization magic
    s.defaultReadObject();

    // Read capacity and verify non-negative.
    int capacity = s.readInt();
    if (capacity < 0)
    {
        throw new InvalidObjectException("Illegal capacity: " +
                                         capacity);
    }

    // Read load factor and verify positive and non NaN.
    float loadFactor = s.readFloat();
    if (loadFactor <= 0 || Float.isNaN(loadFactor)) 
    {
        throw new InvalidObjectException("Illegal load factor: " +
                                         loadFactor);
    }

    // Read size and verify non-negative.
    int size = s.readInt();
    if (size < 0)
    {
        throw new InvalidObjectException("Illegal size: " +
                                         size);
    }
    // Set the capacity according to the size and load factor ensuring that
    // the HashMap is at least 25% full but clamping to maximum capacity.
    capacity = (int) Math.min(size * Math.min(1 / loadFactor, 4.0f),
                              HashMap.MAXIMUM_CAPACITY);

    // Constructing the backing map will lazily create an array when the first element is
    // added, so check it before construction. Call HashMap.tableSizeFor to compute the
    // actual allocation size. Check Map.Entry[].class since it's the nearest public type to
    // what is actually created.

    SharedSecrets.getJavaOISAccess()
        .checkArray(s, Map.Entry[].class, HashMap.tableSizeFor(capacity));

    // Create backing HashMap
    map = (((HashSet<?>)this) instanceof LinkedHashSet ?
           new LinkedHashMap<E,Object>(capacity, loadFactor) :
           new HashMap<E,Object>(capacity, loadFactor));

    // Read in all elements in the proper order.
    for (int i=0; i<size; i++) 
    {
        @SuppressWarnings("unchecked")
        E e = (E) s.readObject();
        map.put(e, PRESENT);
    }
}

java8新增API

public Spliterator<E> spliterator()
{
    return new HashMap.KeySpliterator<E,Object>(map, 0, -1, 0, 0);
}

写在最后

​ HashSet的实现非常的简单,整个代码才不过三百多行,HashSet实现的关键是其内部持有的HashMap的实例,其所有主要的方法基本上都委托给了底层的HashMap的实例来完成。另外需要注意的是HashSet的所有的key均指向一个公共的称为present的实例,而不是null。