深入理解HashSet（扩容、红黑树化）debug调试底层实现原理HashSet源码分析debug调试扩容机制，红黑树化

HashSet源码分析

Hashet的底层是HashMap，HashMa是通过数组，单链表，红黑树实现的
第一次添加时，table数组扩容到16，扩容机制是加载因子*数组大小进行扩容，不是填满整个数组之后才扩容，加载因子为0.75，扩容大小为2n
在java8中，一条链表达到了默认值8，并且table大小是64，就会进行红黑树的转化，如果单链表大小达到了8，table没有达到64，就会先进行table扩容。
单链表大小达到8不一定是数组存储了8个单链表，如果一条单链表中，size是8也会触发扩容机制，或者是转红黑树机制

HashSet的底层.png

测试Hashtable的扩容与转红黑树机制

技巧：让数据存放在一条链表上的方法，让他们的hashCode值相同

package JavaTest;

import java.util.HashSet;
public class HashSetIncrement {
    public static void main(String[] args) {

        HashSet hashSet = new HashSet();
        for (int i = 1; i <= 12; i++) {//在 table 的某一条链表上添加了 7 个 A 对象
            hashSet.add(new A(i));//
        }
    }
}

class A {
    private int n;

    public A(int n) {
        this.n = n;
    }

    //  让数据在一个链表上的方法，让他们的hashcode同名 
    @Override
    public int hashCode() {
        return 100;
    }
}

断点调试

循环中达到了单链表的长度大于8 条件，table数组进行扩容

HashSet中table表的扩容.png

树化前后，单链表与红黑树的数据结构

HashSet的树化前后数据结构的变化.png

HashSet添加过程源码解读

public class HashSetSource {

    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
        hashSet.add("java");//到此位置，第 1 次 add 分析完毕. hashSet.add("php");//到
        此位置，第 2 次 add 分析完毕
        hashSet.add("java");
        System.out.println("set=" + hashSet);
    }
}

解读过程

1. 执行 HashSet()

public HashSet() {
map = new HashMap<>();
}

2. 执行 add()

public boolean add(E e) {//e = "java"
return map.put(e, PRESENT)==null;//(static) PRESENT = new Object();
}

3.执行 put()

该方法会执行 hash(key) 得到 key 对应的 hash 值算法 h = key.hashCode()) ^ (h >>> 16)

public V put(K key, V value) {//key = "java" value = PRESENT 共享
return putVal(hash(key), key, value, false, true);
}

4.执行 putVal

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i; //定义了辅助变量
//table 就是 HashMap 的一个数组，类型是 Node[]
//if 语句表示如果当前 table 是 null, 或者 大小=0
//就是第一次扩容，到 16 个空间. if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//(1)根据 key，得到 hash 去计算该 key 应该存放到 table 表的哪个索引位置
//并把这个位置的对象，赋给 p
//(2)判断 p 是否为 null
//(2.1) 如果 p 为 null, 表示还没有存放元素, 就创建一个 Node (key="java",value=PRESENT)
//(2.2) 就放在该位置 tab[i] = newNode(hash, key, value, null)
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
//一个开发技巧提示： 在需要局部变量(辅助变量)时候，在创建
Node<K,V> e; K k; //
//如果当前索引位置对应的链表的第一个元素和准备添加的 key 的 hash 值一样
//并且满足 下面两个条件之一:
//(1) 准备加入的 key 和 p 指向的 Node 结点的 key 是同一个对象
//(2) p 指向的 Node 结点的 key 的 equals() 和准备加入的 key 比较后相同
//就不能加入
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//再判断 p 是不是一颗红黑树, //如果是一颗红黑树，就调用 putTreeVal , 来进行添加
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {//如果 table 对应索引位置，已经是一个链表, 就使用 for 循环比较
//(1) 依次和该链表的每一个元素比较后，都不相同, 则加入到该链表的最后
// 注意在把元素添加到链表后，立即判断 该链表是否已经达到 8 个结点
// , 就调用 treeifyBin() 对当前这个链表进行树化(转成红黑树)
// 注意，在转成红黑树时，要进行判断, 判断条件
// if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY(64))
// resize();
// 如果上面条件成立，先 table 扩容. // 只有上面条件不成立时，才进行转成红黑树
//(2) 依次和该链表的每一个元素比较过程中，如果有相同情况,就直接 break
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD(8) - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//size 就是我们每加入一个结点 Node(k,v,h,next), size++
if (++size > threshold)
resize();//扩容
afterNodeInsertion(evict);
return null;
}

致谢

感谢韩顺平教育，韩顺平老师，对HashSet的讲解，受益匪浅！