浅谈ConcurrentHashMap

340 阅读3分钟

前言

ConcurrentHashMap 是线程安全且高效的HashMap。
不同版本jdk实现它的方式存在些许不同,本篇文章主要基于JDK1.8进行分析。

1 为什么使用ConcurrentHashMap

  1. HashMap是线程不安全的。在多线程环境下,使用HashMap进行put操作会引起死循环。
  2. HashTable的效率低下,因为它几乎在所有方法上都使用synchronized来保证线程安全。
  3. ConcurrentHashMap在put、remove等修改数据操作时,只锁住某个“桶”的方式,有效提升并发访问率。

2 主要方法

2.1 put()

先上波源码再来分析。

final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        else {
            V oldVal = null;
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    if (fh >= 0) {
                        binCount = 1;
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                              value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            if (binCount != 0) {
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    addCount(1L, binCount);
    return null;
}

屏幕快照 2021-04-06 上午10.41.58.png

第一步做了一个校验,key或value为null都会抛出异常。 然后获取hash值,初始化binCount用于记录链表长度。

屏幕快照 2021-04-06 上午11.18.08.png

这里是个无限循环。
先判断table有没有初始化,没有就进行初始化。
(n - 1) & hash计算出插入下标,如果这个位置没有数据,直接放进去。
(fh = f.hash) == MOVED 如果其他线程在扩容,帮助其扩容。

// 有冲突后,进去else 
synchronized (f) { // 锁住当前头节点
    if (tabAt(tab, i) == f) { // 再次确认下标位置是否是f节点
        if (fh >= 0) { // 头节点hash值 > 0说明是链表
            binCount = 1;
            for (Node<K,V> e = f;; ++binCount) { // 遍历
                K ek;
                // 如果key相同,则判断是否覆盖旧值
                if (e.hash == hash &&
                    ((ek = e.key) == key ||
                     (ek != null && key.equals(ek)))) {
                    oldVal = e.val;
                    if (!onlyIfAbsent) // 默认情况下,覆盖旧值
                        e.val = value;
                    break;
                }
                Node<K,V> pred = e;
                // 插到最后面
                if ((e = e.next) == null) {
                    pred.next = new Node<K,V>(hash, key, value, null);
                    break;
                }
            }
        }
        else if (f instanceof TreeBin) { // 如果是红黑树,用红黑树的方式插数据
            Node<K,V> p;
            binCount = 2;
            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                  value)) != null) {
                oldVal = p.val;
                if (!onlyIfAbsent)
                    p.val = value;
            }
        }
    }
}

屏幕快照 2021-04-06 下午3.33.56.png

最后判断链表长度是否达到8。
如果达到8,判断是否需要对数组扩容,数组长度小于64需要进行扩容。
如果数组长度大于64,就把链表转化为红黑树。

2.2 get()

public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    int h = spread(key.hashCode());
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        else if (eh < 0)
            return (p = e.find(h, key)) != null ? p.val : null;
        while ((e = e.next) != null) {
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

get 方法没有加锁!

  1. 空table,直接返回null;
  2. 计算hash值,找到相应的bucket位置,为node节点直接返回value,否则返回null

3 总结

ConcurrentHashMap 比起 HashMap 加上了锁机制,效率虽然差些,但多线程下是安全的,不会有死循环问题。对比HashTable,它只是锁住了需要访问的某个“桶”,所以效率比HashTable好上不少。
各位可以视情况选择使用 HashMap 或 ConcurrentHashMap。