并发的HashMap为什么会引起死循环?

223 阅读3分钟

公众号:Java小咖秀,网站:javaxks.com

作者:bboyzqh , 链接:blog.csdn.net/zhuqiuhui/a…

今天研读 Java 并发容器和框架时,看到为什么要使用 ConcurrentHashMap 时,其中有一个原因是:线程不安全的 HashMap, HashMap 在并发执行 put 操作时会引起死循环,是因为多线程会导致 HashMap 的 Entry 链表形成环形数据结构,查找时会陷入死循环。纠起原因看了其他的博客,都比较抽象,所以这里以图形的方式展示一下,希望支持!

(1)当往 HashMap 中添加元素时,会引起 HashMap 容器的扩容,原理不再解释,直接附源代码,如下:

/** 
    * 
    * 往表中添加元素,如果插入元素之后,表长度不够,便会调用resize方法扩容 
    */  
   void addEntry(int hash, K key, V value, int bucketIndex) {  
Entry<K,V> e = table[bucketIndex];  
       table[bucketIndex] = new Entry<K,V>(hash, key, value, e);  
       if (size++ >= threshold)  
           resize(2 * table.length);  
   }  
  
   /** 
    * resize()方法如下,重要的是transfer方法,把旧表中的元素添加到新表中
    */  
   void resize(int newCapacity) {  
       Entry[] oldTable = table;  
       int oldCapacity = oldTable.length;  
       if (oldCapacity == MAXIMUM_CAPACITY) {  
           threshold = Integer.MAX_VALUE;  
           return;  
       }  
  
       Entry[] newTable = new Entry[newCapacity];  
       transfer(newTable);  
       table = newTable;  
       threshold = (int)(newCapacity * loadFactor);  
   }  

(2)参考上面的代码,便引入到了 transfer 方法,(引入重点)这就是 HashMap 并发时,会引起死循环的根本原因所在,下面结合 transfer 的源代码,说明一下产生死循环的原理,先列 transfer 代码(这是里 JDK7 的源偌),如下:

/**
     * Transfers all entries from current table to newTable.
     */
    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
 
            while(null != e) {
                Entry<K,V> next = e.next;            ---------------------(1)
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity); 
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            } // while
 
        }
    }

(3)假设:

Map<Integer> map = new HashMap<Integer>(2);  // 只能放置两个元素,其中的threshold为1(表中只填充一个元素时),即插入元素为1时就扩容(由addEntry方法中得知)
//放置2个元素 3 和 7,若要再放置元素8(经hash映射后不等于1)时,会引起扩容

假设放置结果图如下:

img

现在有两个线程 A 和 B,都要执行 put 操作,即向表中添加元素,即线程 A 和线程 B 都会看到上面图的状态快照

执行顺序如下:

​ 执行一: 线程 A 执行到 transfer 函数中(1)处挂起(transfer 函数代码中有标注)。此时在线程 A 的栈中

e = 3
next = 7

​ 执行二:线程 B 执行 transfer 函数中的 while 循环,即会把原来的 table 变成新一 table(线程 B 自己的栈中),再写入到内存中。如下图(假设两个元素在新的 hash 函数下也会映射到同一个位置)

img

​ 执行三: 线程 A 解挂,接着执行(看到的仍是旧表),即从 transfer 代码(1)处接着执行,当前的 e = 3, next = 7, 上面已经描述。

​ \1. 处理元素 3 , 将 3 放入 线程 A 自己栈的新 table 中(新 table 是处于线程 A 自己栈中,是线程私有的,不肥线程 2 的影响),处理 3 后的图如下:

img

​ \2. 线程 A 再复制元素 7 ,当前 e = 7 , 而 next 值由于线程 B 修改了它的引用,所以 next 为 3 ,处理后的新表如下图

img

​ \3. 由于上面取到的 next = 3, 接着 while 循环,即当前处理的结点为 3, next 就为 null ,退出 while 循环,执行完 while 循环后,新表中的内容如下图:

img

​ \4. 当操作完成,执行查找时,会陷入死循环!

欢迎大家指正!