ConcurrentHashMap是怎么实现线程安全的

发布时间：2022-10-14 09:47:17 来源：亿速云阅读：128 作者：iii 栏目：开发技术

这篇文章主要介绍“ConcurrentHashMap是怎么实现线程安全的”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“ConcurrentHashMap是怎么实现线程安全的”文章能帮助大家解决问题。

1. 前言

我们知道，在日常开发中使用的 HashMap 是线程不安全的，而线程安全类 HashTable 和 SynchronizedMap 只是简单的在方法上加锁实现了线程安全，效率低下，所以在线程安全的环境下我们通常会使用 ConcurrentHashMap，那么 ConcurrentHashMap 又是如何实现线程安全的呢?

2. ConcurrentHashMap 是如何实现线程安全的

针对这个问题，可以从以下几个方面来阅读源码予以解答

2.1. 初始化数据结构时的线程安全

在 JDK 1.8 中，初始化 ConcurrentHashMap 的时候这个 Node[] 数组是还未初始化的，会等到第一次 put() 方法调用时才初始化

final V putVal(K key, V value, boolean onlyIfAbsent) {
	if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
		Node<K,V> f; int n, i, fh;
		// 判断Node数组为空
		if (tab == null || (n = tab.length) == 0)
			// 初始化Node数组
            tab = initTable();
        ......
}

此时会有并发问题的，如果多个线程同时调用 initTable() 初始化 Node[] 数组怎么办？

看看 Doug Lea 大师是如何处理的

private final Node<K,V>[] initTable() {
	Node<K,V>[] tab; int sc;
	// 每次循环都获取最新的Node[]数组引用
    while ((tab = table) == null || tab.length == 0) {
    	// sizeCtl是一个标记位，若为-1，代表有线程在进行初始化工作了
		if ((sc = sizeCtl) < 0)
			// 让出CPU时间片
			Thread.yield(); 
		// 此时，代表没有线程在进行初始化工作，CAS操作，将本实例的sizeCtl变量设置为-1	
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
        	// 如果CAS操作成功了，代表本线程将负责初始化工作
        	try {
        		// 再检查一遍数组是否为空
            	if ((tab = table) == null || tab.length == 0) {
            		// 在初始化ConcurrentHashMap时，sizeCtl代表数组大小，默认16
          			// 所以此时n默认为16
                	int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    // 将其赋值给table变量
                    table = tab = nt;
                    // 通过位运算，n减去n二进制右移2位，相当于乘以0.75
          			// 例如16经过运算为12，与乘0.75一样，只不过位运算更快
                    sc = n - (n >>> 2);
                }
            } finally {
            	// 将计算后的sc（12）直接赋值给sizeCtl，表示达到12长度就扩容
        		// 由于这里只会有一个线程在执行，直接赋值即可，没有线程安全问题，只需要保证可见性
            	sizeCtl = sc;
			}
            break;
		}
	}
	return tab;
}

table 变量使用了 volatile 来保证每次获取到的都是最新写入的值

transient volatile Node<K,V>[] table;

ConcurrentHashMap 源码中 sizeCtl 变量注释如下

// 表初始化和调整控件大小。如果为负值，则表正在初始化或调整大小：-1用于初始化，否则-（1+活动调整大小线程的数量）
// 否则，当table为null时，将保留创建时使用的初始表大小，默认值为0。初始化后，保存下一个要调整表大小的元素计数值
private transient volatile int sizeCtl;

在 ConcurrentHashMap 初始化时，初始化 sizeCtl

public ConcurrentHashMap(int initialCapacity) {
	if (initialCapacity < 0)
            throw new IllegalArgumentException();
	int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
			MAXIMUM_CAPACITY :
            tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
	this.sizeCtl = cap;
}
public ConcurrentHashMap(Map<? extends K, ? extends V> m) {
	this.sizeCtl = DEFAULT_CAPACITY;
    putAll(m);
}
public ConcurrentHashMap(int initialCapacity,
                             float loadFactor, int concurrencyLevel) {
	if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
		throw new IllegalArgumentException();
	if (initialCapacity < concurrencyLevel)   // Use at least as many bins
        initialCapacity = concurrencyLevel;   // as estimated threads
	long size = (long)(1.0 + (long)initialCapacity / loadFactor);
    int cap = (size >= (long)MAXIMUM_CAPACITY) ?
		MAXIMUM_CAPACITY : tableSizeFor((int)size);
	this.sizeCtl = cap;
}

2.1.1. 总结

就算有多个线程同时进行 put 操作，在初始化 Node[] 数组时，使用了 CAS 操作来决定到底是哪个线程有资格进行初始化，其他线程只能等待。

用到的并发技巧如下：

volatile 修饰 sizeCtl 变量：它是一个标记位，用来告诉其他线程这个坑位有没有线程在进行初始化工作，其线程间的可见性由 volatile 保证
CAS 操作：CAS 操作保证了设置 sizeCtl 标记位的原子性，保证了在多线程同时进行初始化 Node[] 数组时，只有一个线程能成功

2.2. put 操作时的线程安全

public V put(K key, V value) {
	return putVal(key, value, false);
}
    
final V putVal(K key, V value, boolean onlyIfAbsent) {
	// K,V 都不能为空
	if (key == null || value == null) throw new NullPointerException();
	// 取得 key 的 hash 值
	int hash = spread(key.hashCode());
	// 用来计算在这个节点总共有多少个元素，用来控制扩容或者转换为树
	int binCount = 0;
	// 数组的遍历，自旋插入结点，直到成功
	for (Node<K,V>[] tab = table;;) { 
		Node<K,V> f; int n, i, fh;
		// 当Node[]数组为空时，进行初始化
		if (tab == null || (n = tab.length) == 0)    			
			tab = initTable();
		// Unsafe类volatile的方式取出hashCode散列后通过与运算得出的Node[]数组下标值对应的Node对象
    	// 此时 Node 位置若为 null，则表示还没有线程在此 Node 位置进行插入操作，说明本次操作是第一次
		else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
			// 如果这个位置没有元素的话，则通过 CAS 的方式插入数据
			if (casTabAt(tab, i, null, 
					// 创建一个 Node 添加到数组中，null 表示的是下一个节点为空
					new Node<K,V>(hash, key, value, null)))
				// 插入成功，退出循环	
                break;         
		}
		// 如果检测到某个节点的 hash 值是 MOVED，则表示正在进行数组扩容     
		else if ((fh = f.hash) == MOVED)    
			// 帮助扩容
			tab = helpTransfer(tab, f);
		// 此时，说明已经有线程对Node[]进行了插入操作，后面的插入很有可能会发生Hash冲突
        else {
			V oldVal = null;
			// ----------------synchronized----------------
            synchronized (f) {
            	// 二次确认此Node对象还是原来的那一个
                if (tabAt(tab, i) == f) {
                	// ----------------table[i]是链表结点----------------
                    if (fh >= 0) {
                    	// 记录结点数，超过阈值后，需要转为红黑树，提高查找效率
                    	binCount = 1;            
                        // 遍历这个链表
                        for (Node<K,V> e = f;; ++binCount) {
                        	K ek;
                            // 要存的元素的 hash 值和 key 跟要存储的位置的节点的相同的时候，替换掉该节点的 value 即可
                            if (e.hash == hash && 
                            	((ek = e.key) == key ||
                                (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                	e.val = value;
                                break;
                            }
                            // 到了链表的最末端，将新值放到链表的最末端
                            Node<K,V> pred = e;
                            // 如果不是同样的 hash，同样的 key 的时候，则判断该节点的下一个节点是否为空
                            if ((e = e.next) == null) { 
                            	// ----------------“尾插法”插入新结点----------------
                               	pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                break;
                            }
						}
					}
					// ----------------table[i]是红黑树结点----------------
                    else if (f instanceof TreeBin) { 
                    	Node<K,V> p;
                        binCount = 2;
                        // 调用putTreeVal方法，将该元素添加到树中去
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                        	oldVal = p.val;
                            if (!onlyIfAbsent)
                            	p.val = value;
                        }
					}
				}
			}
			if (binCount != 0) {
				// 当在同一个节点的数目达到8个的时候，则扩张数组或将给节点的数据转为tree
				if (binCount >= TREEIFY_THRESHOLD)
					// 链表 -> 红黑树 转换
                	treeifyBin(tab, i);    
                // 表明本次put操作只是替换了旧值，不用更改计数值	
                if (oldVal != null)
                	return oldVal;
                break;
			}
		}
	}
	addCount(1L, binCount);// 计数值加1
	return null;
}

值得关注的是 tabAt(tab, i) 方法，其使用 Unsafe 类 volatile 的操作 volatile 式地查看值，保证每次获取到的值都是最新的

static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
	return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}

虽然上面的 table 变量加了 volatile，但也只能保证其引用的可见性，并不能确保其数组中的对象是否是最新的，所以需要 Unsafe 类 volatile 式地拿到最新的 Node

put() 方法的核心思想：由于其减小了锁的粒度，若 Hash 完美不冲突的情况下，可同时支持 n 个线程同时 put 操作，n 为 Node 数组大小，在默认大小 16 下，可以支持最大同时 16 个线程无竞争同时操作且线程安全

当 Hash 冲突严重时，Node 链表越来越长，将导致严重的锁竞争，此时会进行扩容，将 Node 进行再散列，下面会介绍扩容的线程安全性。

总结一下用到的并发技巧

减小锁粒度：将 Node 链表的头节点作为锁，若在默认大小 16 情况下，将有 16 把锁，大大减小了锁竞争（上下文切换），就像开头所说，将串行的部分最大化缩小，在理想情况下线程的 put 操作都为并行操作。同时直接锁住头节点，保证了线程安全
使用了 volatile 修饰 table 变量，并使用 Unsafe 的 getObjectVolatile() 方法拿到最新的 Node
CAS 操作：如果上述拿到的最新的 Node 为 null，则说明还没有任何线程在此 Node 位置进行插入操作，说明本次操作是第一次
synchronized 同步锁：如果此时拿到的最新的 Node 不为 null，则说明已经有线程在此 Node 位置进行了插入操作，此时就产生了 hash 冲突；此时的 synchronized 同步锁就起到了关键作用，防止在多线程的情况下发生数据覆盖（线程不安全），接着在 synchronized 同步锁的管理下按照相应的规则执行操作

当 hash 值相同并 key 值也相同时，则替换掉原 value

否则，将数据插入链表或红黑树相应的节点

2.3. get 操作时的线程安全

对于 get 操作其实没有线程安全的问题，只有可见性的问题，只需要确保 get 的数据是线程之间可见的即可

public V get(Object key) {
	Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
	// 重新计算key的hash值
	int h = spread(key.hashCode());
	// table不能为null，且table[i]不能为空
	if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        // 检查头结点，table[i]就是待查找的项，直接返回
        if ((eh = e.hash) == h) {
        	if ((ek = e.key) == key || (ek != null && key.equals(ek)))
            	return e.val;
        }
        // hash值<0, 说明遇到特殊结点(非链表结点), 调用find()方法查找
        else if (eh < 0)
        	// 调用节点对象的find方法查找值
        	return (p = e.find(h, key)) != null ? p.val : null;
        // 按链表方式查找
       	while ((e = e.next) != null) {
        	if (e.hash == h &&
            	((ek = e.key) == key || (ek != null && key.equals(ek))))
            	return e.val;
		}
	}
	return null;
}

在 get 操作中除了增加了迁移的判断以外，基本与 HashMap 的 get 操作无异，这里不多赘述，值得一提的是这里使用了 tabAt() 方法 Unsafe 类 volatile 的方式去获取 Node[] 数组中的 Node，保证获得到的 Node 是最新的

static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
    return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}

2.4. 扩容操作时的线程安全

在扩容时，ConcurrentHashMap 支持多线程并发扩容，在扩容过程中同时支持 get 查数据，若有线程 put 数据，还会帮助一起扩容，这种无阻塞算法，将并行最大化的设计，堪称一绝

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
	int n = tab.length, stride;
	// stride可理解成“步长”，即“数据迁移”时，每个线程要负责旧table中的多少个桶，根据几核的CPU决定“步长”
    if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
    	// 本线程分到的迁移量，假设为16（默认也为16）
    	stride = MIN_TRANSFER_STRIDE; 
    // 说明第一次扩容
    if (nextTab == null) {            
        try {
        	@SuppressWarnings("unchecked")
        	// 创建新table数组，扩大一倍为 32,n还为16
            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
            nextTab = nt;
        } catch (Throwable ex) {      
        	// 将表示容量的sizeCtl 设置为最大值，然后返回
            sizeCtl = Integer.MAX_VALUE;
            return;
        }  
        nextTable = nextTab;
        // 表示当前线程要进行数据迁移的桶区间
		transferIndex = n;
	}
	int nextn = nextTab.length;
	// 在get或者put时若遇到此 Node，则可以知道当前Node正在迁移
	// ForwardingNode结点，当旧table的某个桶中的所有结点都迁移完后，用该结点占据这个桶
    ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
    // 标识一个桶的迁移工作是否完成，advance == true 表示可以进行下一个位置的迁移
    boolean advance = true;
    // 最后一个数据迁移的线程将该值置为true，并进行本轮扩容的收尾工作
    boolean finishing = false; 
   	// i标识桶索引, bound标识边界
    for (int i = 0, bound = 0;;) {
    	Node<K,V> f; int fh;
        // 每一次自旋前的预处理，主要是为了定位本轮处理的桶区间
   		// 正常情况下，预处理完成后：i == transferIndex-1：右边界
    	// bound == transferIndex-stride：左边界
        while (advance) {
        	int nextIndex, nextBound;
            if (--i >= bound || finishing)
            	advance = false;
             else if ((nextIndex = transferIndex) <= 0) {
             	i = -1;
                 advance = false;
             }
             else if (U.compareAndSwapInt
             		(this, TRANSFERINDEX, nextIndex,
                          nextBound = (nextIndex > stride ?
                                       nextIndex - stride : 0))) {
             	bound = nextBound;
                i = nextIndex - 1;
                advance = false;
             }
        }
        // 当前是处理最后一个tranfer任务的线程或出现扩容冲突
        if (i < 0 || i >= n || i + n >= nextn) {
        	int sc;
            if (finishing) {// 所有桶迁移均已完成
            	nextTable = null;
                table = nextTab;
                sizeCtl = (n << 1) - (n >>> 1);
                return;
        	}
        	// 扩容线程数减1,表示当前线程已完成自己的transfer任务
            if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
            	// 判断当前线程是否是本轮扩容中的最后一个线程，如果不是，则直接退出
            	if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                	return;
                finishing = advance = true;
                /**
     			 * 最后一个数据迁移线程要重新检查一次旧table中的所有桶，看是否都被正确迁移到新table了：
                 * ①正常情况下，重新检查时，旧table的所有桶都应该是ForwardingNode;
                 * ②特殊情况下，比如扩容冲突(多个线程申请到了同一个transfer任务)，此时当前线程领取的任务会作废，那么最后检查时，
                 * 还要处理因为作废而没有被迁移的桶，把它们正确迁移到新table中
                 */
                i = n; 
            }
		}
		// 旧桶本身为null，不用迁移，直接尝试放一个ForwardingNode
        else if ((f = tabAt(tab, i)) == null)
        	advance = casTabAt(tab, i, null, fwd);
       	// 该旧桶已经迁移完成，直接跳过
        else if ((fh = f.hash) == MOVED)
       		advance = true; 
       	// 该旧桶未迁移完成，进行数据迁移
        else {
        	synchronized (f) {
            	if (tabAt(tab, i) == f) {
                	Node<K,V> ln, hn;
                	// 桶的hash>0，说明是链表迁移
                    if (fh >= 0) {
                    	/**
                         * 下面的过程会将旧桶中的链表分成两部分：ln链和hn链
                         * ln链会插入到新table的槽i中，hn链会插入到新table的槽i+n中
                         */                        
                    	int runBit = fh & n;
                    	// lastRun指向最后一个相邻runBit不同的结点
                        Node<K,V> lastRun = f;
                        for (Node<K,V> p = f.next; p != null; p = p.next) {
                        	int b = p.hash & n;
                            if (b != runBit) {
                            	runBit = b;
                                lastRun = p;
                            }
						}
                        if (runBit == 0) {
                        	ln = lastRun;
                            hn = null;
                        }
                        else {
                        	hn = lastRun;
                            ln = null;
                        }
                        // 以lastRun所指向的结点为分界，将链表拆成2个子链表ln、hn
                        for (Node<K,V> p = f; p != lastRun; p = p.next) {
                        	int ph = p.hash; K pk = p.key; V pv = p.val;
                            if ((ph & n) == 0)
                            	ln = new Node<K,V>(ph, pk, pv, ln);
                            else
                                hn = new Node<K,V>(ph, pk, pv, hn);
                        }
                        setTabAt(nextTab, i, ln); // ln链表存入新桶的索引i位置
                        setTabAt(nextTab, i + n, hn); // hn链表存入新桶的索引i+n位置
                        setTabAt(tab, i, fwd); // 设置ForwardingNode占位
                        advance = true;	// 表示当前旧桶的结点已迁移完毕
					}
                    else if (f instanceof TreeBin) {
                    	/**
                         * 下面的过程会先以链表方式遍历，复制所有结点，然后根据高低位组装成两个链表；
                         * 然后看下是否需要进行红黑树转换，最后放到新table对应的桶中
                         */
                    	TreeBin<K,V> t = (TreeBin<K,V>)f;
                        TreeNode<K,V> lo = null, loTail = null;
                        TreeNode<K,V> hi = null, hiTail = null;
                        int lc = 0, hc = 0;
                        for (Node<K,V> e = t.first; e != null; e = e.next) {
                        	int h = e.hash;
                            TreeNode<K,V> p = new TreeNode<K,V>
                            	(h, e.key, e.val, null, null);
                            if ((h & n) == 0) {
                            	if ((p.prev = loTail) == null)
                                	lo = p;
                                else
                                	loTail.next = p;
                                 	loTail = p;
                                    ++lc;
							}
                            else {
                            	if ((p.prev = hiTail) == null)
                                	hi = p;
                                else
                                    hiTail.next = p;
                                    hiTail = p;
                                    ++hc;
							}
						}
						// 判断是否需要进行 红黑树 <-> 链表 的转换
                        ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                        	(hc != 0) ? new TreeBin<K,V>(lo) : t;
                        hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                            (lc != 0) ? new TreeBin<K,V>(hi) : t;
                        setTabAt(nextTab, i, ln);
                        setTabAt(nextTab, i + n, hn);
                        setTabAt(tab, i, fwd); // 设置ForwardingNode占位
                        advance = true; // 表示当前旧桶的结点已迁移完毕
					}
				}
			}
		}
	}
}

2.4.1. 扩容时的 get 操作

假设 Node下标为 16 的 Node 节点正在迁移扩容，突然有一个线程进来调用 get() 方法，正好 key 又散列到下标为 16 的节点，此时怎么办？

public V get(Object key) {
	Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
	// 重新计算key的hash值
	int h = spread(key.hashCode());
	// table不能为null，且table[i]不能为空
	if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        // 检查头结点，table[i]就是待查找的项，直接返回
        if ((eh = e.hash) == h) {
        	if ((ek = e.key) == key || (ek != null && key.equals(ek)))
            	return e.val;
        }
        // hash值<0, 说明遇到特殊结点(非链表结点), 调用find()方法查找
        else if (eh < 0)
        	// 调用节点对象的find方法查找值
        	return (p = e.find(h, key)) != null ? p.val : null;
        // 按链表方式查找
       	while ((e = e.next) != null) {
        	if (e.hash == h &&
            	((ek = e.key) == key || (ek != null && key.equals(ek))))
            	return e.val;
		}
	}
	return null;
}

在 get() 操作的源码中，会判断 Node 中的 hash 是否小于 0（eh < 0），是否还记得我们的占位 Node，其 hash 为 MOVED，为常量值 -1，所以此时判断线程正在迁移，委托给内部类 ForwardingNode 占位 Node 去查找值

// //内部类	ForwardingNode 中 find() 方法
Node<K,V> find(int h, Object k) {
	// 这里的查找，是去新Node数组中查找的
	outer: for (Node<K,V>[] tab = nextTable;;) {
		Node<K,V> e; int n;
        if (k == null || tab == null || (n = tab.length) == 0 ||
        	(e = tabAt(tab, (n - 1) & h)) == null)
            return null;
       	for (;;) {
        	int eh; K ek;
            if ((eh = e.hash) == h &&
            	((ek = e.key) == k || (ek != null && k.equals(ek))))
                return e;
            if (eh < 0) {
            	if (e instanceof ForwardingNode) {
                	tab = ((ForwardingNode<K,V>)e).nextTable;
                    continue outer;
                }
                else
                	return e.find(h, k);
          	}
            if ((e = e.next) == null)
            	return null;
		}
	}
}

到这里之所以占位 Node 需要保存新 Node[] 数组的引用也是因为这个，它可以支持在迁移的过程中照样不阻塞地查找值，可谓是精妙绝伦的设计

ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);

2.4.2. 多线程协助扩容

在 put 操作时，假设正在迁移扩容，正好有一个线程进来，想要 put 值到迁移的 Node上，怎么办？

在 put() 方法中调用了 helpTransfer() 方法

// put() 方法中的代码片段，帮助扩容
tab = helpTransfer(tab, f);
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
	Node<K,V>[] nextTab; int sc;
	if (tab != null && (f instanceof ForwardingNode) &&
    	(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
        int rs = resizeStamp(tab.length);
        while (nextTab == nextTable && table == tab &&
        	(sc = sizeCtl) < 0) {
        	if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
            	sc == rs + MAX_RESIZERS || transferIndex <= 0)
            	break;
            // sizeCtl加 1，表示多一个线程进来协助扩容
            if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
            	transfer(tab, nextTab);
                break;
			}
		}
		return nextTab;
	}
	return table;
}

此方法涉及大量复杂的位运算，这里只是简单的说几句，此时 sizeCtl 变量用来表示 ConcurrentHashMap 正在扩容，当其准备扩容时，会将 sizeCtl 设置为一个负数

2.4.3. 总结

ConcurrentHashMap 运用各类 CAS 操作，将扩容操作的并发性能实现最大化，在扩容过程中，

就算有线程调用 get 查询方法，也可以安全的查询数据
若有线程进行 put 操作，还会协助扩容

利用 sizeCtl 标记位和各种 volatile 变量进行 CAS 操作达到多线程之间的通信、协助，在迁移扩容过程中只锁一个 Node 节点，即保证了线程安全，又提高了并发性能

3. 什么情况下 ConcurrentHashMap 会进行扩容操作

在 put 值时，发现 Node 为占位 Node（ForwardingNode）时，会协助扩容

// 在 put() 方法中的代码片段
else if ((fh = f.hash) == MOVED)    
	tab = helpTransfer(tab, f);

在 put 值时，检测到单链表长度大于 8 时

final V putVal(K key, V value, boolean onlyIfAbsent) {
	......
	
	if (binCount != 0) {
    	// TREEIFY_THRESHOLD=8，当链表长度大于8时
  		if (binCount >= TREEIFY_THRESHOLD)
      		// 调用treeifyBin方法
   	 		treeifyBin(tab, i);
  		if (oldVal != null)
  	  		return oldVal;
  		break;
	}
  ......
}

treeifyBin() 方法会将单链表转换为红黑树，增加查找效率，但在这之前，会检查数组长度，若小于 64，则会优先做扩容操作

private final void treeifyBin(Node<K,V>[] tab, int index) {
	Node<K,V> b; int n, sc;
	if (tab != null) {
		// MIN_TREEIFY_CAPACITY = 64，若数组长度小于64，则先扩容
		if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
			// 扩容
        	tryPresize(n << 1);
        else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {
        	synchronized (b) {
        		// 转换为红黑树的操作
            	......
            }
		}
	}
}

在每次 put 值之后，都会调用 addCount() 方法，检测 Node[] 数组大小是否达到阈值

private final void addCount(long x, int check) {
	CounterCell[] as; long b, s;
	if ((as = counterCells) != null ||
    	!U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
    	// 统计元素个数的操作
        CounterCell a; long v; int m;
        boolean uncontended = true;
		if (as == null || (m = as.length - 1) < 0 ||
        	(a = as[ThreadLocalRandom.getProbe() & m]) == null ||
            !(uncontended =
             U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
             fullAddCount(x, uncontended);
             return;
		}
		if (check <= 1)
        	return;
		s = sumCount();
	}
	if (check >= 0) {
		Node<K,V>[] tab, nt; int n, sc;
		// 元素个数达到阈值，进行扩容
       	while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
        	(n = tab.length) < MAXIMUM_CAPACITY) {
        	int rs = resizeStamp(n);
        	// 发现sizeCtl为负数，证明有线程正在迁移扩容
            if (sc < 0) {
            	if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                	sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
				if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                	transfer(tab, nt);
			}
			// 不为负数，则为第一个迁移的线程
			else if (U.compareAndSwapInt(this, SIZECTL, sc,
             							(rs << RESIZE_STAMP_SHIFT) + 2))
				transfer(tab, null);
			s = sumCount();
		}
	}
}

关于“ConcurrentHashMap是怎么实现线程安全的”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识，可以关注亿速云行业资讯频道，小编每天都会为大家更新不同的知识点。

向AI问一下细节

ConcurrentHashMap是怎么实现线程安全的

1. 前言

2. ConcurrentHashMap 是如何实现线程安全的

2.1. 初始化数据结构时的线程安全

2.2. put 操作时的线程安全

2.3. get 操作时的线程安全

2.4. 扩容操作时的线程安全

3. 什么情况下 ConcurrentHashMap 会进行扩容操作

猜你喜欢

最新资讯

相关推荐

相关标签