从1990年的论文来详细聊聊AQS的前世今生

爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

从1990年的论文来详细聊聊AQS的前世今生

　　今天的主题是AbstractQueuedSynchronizer，即AQS。作为java。util。concurrent的基础，AQS在工作中的重要性是毋庸置疑的。通常在面试中也会有两道必考题等着你：原理相关：AQS是什么？它是怎样实现的？设计相关：如何使用AQS实现Mutex？
　　原理相关的问题几乎会出现在每场Java面试中，是面试中的明枪，是必须要准备的内容；而设计相关的问题更多的是对技术深度的考察，算是暗箭，要尤为谨慎的去应对。
　　为了全面地理解AQS的设计，今天我们会从1990年T。E。Anderson引入排队的思想萌芽开始，到MellorCrummey和Scott提出的MCS锁，以及Craig，Landin和Hagersten设计的CLH锁。
　　AQS的内容整体规划了4个部分：
　　今天我们一起学习前两个部分，了解AQS的前世。
　　Tips：本文基于Java11完成，与Java8存在部分差异，请注意区分源码之间的差异。AQS是什么？
　　通常我们按照类名将AbstractQueuedSynchronizer翻译为抽象队列同步器。单从类名来看，我们就已经可以得到3个重要信息：Abstract：抽象类，通常无法直接使用；Queued：队列，借助队列实现功能；Synchronizer：同步器，用于控制并发。
　　源码中的注释也对AQS做了全面的概括：
　　Providesaframeworkforimplementingblockinglocksandrelatedsynchronizers（semaphores，events，etc）thatrelyonfirstinfirstout（FIFO）waitqueues。
　　提供了依赖于FIFO等待队列用于实现阻塞锁和同步器（信号量，事件等）的框架。这段描述恰好印证了我们通过类名得到的信息，我们来看Java中有哪些AQS的实现：
　　可以看到，JUC中有大量的同步工具内部都是通过继承AQS来实现的，而这也正是DougLea对AQS的期望：成为大部分同步工具的基础组件。
　　Tips：至少在Java8中，FutureTask已经不再依赖AQS实现了（未考证具体版本）。
　　接着我们来看注释中提到的relyonfirstinfirstout（FIFO）waitqueues，这句话指出AQS依赖了FIFO的等待队列。那么这个队列是什么？我们可以在注释中找到答案：
　　ThewaitqueueisavariantofaCLH（Craig，Landin，andHagersten）lockqueue。CLHlocksarenormallyusedforspinlocks。
　　AQS中使用的等待队列时CLH队列的变种。那么CLH队列是什么呢？AQS做了哪些改变呢？AQS的前世
　　AQS明确揭示了它使用CLH队列的变种，因此我从CLH队列的相关论文入手：Craig于1993年发表的《BuildingFIFOandpriorityqueueingspinlocksfromatomicswap》Landin和Hagersten于1994年发表的《EfficientSoftwareSynchronizationonLargeCacheCoherentMultiprocessors》
　　这两篇文章都引用了T。E。Anderson于1990年发表的的《ThePerformanceofSpinLockAlternativesforSharedMemoryMultiprocessors》，因此我们以这篇文章中提出的基于数组的自旋锁设计作为切入点。
　　Tips：《EfficientSoftwareSynchronizationonLargeCacheCoherentMultiprocessors》的作者有3个人Landin和Hagersten的《EfficientSoftwareSynchronizationonLargeCacheCoherentMultiprocessors》中引用了Craig的《BuildingFIFOandpriorityqueueingspinlocksfromatomicswap》，Craig率先提出了CLH锁的结构，不知道为什么学术界以他们3人进行命名；由于论文是很多年前收集的，现在去查找原始网站较为困难，只能提供下载链接了，对不起各位祖师爷T。E。AndersonThePerformanceofSpinLockAlternativesforSharedMemoryMultiprocessors1990MellorCrummey，ScottAlgorithmsforScalableSynchronizationonSharedMemoryMultiprocessors1991CraigBuildingFIFOandpriorityqueueingspinlocksfromatomicswap1993Landin，HagerstenEfficientSoftwareSynchronizationonLargeCacheCoherentMultiprocessors1994DougLeaThejava。util。concurrentSynchronizerFramework2004《多处理器编程的艺术》中第7章详细讨论了队列锁的设计，包括基于数组的设计，MCS锁，CLH锁。基于数组的自旋锁
　　1990年T。E。Anderson发表了《ThePerformanceofSpinLockAlternativesforSharedMemoryMultiprocessors》，文章讨论了基于CPU原子指令自旋锁的性能瓶颈，并提出了基于数组的自旋锁设计。基于原子指令的自旋锁
　　第一种设计（SPINONTESTANDSET），即TASLock，使用CPU提供的原子指令testandset尝试更新锁标识：
　　初始化锁标识为CLEAR，获取锁时尝试更新锁标识为BUSY，更新成功则获取到锁，释放时将锁标识更新为CLEAR。
　　设计非常简单，竞争并不激烈的场景下性能也是完全没问题，但是一旦CPU的核心数增多，问题就出现了：持有者在释放锁时要和其它正在自旋的竞争者争夺锁标识内存的独占访问权限，因为testandset是原子写操作；在使用总线的体系结构中，无论testandset指令是否成功，它都会消耗一次总线事务，会使总线变得拥堵。
　　因此提出了第二种设计（SPINONREAD），即TTASLock，加入test指令，避免频繁的：
　　该设计中，在执行testandset指令前，先进行锁标识状态的判断，处于BUSY状态，直接进入自旋逻辑（或运算的短路特性），跳过testandset指令的执行。
　　额外一次读取操作，避免了频繁的testandset指令造成的内存争抢，也减少了总线事务，竞争者只需要自旋在自己的缓存上即可，只有锁标识发生改变时，才会执行testandset指令。
　　这种设计依旧有些性能问题无法解决：如果频繁锁标识频繁的发生改变，CPU的缓存会频繁的失效，重新读取；持有者释放锁时，会导致所有CPU的缓存失效，必须重新在内存或总线中竞争。
　　T。E。Anderson对两种设计进行了测试，计算了在不同数量的CPU上执行了100万次操作的耗时，执行等待锁，执行临界区，释放锁和延迟一段时间。
　　可以看到SPINONREAD的设计随着CPU数量的增多性能确实得到了改善，但距离理想的性能曲线仍有着不小的差距。
　　除了这两种设计外，T。E。Anderson还考虑了在自旋逻辑中引入延迟来减少冲突：
　　此时需要考虑设置合理的延迟时间，选择合适的退避（backoff）算法来减少竞争。
　　Tips：Java版TASLock和TTASLock，供大家参考。基于数组的自旋锁
　　前面的设计中，自旋锁的性能问题是由多个CPU同时争抢内存访问权限产生的，那么让它们按顺序排队是不是就解决了这个问题？T。E。Anderson引入了队列的设计：
　　初始化创建长度为CPU数量P的数组flags〔P〕flags〔0〕标识为HASLOCK（拥有锁），其余标记为MUSTWAIT（等待锁）初始化queueLast为0，标识当前队列位置
　　加锁CPU通过ReadAndIncrement指令读取queueLast后保存为自己的myPlaceReadAndIncrement指令，先读取，后自增CPU判断自己的flags〔myPlacemodP〕上的标记来决定持有锁或进入自旋取模操作让数组变成了头尾相连的环状数组
　　解锁将当前CPU在队列中的位置flags〔myPlace〕更新为MUSTWAIT将flags〔（myPlace1）modP〕更新为HASLOCK，标识下一个CPU获取锁
　　每个CPU只访问自己的锁标识（myPlace），避免了争抢内存访问的权限，另外锁会直接释放给队列中的下一个CPU，避免了通过竞争获取，减少了从释放锁到获取锁的时间。
　　当然缺点也很明显，仅从伪代码的行数上也能看出来，基于队列的自旋锁设计更复杂，当竞争并不激烈时，它的性能会更差。T。E。Anderson也给出了他的测试结果：
　　很明显，在竞争激烈的场景中，引入队列后的自旋锁性能更加优秀，并没有过多的额外开销。
　　Tips：T。E。Anderson的论文就介绍到这里，除了对自旋锁的讨论，文章中还讨论了在自旋锁引入退避算法和静态延迟（staticdelays）的优劣，就留给大家自行阅读了；Java版TEALock，供大家参考（名字是我自己起的）。MCS锁的设计
　　基于数组的自旋锁是排队思想的实现，T。E。Anderson的论文发表后，又涌现出了许多使用排队思想锁，例如：MellorCrummey和Scott于1991年在论文《AlgorithmsforScalableSynchronizationonSharedMemoryMultiprocessors》中提出的MCS锁，也是基于排队思想实现，只不过在数据结构上选择了单向链表。
　　描述MCS锁的初始化与加解锁的原理，我使用经过本地化的Java实现版本的MCS锁：MCS锁的初始化publicclassMCSLock｛AtomicReferenceQNodelock；ThreadLocalQNodemyNode；publicMCSLock（）｛this。locknewAtomicReference（null）；this。myNodeThreadLocal。withInitial（QNode：：new）；｝privatestaticclassQNode｛privatebooleanlocked；privateQNodenext；｝｝复制代码声明单向链表的节点QNode，locked表示锁是否被前驱节点获取；创建QNode节点lock，表示当前锁的位置，实际上也是链表的尾节点。MCS锁的加锁publicvoidlock（）｛QNodeIthis。myNode。get（）；QNodepredecessorthis。lock。getAndSet（I）；if（predecessor！null）｛I。lockedtrue；predecessor。nextI；while（I。locked）｛System。out。println（自旋，可以加入退避算法）；｝｝｝复制代码为每个线程初始化QNode，命名为I；通过原子指令获取I的前驱节点lock命名为predecessor，并将I设置为lock（取出当前lock，并设置新的lock）；当predecessornull时，表示队列为空，可以直接返回，代表获取到锁；当predecessor！null时，表示前驱节点已经获取到锁；更新locked，表示锁已经被前驱节点获取；更新predecessor的后继节点为I，否则predecessor无法唤醒I；I进入自旋逻辑。MCS锁的解锁publicvoidunlock（）｛QNodeIthis。I。get（）；if（I。nextnull）｛if（lock。compareAndSet（I，null））｛return；｝while（I。nextnull）｛System。out。println（自旋）；｝｝I。next。lockedfalse；I。nextnull；｝复制代码获取当前线程的QNode命名为I；如果I。nextnull，队列中无其它节点，即不存在锁竞争的场景；尝试通过CAS更新lock为null，保证下次加锁时predecessornull，成功则直接返回；如果失败，表示此时有线程开始竞争锁，此时进入自旋，保证竞争者成功执行predecessor。nextI；如果I。next！null，队列中有其他节点，锁存在竞争；更新后继节点的locked标识，使其跳出自旋；更新自己的后继节点指针，断开联系。
　　MCS锁的逻辑并不复杂，不过有些细节设计的非常巧妙，提个问题供大家思考下：加锁过程中I。lockedtrue和predecessor。nextI的顺序可以调整吗？
　　MCS锁的整体设计思路到这里就结束了，MellorCrummey和Scott给出了MCS锁的4个优点：FIFO保证了公平性，避免了锁饥饿；自旋标识是线程自身的变量，避免了共享内存的访问冲突；每个锁的创建只需要极短的时间（requiresasmallconstantamountofspaceperlock）；无论是否采用一致性缓存架构，每次获取锁只需要O（1）O（1）O（1）级别的通信开销。
　　除此之外，相较于T。E。Anderson的设计，MCS锁在内存空间上是按需分配，并不需要初始化固定长度数组，避免了内存浪费。
　　Tips：本文只简单的介绍MCS锁的原理，想要深入学习的可以阅读以下内容：《AlgorithmsforScalableSynchronizationonSharedMemoryMultiprocessors》《多处理器编程的艺术》第7章Java版MCSLock，供大家参考，代码有详细的注释。CLH锁的设计
　　1993年Craig发表了《BuildingFIFOandpriorityqueueingspinlocksfromatomicswap》，文章中描述了另一种基于排队思想的队列锁，即CLH锁（我觉得称为CraigLock更合适）的雏形，它和MCS锁很相似，但有一些差异：CLH旋转在队列前驱节点的锁标识上；CLH锁使用了一种隐式的链表结果。
　　我们带着这两个差异来看CLH的锁的设计，原文使用Pascal风格的伪代码，这里我们使用《多处理器编程的艺术》中提供的Java版本，与论文中的差异较大，重点理解实现思路即可。CLH锁的初始化publicclassCLHLock｛AtomicReferenceNodetail；ThreadLocalNodemyPred；ThreadLocalNodemyNode；publicCLHLock（）｛this。tailnewAtomicReference（newNode（））；this。myNodeThreadLocal。withInitial（Node：：new）；this。myPrednewThreadLocal（）；｝privatestaticclassNode｛privatevolatilebooleanlockedfalse；｝｝复制代码
　　Craig的设计中，请求锁的队列节点有两种状态，在实现中可以使用布尔变量代替：PENDING，表示获取到锁或者等待获取锁，可以使用true；GRANTED，表示释放锁，可以使用false。
　　另外CLHLock的初始化中，this。tailnewAtomicReference（newQNode（））添加了默认节点，该节点的locked默认为false，这是借鉴了链表处理时常用到技巧虚拟头节点。CLH锁的加锁publicvoidlock（）｛NodemyNodethis。myNode。get（）；myNode。lockedtrue；Nodepredthis。tail。getAndSet（myNode）；this。myPred。set（pred）；while（myPred。locked）｛System。out。println（自旋，可以加入退避算法）；｝｝复制代码
　　实现中巧妙的使用了两个ThreadLocal变量来构建出了逻辑上的链表，和传统意义的单向链表不同，CLH的链表从尾节点开始指向头部。
　　另外，CLH锁中的节点只关心自身前驱节点的状态，当前驱节点释放锁的那一刻，节点就知道轮到自己获取锁了。CLH锁的解锁publicvoidunlock（）｛NodemyNodethis。myNode。get（）；myNode。lockedfalse；this。myNode。set（this。myPred。get（））；｝复制代码
　　解锁的逻辑也非常简单，只需要更新自身的锁标识即可。但是你可能会疑问this。myNode。set（this。myPred。get（））是用来干嘛的？删除会产生什么影响吗？
　　Tips：Java版CLHLock，供大家参考，代码有详细的注释。单线程场景
　　在单线程场景中，完成CLH锁的初始化后，锁的内部结构是如下：
　　Tips：后表示Node节点的地址。
　　第一次加锁后状态如下：
　　这时前驱节点的锁标记为false，表示当前节点可以直接获取锁。
　　第一次解锁后状态如下：
　　到目前为止一切都很正常，但是当我们再次加锁时会发现，好像没办法加锁了，我们来逐行代码分析锁的状态。当获取myNode后并更新锁标识，即执行如下代码后：NodemyNodethis。myNode。get（）；myNode。lockedtrue；复制代码
　　当获取并更新tail和myPred后，即执行如下代码后：Nodepredthis。tail。getAndSet（myNode）；this。myPred。set（pred）；复制代码
　　这时候问题出现了，myNodemyPred，导致永远无法获取锁。this。myNode。set（this。myPred。get（））相当于在链表中移除当前节点，使获取锁的节点的直接前驱节点永远是初始化时锁标识为false的默认节点。多线程场景
　　再来考虑多线程的场景，假设有线程t1和线程t2争抢锁，此时t1率先获取到锁：
　　线程t1释放后再次立即获取是有可能出现的，最典型的情况是如果为自旋逻辑添加了退避算法，当线程t2多次自旋后再次进入自旋逻辑，此时线程t1释放锁后立即尝试获取锁，先更新线程t1的锁标记为true，接着从tail节点中获取前驱节点线程t2，然后再更新tail节点，此时线程t1在线程t2的锁标记上自旋，线程t2在线程t1的锁标记上自旋，凉凉
　　留个思考题，为什么this。myNode。set（this。myPred。get（））可以避免这种情况？CLH锁和MCS锁的对比
　　首先是代码实现上，CLH锁的实现非常简单，除了自旋的部分其余全是平铺直叙，反观MCS锁，分支，嵌套，从实现难度上来看CLH锁更胜一筹（难点在于逆向思维，让当前节点自旋在直接前驱节点的锁标识上）。另外，CLH锁只在加锁时使用了一次原子指令，而MCS锁的加解锁中都需要使用原子指令，性能上也略胜一筹。
　　那么CLH锁是全面超越了MCS锁吗？不是的，在NUMA架构下，CLH锁的自旋性能非常差。先来看NUMA架构的示意图：
　　NUMA架构中，每个CPU有自己缓存，访问不同CPU缓存的成本较高，在需要频繁进入自旋的场景中CLH锁自旋的性能较差，而在需要频繁解锁更新其他CPU锁标识的场景中MCS锁的性能较差。结语
　　到目前为止，我们一起学习了3种基于排队思想的自旋锁设计，作为AQS的前世，理解它们的设计能够帮助我们理解AQS的原理。当然并非只有这3种基于排队思想的自旋锁，还有如RHLock，HCLHLock等，感兴趣的可以自行探索，这里提供论文链接：《RHLock：AScalableHierarchicalSpinLock》《AHierarchicalCLHQueueLock》
　　好了，今天就到这里了，Bye
　　作者：王有志
　　链接：https：juejin。cnpost7210043623759577125
　　来源：稀土掘金
　　著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

有哪些耐玩的switch卡带？谢邀。首屈一指应该考虑下塞尔达传说，这款游戏让很多玩家因为它入手了switch，但是你会发现耐玩与否和个人游戏习惯有关。整体来说，该游戏要是通过主线时间也并不长，但是要收集内容全部王简嘉禾游泳成绩一落千丈，为什么会这样？王简嘉禾的成绩一落千丈，用青春期成长期来解释这一切显然是说不通的。不说别的项目，只说游泳项目，中国有太多的女优秀运动员，都经历过青春期和成长期，她们都能够非常自律管制自己的食欲，通历史上有哪些匪夷所思诡异事件？你经历过最诡异的事是什么？我在少年期间经历了三次诡异事件，信不信由您，真是我亲眼看到的一那是一九五三年夏天的一个傍晚，天色已灰暗，当时闹着叫我母亲背着我上街去玩，那晚也很奇怪，街上一个人也沒有，刚走到街口，拿到驾照，已经过了一年，期间没有摸过车，如果是你一个人敢去4s店买车吗？谢邀！这个不好说。分两种情况而定。如果自己原来就会开车，即使一年没摸过车，这也没什么大问题。自己去买车应该没问题。本人从事汽车修理，未拿驾照前就会开车。所以，这个要看自己驾驶技术和券商高开暴跌，利好被反噬，还能继续吗？券商特大利好变成特大利空一样，出现大幅高开杀跌，收出一根放量大阴棒虽然券商利好被反噬肯定不会继续的，券商借利好打压股价是暂时的，不会延续。为什么可以肯定券商暴跌不能继续呢？根据北交刚毕业，年薪20万的外企与年薪十万多的央企该如何选择？别讲大道理了，除非你有雄心壮志，必须年薪百万以上才能满足你的才华，你就去外企。如果没有这个雄心壮志，你就一定要选央企。大概率的事件是，40岁之前，央企的羡慕外企的高薪，40岁之后，服用鱼油一定会缓解尿蛋白异常改善肾功能吗？为什么？关于鱼油对IgA肾病的治疗效果，有些研究认为有效，而另一些研究认为无效。国外用鱼油治疗肾病IgA肾病多些，国内则较少。鱼油有效与否，在肾病界一直争论不休。鱼油是什么？鱼油含有3脂肪期中考试数学平均分32。5，及格1人，请问我该怎么教这些孩子？期中考试数学的平均分32。5及格一人，不用猜就知道，肯定不是小学，至少是初中以上。前几天，我们单位期中考试的成绩发到单位群里，初二的学生成绩就这样，平均分三四十分，及格五六个。老师江苏考生330分左右选修BC，能上哪些二本（女生）？您好，很高兴回答你提出的问题，针对于你提出的问题，我将用自己的见解帮你解答。江苏省的高考模式相对其他省份略有不同，江苏省高考总分480分（包括40分的附加分），其中要求考生选修科目感染HIV是一种怎样的经历？我19岁的时候，第一次真正认识艾滋病，以前在高中学校倒是经常校报上宣传什么红丝带艾滋病吸毒着容易感染只知道会死人，觉得离自己好遥远，但是我表姐就得了艾滋病，她比我大5岁，24岁就死北京9600元的退休金算多吗？那是相当多，北京退休职工平均薪资目前就是五六千水平，尽管万把块的人数不少，但占比是很低的，感觉人数多只是因为北京人口基数大。很多人认为北上广深月入一万是最基本的水平，两三万都算不上

<<<<<<－>>>>>>

日印这次战略结盟同时激化两个问题，目的明确，解放军要掌握主动由于打击日本将触及美日安保条约，因此我们可以选择打击印度，在印度实施边界挑衅的时候，给予印度致命打击，或者利用巴铁的战略优势，对印度发起打击，先解决这个战略隐患。稳定了西南后方，有I。2。2既吸引幼儿又管用还特别长智慧的选择游戏大约到了宝宝要上幼儿园的年纪前后，也就是3岁上下的样子，开始进入孩子成长过程中必然遇到的第一叛逆期。其本质是宝宝成长到了这个岁数，发现了自我的存在，要通过说不来显示自我。有时候还真欧冠首轮最佳阵容莱万哈兰德姆巴佩，无敌三叉戟欧冠小组赛首轮交锋已经全部结束，切尔西在爆冷输给萨格勒布迪纳摩之后，主帅图赫尔已经火线下课。曼城大巴黎巴萨皇马等豪门均取得胜利。星球君为您评选出本轮欧冠最佳阵容，欢迎各位球迷朋友留国乒女队最强阵容出击世乒赛，谁出任一单都够格，何必烦恼世乒赛团体赛女乒阵容已定，梦莎昱迪同。这届女团虽然莎莎大迪同同是首次参赛，大梦曼昱更没有决赛经验，但是对她们充满信心，因为每个人都很强大，她们这个组合就是外协的噩梦。至于谁出任一单欧冠次轮战拜仁，哈维的首发阵容已确定9人！只有2个位置仍在纠结本轮联赛客场40大胜加的斯之后，巴萨的重心将放在3天后与拜仁的欧冠小组赛第2轮大战上。我们可以看到，本轮对阵联赛副班长加的斯，哈维果断地对阵容进行了多个位置的轮换。锋线大将莱万与登纯电版本探界者官图发布，续航483公里，内饰用大尺寸双连屏近日，从海外媒体处获取了一组雪佛兰探界者EV的官图，新车采用了全新的设计风格，造型非常时尚，基于通用奥特能纯电平台打造，起售价格约3万元美元，折合人民币约20。76万元，最长续航里宅男必备，性价比之选！Jamo尊宝C705PA有源书架音箱初体验新家装修好后一直觉得书房里总少了点什么，直到有一天刷到一篇关于书架音箱的分享后，我才恍然大悟，没错，我的书房里就是少了一对音箱。平时听音乐基本都是在开车时，在各种胎噪风噪的影响下，花蛤去沙这么简单，万不可只加盐，教你1招，花蛤狂吐沙，拦不住导语原来花蛤去沙这么简单，万不可只加盐，教你1招，花蛤狂吐沙，拦不住人间烟火气，最抚凡人心，柴米油盐最是平凡，简简单单却能温暖疲惫的身体，一日三餐四季，承载着烟火气的美食是最能抚慰500股补仓法，跌5毛补500，涨5毛出500，简单易懂的解套技巧在决定买卖操作的时候，买入和卖出只是一瞬间的操作，但是带来的盈利和损失是无法估计的，所以做出抉择的时候要果断，不要盲目的犹豫，错过良好的买入时机再追悔莫及，但是也不能一味的跟随大众华为mate50系列简单把玩感受1。mate50普通版，直瓶，正面基本做到了等宽，印象比较深的是边框跟后盖的过度，非常完美，几乎感受不到隔阂，屏幕观感还不错，比较通透2。mate50pro应该这次主力机型了，正面中秋节快乐，晒晒简单易学的中秋家宴，香气扑鼻而来，老少皆宜大家好，这里是邱哥说美食，今天是举国欢腾的中秋佳节，祝天下的网友们中秋节快乐，阖家幸福。在中秋节这个幸福团圆的日子中，你们家宴是怎么安排的呢？我们大中国幅员辽阔，泱泱大国，不同的地

友情链接：快好找快生活快百科快传网中准网文好找聚热点快软网