JUC专题——Java并发机制的底层实现原理

news2025/2/6 5:45:16

本文部分内容节选自《Java并发编程的艺术》

volatile 的应用

volatile 是轻量级的 synchronized, 它在多处理器开发中保证了共享变量的 “可见性”. 可见性的意思是当一个线程修改一个共享变量时, 另外一个线程能读到这个修改的值. 如果 volatile变量修饰符使用恰当的话, 它比 synchronized 的使用和执行成本更低, 因为它不会引起线程上下文切换和调度

volatile 的定义和实现原理

Java 语言规范中对 volatile 的定义如下: Java 编程语言允许线程访问共享变量, 为了保证共享变量能被准确和一致地更新, 线程应该确保通过排他锁单独获得这个变量 . 如果一个变量被声明为 volatile, 那么 Java 线程内存模型保证所有线程看到这个变量的值是一致的

volatile 的两条实现原则

  1. Lock前缀指令会引起处理器缓存写回到内存 .
  2. 一个处理器缓存回写到内存会导致其他处理器的缓存无效 .

volatile 的使用优化

JDK7的并发包中新增了一个队列集合类 LinkedTransferQueue , 它在使用 volatile 变量时, 通过一种追加字节的方式来优化队列出队和入队的性能. LinkedTransferQueue的代码如下

private transient final PaddedAtomicReference<QNode> head;
private transient final PaddedAtomicReference<QNode> tail;

static final class PaddedAtomicReference<T> extends AtomicReference<T> {
    Object p0, p1, p2, p3, p4, p5, p6, p7, p8, p9, pa, pb, pc, pd, pe;
    PaddedAtomicReference(T r) {
        super(r);
    }
}

public class AtomicReference<V> implements java.io.Serializable {
    private volatile V value;
    // 省略以下代码
}

为什么追加字节能优化性能? 先看看 LinkedTransferQueue 这个类, 它使用一个内部类类型定义了队列的头节点和尾节点, 而内部类 PaddedAtomicReference 相对于父类 AtomicReference 只做了一件事情, 就是将共享变量追加到64字节.

为什么追加到64字节能提高并发编程的效率? 因为对于三级缓存的缓存行为64字节宽的CPU而言, 如果队列的头节点和尾节点都不足64字节, 处理器会将它们都读到同一个缓存行中, 在多处理器下每个处理器都会缓存同样的头, 尾节点, 当一个处理器试图修改头节点时, 会把整个缓存行锁定, 在缓存一致性机制的作用下, 其他处理器就不能访问自己缓存行下的尾节点, 而队列的入队和出队需要不停修改头节点和尾节点, 在多处理器环境下将会严重影响到队列的入队和出队效率. 使用64字节填满高速缓存的缓存行, 避免头节点和尾节点都加载到同一个缓存行, 使头尾节点修改时不会相互锁定

是否在使用 volatile 变量时都需要追加到64字节?

并非如此, 在两种场景下不应该使用这种模式

  • 缓存行非64字节宽的处理器
  • 共享变量不会被频繁地写

synchronized 的实现原理和应用

synchronized实现同步的基础: Java中的每个对象都能作为锁

  • 对于普通同步方法, 锁是当前实例对象
  • 对于静态同步方法, 锁是当前类的 Class 对象
  • 对于同步方法块, 锁是 synchronized 括号中配置的对象

Java 对象头

synchronized用的锁是存在 Java 对象头的, 如果对象是数组类型, 则虚拟机用3个字宽存储对象头, 如果对象是非数组类型, 则用2字宽存储对象头. 在32位虚拟机中, 1字宽等于4字节, 即32bit

Java 对象头中的 Mark Word里默认存储对象的 HashCode, 分代年龄和锁标记位. 32位JVM的 Mark Word的默认存储结构如表所示

锁状态25bit4bit1bit是否是偏向锁2bit锁标志位
无锁状态对象的hashCode对象分代年龄001

在运行期间, Mark Word里存储的数据会随着锁标志位的变化而变化. Mark Word可能变化为以下 4 种数据

在这里插入图片描述

锁的升级与对比

在 JDK1.6 中, 锁一共有 4 种形态, 级别由低到高依次是: 无锁状态, 偏向锁状态, 轻量级锁状态, 重量级锁状态

锁可以升级但不能降级, 意味着偏向锁升级为轻量级锁之后不能再降级为偏向锁. 这种锁升级却不能降级的策略目的是为了提高获得锁和释放锁的效率

  1. 偏向锁

当一个线程访问同步块并获得锁时, 会在对象头和栈帧的锁记录中存储锁偏向的线程ID, 以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁, 只需要简单地测试对象头的Mark Word中是否存储了指向当前线程的偏向锁. 如果测试成功, 表示线程已经获得了锁, 如果测试失败, 则需要再测试一下Mark Word中偏向锁的标识是否设置为1: 如果没有设置, 则使用CAS竞争锁, 如果设置了, 则尝试使用CAS将对象头的偏向锁指向当前线程

(1) 偏向锁的撤销

只有当其他线程试图竞争偏向锁时, 持有偏向锁的线程才会释放锁

偏向锁的撤销, 首先要暂停拥有偏向锁的线程, 然后检查持有偏向锁的线程是否活着, 如果线程处于不活动状态, 则将对象头设置成无锁状态; 如果线程仍然或者, 拥有偏向锁的栈会被执行, 遍历偏向对象的锁记录, 栈中的锁记录和对象头的 Mark Word 要么重新偏向于其他线程, 要么恢复到无锁或者标记对象不适合作为偏向锁, 最后唤醒暂停的线程

(2) 关闭偏向锁

Java6 和 Java7 默认启用了偏向锁, 关闭可以使用参数 -XX:BiasedLockingStartupDelay=0

  1. 轻量级锁

(1) 轻量级锁加锁

线程在执行同步代码块之前, JVM会在当前线程的栈帧中创建用于存储锁记录的空间, 并将对象头中的 Mark Word复制到锁记录中. 然后线程尝试使用 CAS 将对象头中的 Mark Word 替换为指向锁记录的指针, 如果成功, 当前线程获得锁, 如果失败, 表示其他线程竞争锁, 当前线程就会通过自旋来获得锁

(2) 轻量级锁解锁

轻量级锁解锁时, 会使用原子的 CAS 操作将 Displaced Mark Word 替换回到对象头, 如果成功, 则表示没有竞争发生, 如果失败, 则表示锁存在竞争, 锁会膨胀为重量级锁

因为自旋会消耗CPU, 为了避免无用的自旋, 当锁升级到重量级锁之后, 就不会再恢复到轻量级锁状态了. 其他线程试图获取这个锁时都会被阻塞

  1. 锁的优缺点对比
优点缺点适用场景
偏向锁加锁和解锁不需要额外的消耗, 和执行非同步方法相比仅存在纳秒级的差距如果线程间存在锁竞争, 会带来额外的锁撤销的消耗适用于只有一个线程访问同步块场景
轻量级锁竞争的线程不会阻塞, 提高了程序的响应速度如果始终得不到锁竞争的线程, 使用自旋会消耗CPU追求响应时间, 同步块执行速度非常快
重量级锁线程竞争不会使用自旋, 不消耗CPU线程阻塞, 响应时间缓慢追求吞吐量, 同步块执行实际长

原子操作的实现原理

原子操作意为 “不可被中断的一个或一系列操作”

在 Java 中 通过 CAS循环 的方式实现原子操作

(1) 使用 CAS循环 实现原子操作

自旋CAS实现基本思路就是循环进行CAS操作直到成功为止

使用CAS实现原子操作会带来三大问题: ABA问题 , 循环时间长开销大 , 只能保证一个共享变量的原子操作

  1. ABA问题

因为 CAS需要在操作值的时候, 检查值是否变化, 如果没有变化就更新, 但是如果一个值原来是 A, 变成了B, 又变回了A, 那么使用CAS进行检查时就会发现值没有变化, 但实际上已经发生过变化了. ABA问题的解决方案是使用版本号, 每次变量更新就把版本号加1.

  1. 循环时间长开销大

自旋CAS如果长时间不成功, 会给CPU带来非常大的执行开销. 如果JVM能支持处理器提供的pause指令, 那么效率会有一定的提升

  1. 只能保证一个共享变量的原子操作

当对一个共享变量执行操作时, 我们可以使用循环CAS的方式来保证原子操作, 但是对多个共享变量进行操作时, 循环CAS就无法保证操作的原子性, 这时候就可以用锁

(2) 使用锁机制实现原子操作

锁机制保证了只有获得锁的线程才能操作锁定的内存区域. JVM内部实现了很多锁, 有偏向锁, 轻量级锁和互斥锁, 但是除了偏向锁, 其他实现锁的方式都使用了循环CAS: 当一个线程想进入同步块时使用循环CAS来获取锁, 当它想退出同步块使用循环CAS释放锁

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1598740.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

面试算法-173-二叉树的直径

题目 给你一棵二叉树的根节点&#xff0c;返回该树的 直径 。 二叉树的 直径 是指树中任意两个节点之间最长路径的 长度 。这条路径可能经过也可能不经过根节点 root 。 两节点之间路径的 长度 由它们之间边数表示。 示例 1&#xff1a; 输入&#xff1a;root [1,2,3,4,…

linux的线程概念

目录 1.原理 2.线程的周边概念 3.创建线程的接口 1.pthread_create 2.pthread_join 3.pthread_detach 4.终止线程 5.C11封装的多线程库 4.线程库的大概结构 5.__thread&#xff08;只能修饰内置类型&#xff09; 6.线程的互斥 1.了解原理 2.加锁 1.接口 2.代码示…

护网 | 如何从蓝队初级进化到蓝队中级

了解应急响应的流程 1&#xff09;首先判断服务器资产、影响范围以及严重程度&#xff0c;确认有没有必要将服务器下线隔离&#xff0c;然后根据服务器的失陷时间和态势感知的告警&#xff0c;判断是由什么漏洞进来的 2&#xff09;其次就是取证排查阶段&#xff0c;如果是w…

get_program_dir() Ai回答是一个函数,用于获取当前程序.exe的目录。

#include <iostream> #include <filesystem>std::string get_program_dir() {return std::filesystem::current_path().string(); }int main() {// 调用函数获取当前程序的目录std::string program_dir get_program_dir();std::cout << "当前程序的目录…

认识一下RAG

1.RAG技术背景与挑战 2.RAG的核心概念 3.RAG的工作流程与架构 4.RAG的优化方法 RAG的提出 •Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks是一篇重要的论文(2020年5月) •REALM: Retrieval-Augmented Language Model Pre-Training (2020)就将BERT预训练模…

Go微服务: 服务限流原理, 负载均衡与API网关

微服务里面的限流 (uber/limit)概述 go 微服务保稳三剑客: 熔断&#xff0c;限流&#xff0c;负载均衡限流的作用 限制流量&#xff0c;在服务端生效 注意&#xff1a;熔断是客户端生效 保护后端服务 餐厅吃饭排队的问题&#xff0c;提供凳子&#xff0c;让等候&#xff0c;这就…

创建k8s deploy yaml文件的imagePullSecrets语句

镜像仓库是harbor kubectl create secret docker-registry key --docker-server192.168.0.190 --docker-usernameadmin --docker-passwordHarbor12345

【网络安全入门】什么是网络安全?

如今&#xff0c;组织的信息系统和数据面临着许多威胁。而人们了解网络安全的所有基本要素是应对这些威胁的第一步。 网络安全是确保信息完整性、机密性和可用性(ICA)的做法。它代表了应对硬盘故障、断电事故&#xff0c;以及来自黑客或竞争对手攻击等防御和恢复能力。而后者包…

解析数据科学,探索ChatGPT背后的奥秘

在当今这个由数据驱动和AI蓬勃发展的时代&#xff0c;数据科学作为一门融合多种学科的综合性领域&#xff0c;对于推动各行各业实现数字化转型升级起着至关重要的作用。近年来&#xff0c;大语言模型技术发展态势强劲&#xff0c;为数据科学的进步做出了巨大贡献。其中&#xf…

如何保护企业邮箱数据安全?看这里

在数字化时代&#xff0c;电子邮件已成为日常生活和商务交流的重要工具。然而&#xff0c;随着网络威胁的日益严峻&#xff0c;确保电子邮件通信的安全性至关重要。在此背景下&#xff0c;电子邮件SSL证书&#xff08;Secure Sockets Layer Certificate&#xff09;作为一项关键…

面试算法-175-将有序数组转换为二叉搜索树

题目 给你一个整数数组 nums &#xff0c;其中元素已经按 升序 排列&#xff0c;请你将其转换为一棵 平衡 二叉搜索树。 示例 1&#xff1a; 输入&#xff1a;nums [-10,-3,0,5,9] 输出&#xff1a;[0,-3,9,-10,null,5] 解释&#xff1a;[0,-10,5,null,-3,null,9] 也将被视…

架构设计-灰度发布系统架构设计

灰度发布的定义 互联网产品需要快速迭代开发上线&#xff0c;又要保证质量&#xff0c;保证刚上线的系统&#xff0c;一旦出现问题可以很快控制影响面&#xff0c;就需要设计一套灰度发布系统。 灰度发布系统的作用&#xff0c;可以根据配置&#xff0c;将用户的流量导到新上…

vue webpack打包配置生成的源映射文件不包含源代码内容、加密混淆压缩

前言&#xff1a;此案例使用的是vue-cli5 一、webpack源码泄露造成的安全问题 我们在打包后部署到服务器上时&#xff0c;能直接在webpack文件下看到我们项目源码&#xff0c;代码检测出来是不安全的。如下两种配置解决方案&#xff1a; 1、直接在项目的vue.config.js文件中加…

微信预约怎么做_体验便捷的服务

在这个快节奏的时代&#xff0c;时间显得格外珍贵。无论是工作还是生活&#xff0c;我们都渴望能够用最短的时间完成更多的事情。在这样的背景下&#xff0c;微信预约应运而生&#xff0c;成为我们追求高效、便捷生活的新宠。今天&#xff0c;就让我们一起探讨微信预约的魅力&a…

40.原子累加器

java8之后&#xff0c;新增了专门用于计数的类&#xff0c;LongAccumulator,LongAdder的性能高于AtomicLong。 LongAdder 性能 > AtomicLong 性能 性能高的原因&#xff1a;如果都往一个共享变量上面进行累加&#xff0c;那么比较重试的次数肯定就多&#xff1b;如果分成几…

欧拉函数(模板题)

给定 n 个正整数 ai&#xff0c;请你求出每个数的欧拉函数。 欧拉函数的定义 输入格式 第一行包含整数 n。 接下来 n 行&#xff0c;每行包含一个正整数 ai。 输出格式 输出共 n 行&#xff0c;每行输出一个正整数 ai 的欧拉函数。 数据范围 1≤n≤100, 1≤ai≤2109 输…

云仓酒庄培训人数破大世界基尼斯纪录,社会影响力持续发酵

近日&#xff0c;云仓酒庄举办的《综合品酒师》培训活动圆满落幕&#xff0c;其参与人数之众&#xff0c;规模之大&#xff0c;成功刷新了大世界基尼斯纪录&#xff0c;引发了社会各界的广泛关注与热烈讨论。这一事件不仅彰显了云仓酒庄在酒类培训领域的专业化与系统化&#xf…

探索C# 11与.NET 7:入门指南与跨平台开发

&#x1f482; 个人网站:【 摸鱼游戏】【神级代码资源网站】【工具大全】&#x1f91f; 一站式轻松构建小程序、Web网站、移动应用&#xff1a;&#x1f449;注册地址&#x1f91f; 基于Web端打造的&#xff1a;&#x1f449;轻量化工具创作平台&#x1f485; 想寻找共同学习交…

为什么那么多人喜欢Python?学习Python能为我们带来哪些优势?

Python是现在最火的编程语言&#xff0c;没有之一。那么&#xff0c;相对于其他语言&#xff0c;为什么那么多人喜欢Python&#xff1f;学习Python能为我们带来哪些优势&#xff1f;今天&#xff0c;小编就来和大家探讨一下&#xff01; 1、如果想成为一名程序员的话&#xff…

博将资本荣获杭州市清廉民营企业建设示范单位

2024年3月25日&#xff0c;杭州召开全市清廉民营企业建设现场推进会&#xff0c;引导广大民营企业家努力把清廉民企建设成效转化企业发展的强劲动力&#xff0c;形成杭州民营经济领域风清气正的良好生态。省纪委、省委统战部、省工商联相关领导&#xff0c;市直16家相关单位分管…