计算机硬件存储系统
- 因为有多级的缓存(CPU 和 物理主内存的速度不一致的), CPU 的运行并不是直接操作内存耳饰先把内存里边的数据读到缓存,而内存的读和写操作的时候就会造成不一致的问题
- JVM 规范中试图定义一种 Java 内存模型(Java Memory Model, 简称 JMM) 来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让 Java 程序在各种平台下都能达到一致的内存访问效果
Java 内存模型 JMM
JMM 本身是一种抽象的概念并不真实存在它仅仅描述的是一组约定或规范,通过这组规范定义了程序中(尤其是多线程) 各个变量的读写访问方式并决定一个线程对共享变量的写入何时以及如何变化成对另一个线程可见,关键技术点都是围绕多线程的原子性、可见性和有序性展开的
可见性:
- 当一个线程修改了某个共享变量的值,其他线程是否能够立即直到该变更,JMM规定了所有的变量都存储在主内存中。
- 系统主内存共享变量数据修改被写入的时机是不确定的,多线程并发下很可能出现"脏读",所以每个线程都有自己的工作内存,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取、赋值等) 都必须在线程自己的工作内存中进行,而不能够直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成、
原子性:
- 指一个操作是不可打断的,即多线程环境下,操作不能被其他线程干扰
有序性:
- 对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。但为了提升性能,编译器和处理器通常会对指令序列进行重新排列。Java 规范规定 JVM 线程内部维持顺序化语义,即只要程序的最终结果与它顺序化执行的结果相等,那么指令的执行顺序可以与代码顺序不一致,此过程叫指令的重排序
- JVM 能根据处理器特性( CPU 多级缓存系统、多核处理器等) 适当的对机器指令进行重排序,使机器指令能更符合 CPU 的执行特性,最大限度的发挥极其性能,但是指令重排 可以保证串行语义一致,但没有义务保证多线程间的语义也一致(有可能产生 “脏读”)
- 单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致
- 处理器在进行重排序时必须考虑指令之间的数据依赖性
- 多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测
多线程对变量的读写过程:
- 由于 JVM 运行程序的实体是线程,而每个线程创建 JVM 都会为其创建一个工作内存(有些地方称为栈空间),工作内存是每个线程的私有数据区域,而 Java 内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存中存储着主内存中变量副本拷贝,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成
JMM 定义了线程和主内存之间的抽象关系:
- 线程之间的共享变量存储在主内存中(从硬件角度来说就是内存条)
- 每个线程都有一个私有的本地工作内存,本地工作内存中存储了该线程用来 读/写 共享变量的副本(从硬件角度来说就是 CPU 的缓存, 比如寄存器、L1、L2、L3 缓存等)
多线程先行发生原则 happens-before:
- 它是判断数据是否存在竞争,线程是否安全的非常有用的手段。依赖这个原则,我们可以通过几条简单规则一揽子解决并发环境下两个操作之间是否可能存在冲突的所有问题,而不是陷入 Java 内存模型苦涩难懂的底层编译原理之中。
- 如果一个操作 happens-before另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前
- 两个操作之间存在 happens-before 关系,并不意味着一定要按照 happens-before 原则指定的顺序来执行。如果重排序之后的执行结果与按照 happens-before 关系来执行的结果一致,那么这种重排序并不非法。
次序原则:
- 一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作(前一个操作的结果可以被后续的操作获取)
锁定原则:
- 一个 unLock 操作 先行发生于后面 对同一个锁的 lock 操作
volatile 变量规则:
- 对于一个 volatile 变量的写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的(后面 同样是指时间上的先后)
传递规则:
- 如果操作 A 先于发生于操作 B,而操作B 又先行发生于 操作C,则可以得出操作 A 先行发生于 操作C
线程启动规则(Thread Start Rule):
- Thread 对象的 start() 方法先行发生于此线程的每个动作
线程中断规则(Thread Interruption Rule):
- 对线程 interrupt() 方法的调用先行发生于被中断线程的检测到中断事件的发生
- 可以通过 Thread.interrupted() 检测到是否发生中断
- 也就是说你要先调用 interrupt() 方法设置中断标志位,我才能检测到中断发生
线程终止规则(Thread Termination Rule):
- 线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过 isAlive() 等手段检测线程是否已经终止执行
对象终结规则(Finalizer Rule):
- 一个对象的初始化完成(构造函数执行结束) 先行发生于它的 finalize() 方法的开始
- 对象没有初始化之前,是不能调用 finalized() 方法的