认识volatile
volatile关键字的作用有两个:变量修改对其他线程立即可见、禁止指令重排。
第二个作用我们后面再讲,先主要讲一下第一个作用。通俗点来说,就是我在一个线程对一个变量进行了修改,那么其他线程马上就可以知道我修改了他。嗯?难道我修改了数值其他线程不知道?我们先从实例代码中来感受volatile关键字的第一个作用。
private static boolean flag = false;
public static void main(String[] args) throws InterruptedException {
new Thread(() -> {
while (!flag) {
}
System.out.println("Flag is now true!");
}).start();
Thread.sleep(1000);
flag = true;
System.out.println("Flag is set to true!");
}
结果:
在没有volatile关键字的时候只展示了主线程中flag改变的值并输出结果,子线程并没有打印任何信息,说明主线程的改变不会对子线程有影响,他们之间是不可见的
现在我们加上volatile关键字:
private static volatile boolean flag = false;
结果:
现在主线程的改变子线程也是可以看到flag的变化了,说明volatile让两个线程彼此可见了,同时也是有顺序的,这就是volatile关键字的第一个重要作用:变量修改对其他线程立即可见。关于指令重排我们后面再讲。
那么为什么变量的修改是对其他线程不是立即可见呢?volatile为何能实现这个效果?那这样我们可不可以每个变量都给他加上volatile关键字修饰?要解决这些问题,我们得先从Java内存模型说起。系好安全带,我们的车准备开进底层原理了。
Java内存模型
JVM把内存总体分为两个部分:线程私有以及线程共享,线程共享区域也称为主内存。线程私有部分不会发生并发问题,所以主要是关注线程共享区域。这个图大致上可以这么理解:
- 所有共享变量存储在主内存
- 每条线程拥有自己的工作内存
- 工作内存保留了被该线程使用的变量的主内存副本
- 变量操作必须在工作内存进行
- 不同线程之间无法访问对方的工作内存
简单总结一下,所有数据都要放在主内存中,线程要操作这些数据必须要先拷贝到自己的工作内存,然后只能对自己工作内存中的数据进行修改;修改完成之后,再写回主内存。线程无法访问另一个线程的数据,这也就是为什么线程私有的数据不存在并发问题。
那为什么不直接从主内存修改数据,而要先在工作内存修改后再写回主内存呢?这就涉及到了高速缓冲区的设计。简单来说,处理器的速度非常快,但是执行的过程中需要频繁在内存中读写数据,而内存访问的速度远远跟不上cpu的速度,导致降低了cpu的效率。因而设计出高速缓冲区,处理器可以直接操作高速缓冲区的数据,等到空闲时间,再把数据写回主内存,提高了性能。而JVM为了屏蔽不同的平台对于高速缓冲区的设计,就设计出了Java内存模型,来让开发者可以面向统一的内存模型进行编程。可以看到,这里的工作内存就对应硬件层面的高速缓冲区。
指令重排
前面我们一直没讲指令重排,是因为这是属于JVM在后端编译阶段进行的优化,而在代码中隐藏的问题很难去复现,也很难通过代码执行来看出差别。指令重排是即时编译器对于字节码编译过程中的一种优化,受到运行时环境的影响。限于能力,笔者只能通过理论分析来讲这个问题。
我们知道JVM执行字节码一般有两种方式:解释器执行和即时编译器执行。解释器这个比较容易理解,就是一行行代码解释执行,所以也不存在指令重排的问题。但是解释执行存在很大的问题:解释代码需要耗费一定的处理时间、无法对编译结果进行优化,所以解释执行一般在应用刚启动时或者即时编译遇到异常才使用解释执行。而即时编译则是在运行过程中,把热点代码先编译成机器码,等到运行到该代码的时候就可以直接执行机器码,不需要进行解释,提高了性能。而在编译过程中,我们可以对编译后的机器码进行优化,只要保证运行结果一致,我们可以按照计算机世界的特性对机器码进行优化,如方法内联、公共子表达式消除等等,指令重排就是其中一种。
计算机的思维跟我们人的思维是不一样的,我们按照面向对象的思维来编程,但计算机却必须按照“面向过程”的思维来执行。所以,在不影响执行结果的情况下,JVM会更改代码的执行顺序。注意,这里的不影响执行结果,是指在当前线程下。如我们可能会在一个线程中初始化一个组件,等到初始化完成则设置标志位为true,然后其他线程只需要监听该标志位即可监听初始化是否完成,如下:
// 初始化操作
isFinish = true;
在当前线程看起来,注意,是看起来,会先执行初始化操作,再执行赋值操作,因为结果是符合预期的。但是!!!在其他线程看来,这整个执行顺序都是乱的。JVM可能先执行isFinish
赋值操作,再执行初始化操作;而如果你在别的线程监听isFinish
变化,就可能出现还未初始化完成isFinish
却是true的问题。而volatile可以禁止指令重排,保证在isFinish
被赋值之前,所有的初始化动作都已经完成。
volatile的具体定义
上面讲了两个看起来跟我们的主角volatile关系不大的知识点,但其实是非常重要的知识点。
首先,通过Java内存模型的理解,现在知道为什么会出现线程对变量的修改其他线程未立即可知的原因了吧?线程修改变量之后,可能并不会立即写回主内存,而其他线程,在主内存数据更新后,也并不会立即去主内存获取最新的数据。这也是问题所在。
被volatile关键字修饰的变量规定:每次使用数据都必须去主内存中获取;每次修改完数据都必须马上同步到主内存。这样就实现了每个线程都可以立即收到该变量的修改信息。不会出现读取脏数据旧数据的情况。
第二个作用是禁止指令重排。这里是使用到了JVM的一个规定:同步内存操作前的所有操作必须已经完成。而我们知道每次给volatile赋值的时候,他会同步到主内存中。所以,在同步之前,保证所有操作都必须完成了。所以当其他线程监测到变量的变化时,赋值前的操作就肯定都已经完成了。
既然volatile关键字这么好,那可不可以每个地方都使用好了?当然不行!在前面讲Java内存模型的时候有提到,为了提高cpu效率,才分出了高速缓冲区。如果一个变量并不需要保证线程安全,那么频繁地写入和读取内存,是很大的性能消耗。因而,只有必须使用volatile的地方,才使用他。
volatile修饰的变量一定是线程安全吗
首先明确一下,怎么样才算是线程安全?
- 一个操作要符合原子性,要么不执行,要么一次性执行完成,在执行过程中不会受其他操作的影响。
- 对于变量的修改相对于其他线程必须立即可见。
- 代码的执行在其他线程看来要满足有序性。
从上面分析我们讲了:代码的有序性、修改的可见性,但是,缺少了原子性。在JVM中,在主内存进行读写都是满足原子性的,这是JVM保证的原子性,那么volatile岂不是线程安全的?并不是。
JVM的计算过程并不是原子性的。我们举个例子,看一下代码:
public class VolatileDemo {
private volatile int counter = 0;
public void increment() {
counter++;
}
public int getCounter() {
return counter;
}
public static void main(String[] args) throws InterruptedException {
VolatileDemo demo = new VolatileDemo();
Thread t1 = new Thread(() -> {
for (int i = 0; i < 1000000; i++) {
demo.increment();
}
});
Thread t2 = new Thread(() -> {
for (int i = 0; i < 1000000; i++) {
demo.increment();
}
});
t1.start();
t2.start();
t1.join();
t2.join();
System.out.println("Counter: " + demo.getCounter());
}
}
结果应该是2000000才对,让我们看下结果:
结果竟然不对?
这是因为:volatile仅仅只是保证了修改后的数据对其他线程立即可见,但是并不保证运算的过程的原子性。
这里的counter++
在编译之后是分为三步:1.在工作区中取出变量数据到处理器 2.对处理器中的数据进行加一操作 3.把数据写回工作内存。如果,在变量数据取到处理器运算的过程中,变量已经被修改了,所以这时候进行自增操作得到的结果就是错误的。举个例子:
变量a=5
,当前线程取5到处理器,这时a
被其他线程改成了8,但是处理器继续工作,把5自增得到6,然后把6写回主内存,覆盖数据8,从而导致了错误。因此,由于Java运算的非原子性,volatile并不是绝对线程安全。
那什么时候他是安全的:
- 计算的结果不依赖原来的状态。
- 不需要与其他的状态变量共同参与不变约束。
通俗点来讲,就是运算不需要依赖于任何状态的运算。因为依赖的状态,可能在运算的过程中就已经发生了变化了,而处理器并不知道。如果涉及到需要依赖状态的运算,则必须使用其他的线程安全方案,如加锁,来保证操作的原子性。
示例:
适用场景
状态标志/多线程通知
状态标志是很适合使用volatile关键字,正如我们在第一部分举的例子,通过设置标志来通知其他所有的线程执行逻辑。或者是如上一部分的例子,当初始化完成之后设置一个标志通知其他线程。
而更加常用的一个类似场景是线程通知。我们可以设置一个变量,然后多个线程观察他。这样只需要在一个线程更改这个数值,那么其他的观察这个变量的线程均可以收到通知。非常轻量级、逻辑也更加简单。
保证初始化完整:双重锁检查问题
单例模式是我们经常使用的,其中一种比较常见的写法就是双重锁检查,如下:
public class JavaClass {
// 静态内部变量
private static JavaClass javaClass;
// 构造器私有
private JavaClass(){}
public static JavaClass getInstance(){
// 第一重判空
if (javaClass==null){
// 加锁,第二重判空
synchronized(JavaClass.class){
if (javaClass==null){
javaClass = new JavaClass();
}
}
}
return javaClass;
}
}
这种代码很熟悉,对吧,具体的设计逻辑我就不展开了。那么这样的代码是否绝对是线程安全的呢?并不是的,在某些极端情况下,仍然会出现问题。而问题就出在javaClass = new JavaClass();
这句代码上。
新建对象并不是一个原子操作,他主要有三个子操作:
- 分配内存空间
- 初始化Singleton实例
- 赋值 instance 实例引用
正常情况下,也是按照这个顺序执行。但是JVM是会进行指令重排优化的。就可能变成:
- 分配内存空间
- 赋值 instance 实例引用
- 初始化Singleton实例
赋值引用在初始化之前,那么外部拿到的引用,可能就是一个未完全初始化的对象,这样就造成问题了。所以这里可以给单例对象进行volatile修饰,限制指令重排,就不会出现这种情况了。当然,关于单例模式,更加建议的写法还是利用类加载来保证全局单例以及线程安全,当然,前提是你要保证只有一个类加载器。限于篇幅这里就不展开了。
总结:
适用volatile的场景一般是初始化标志
不使用volatile的场景涉及指令重排,多线程操作数字累加