理解Java关键字volatile

news2024/10/7 20:28:44

原文链接 理解Java关键字volatile

在Java中,关键字volatile是除同步锁以外,另一个同步机制,它使用起来比锁要简单方便,但是却很容易被忽略,或者被误用。这篇文章就来详细讲解一下volatile它的作用,它的原理以及如何正确的使用它。

volatile的定义

这个引用JSR中的定义:

The Java programming language allows threads to access shared variables (§17.1). As a rule, to ensure that shared variables are consistently and reliably updated, a thread should ensure that it has exclusive use of such variables by obtaining a lock that, conventionally, enforces mutual exclusion for those shared variables.

The Java programming language provides a second mechanism, volatile fields, that is more convenient than locking for some purposes.

A field may be declared volatile, in which case the Java Memory Model ensures that all threads see a consistent value for the variable (§17.4).

简单的翻译一下:

Java编程语言中允许线程访问共享变量。为了确保共享变量能被一致地和可靠的更新,线程必须确保它是排他性的使用此共享变量,通常都是获得对这些共享变量强制排他性的同步锁。

Java编程语言提供了另一种机制,volatile域变量,对于某些场景的使用这要更加的方便。

可以把变量声明为volatile,以让Java内存模型来保证所有线程都能看到这个变量的同一个值。

volatile的作用

  • 保证变量的可见性

    volatile关键字的作用就是保证共享变量的可见性。什么是可见性呢,就是一个线程读变量,总是能读到它在内存中的最新的值,也就是说不同的线程看到的一个变量的值是相同的。CPU都是有行缓存的,volatile能让行缓存无效,因此能读到内存中最新的值。

  • 保证赋值操作的原子性

    原子性就是不能被线程调度打断的操作,是线程安全的操作,对于原子性操作,即使在多线程环境下,也不用担心线程安全问题或者数据不一致的问题。有些变量的赋值本身就是原子性的,比如对boolean,对int的赋值,但是像对于long或者double则不一定,如果是32位的处理器,对于64位的变量的操作可能会被分解成为二个步骤:高32位和低32位,由此可能会发生线程切换,从而导致线程不安全。如果变量声明为volatile,那么虚拟机会保证赋值是原子的,是不可被打断的。

  • 禁止指令重排

    正常情况下,虚拟机会对指令进行重排,当然是在不影响程序结果的正确性的前提下。volatile能够在一定程度上禁止虚拟机进行指令重排。还有就是对于volatile变量的写操作,保证是在读操作之前完成,假设线程A来读变量,刚好线程B正在写变量,那么虚拟机会保证写在读之前完成。
    比如:

private volatile boolean flag;
	
public void setFlag(boolean flag) {
	this.flag = flag;
}
	
public void getFlag() {
	return flag;
}

假设线程A来调用setFlag(true),线程B同时来调用getFlag,对于一般的变量,是无法保证B能读到A设置的值的,因为它们执行的顺序是未知的。但是像上面,加上volatile修饰以后,虚拟机会保证,线程A的写操作在线程B的读操作之前完成,换句话,B能读到最新的值。当然了,用锁机制也能达到同样的效果,比如在方法前面都加上synchronized关键字,但是性能会远不如使用volatile。

volatile的典型使用场景

多线程情况下的标志位

基于它的作用,不难找到使用它的理想场景:

  • 读操作,多于写操作
  • 写操作,不依赖于变量的当前值,也就是说要是纯赋值操作
  • 只需要读取的值,不需要等待某一特定的值

比如,有一个检查新版本的按扭,点击时会发起去检查新版本,因为检查新版本涉及网络请求,可能会比较耗时,所以需要放在单独的线程中去做。为了避免多次同时触发检查请求,做一个限制:上一个请求没有完成时,再次点击无效。这时就可以用volatile来做个标志位,伪代码如下:

private volatile boolean checkUpdateFinished = true;

public void onCheckUpdate(View view) {
    if (!checkUpdateFinished) {
        return;
    }
    checkUpdate();
}

private void checkUpdate() {
    checkUpdateFinished = false;
    new Thread(new Runnable() {
    	@Override
    	public void run() {
    	    doCheckUpdate();
    	    checkUpdateFinished = true;
    	}
    }).start();
}

CAS无锁同步的变量声明

CAS(Compare And Swap)是一种无锁同步的算法,它涉及变量的3个值,当前值,旧的期望值以及新的期望值,它的原理是当且仅当当前值与旧的期望值一致时,才把新值赋给变量,否则什么都不做:

private volatile int a;

do {
   old = 3;
   expected = 5;
} while (compareAndSwap(a, 3, 5);

boolean compareAndSwap(int a, int old, int expected) {
	if (a == old) {
		a = expected;
		return true;
	}
	return false;
}

当然,具体的compare and swap不是这么实现的,实际是要直接使用处理的指令CMPXCHG(Compare and Exchange)来做具体的CAS。
为了保证可见性,CAS中的变量必须都用volatile来修饰。

volatile的内存原理

知道了volatile有什么用,怎么用以后,可以了解的更深一点,以加深理解。但要搞懂,就必须先要搞懂它的背景以及背景的背景:

并发的基本概念

  • 原子性

    一个或者多个操作(赋值也好,运算也好)不能被线程调度打断,要么一次性执行完,要么就不执行。

  • 可见性

    现代处理器是多核心的,或者多CPU的,但是主存(通常意义上的操作系统内存,或者物理内存)却是在CPU之间共享的。多核心处理的优势在于,从机器级别支持多线程并发,而且为了弥补主存与CPU核心之间的速度差异,便有了CPU核心缓存,因此,每个CPU核心(或者说每个线程)是有独立的内存的。这样就带来了可见性的问题,同一个变量c,A线程操作的是c在A线程的缓存中的值,B操作的是c在B的缓存中值,也就是说最新的变量的值对于其他线程是不可见的,这就有了可见性的问题。

  • 有序性

    对于单线程来说,程序的执行顺序就是按照代码的书写顺序,从上到下,从左到右(分号分隔写在同一行时)。但是多线程情况就不一定了,线程调度器随时可能打断某一程,执行其他线程。这就导致了,程序并不是按照预期的顺序执行的,导致结果跟预期不一致。
    注意:这里的顺序,并不是严格的指令执行的顺序,而且从结果正确性的角度来看的,比如:

  int a = 10;
  int b = a + 1;

这段代码的有序性的意思是:当执行到第二条语句,只要a的值是10就可以了,至于a = 10它究竟是否是在下面语句前执行,并不关心。但是,除了a = 10语句外,没有其他的方式能让a变成10,所以,肯定是执行了语句了才能把a变成10。说起来比较绕,这个例子也过于简单。但是可以这么简单的理解为:单线程情况下,程序是按书写的顺序来执行的,更准确的说法是程序员预期的顺序来执行的。但多线程会打破这种有序性。

注意:这里我们不考虑ABA问题。

对内存模型的理解

什么是内存模型呢?就是程序运行起来时,内存里面的样子。程序包括变量,对象,数据,指令等,程序动起来后又包括变量如何赋值,数据如何读取,指令按什么顺序执行等。其实,程序运行时,内存是什么样子,通常取决于操作系统,也就是说是由操作系统决定的。Java是跨平台的语言,其靠着“Compile once, run anywhere"的大旗,拮杆而起,打下一片天下,如今稳坐头把交椅。那么,想要跨平台,它就要屏蔽各个操作系统平台和硬件平台的差异,因此它有虚拟机,虚拟机实质是一对操作系统的一个抽象,把差异进行屏蔽,从而对语言本身来说,所有操作系统就都是一样的了。内存模型,也就是虚拟机对运行时的一些约定,或者叫做强制规定,比如变量的操作,数据的读取,指令执行顺序等。都做了哪些规定呢?我们分别来说:

  • 线程模型

因为Java天生支持多线程,所以,虚拟机也必须要有线程模型,否则就无法屏蔽操作系统的差异。虚拟机规定,所有的变量都存储在主存中,也就是通常所指的内存,每个线程可以有自己的独立的工作内存,可以理解为每个CPU核心的缓存,线程对变量的操作都只能在自己的工作内存中,不能直接对主存操作,也不能访问其他线程的工作内存。
  • 原子性操作

    虚拟机保证对基本的基本数据类型的赋值是原子的,比如int,boolean和float。但是像long和double不一定,这取决于CPU的字长,32位下,long和double的赋值不是原子的,因为需要二个指令;而64位CPU则一个指令搞定。

    如何保证原子性呢?方式一是上面提过的用volatile,另外就是用同步锁机制。

  • 可见性

    前面说到每个CPU可以有自己的工作内存,因此,当一个线程对某一变量操作后,其他线程是没有办法直接拿到最新变化的。

    如何保证可见性呢?方法一就是把变量用volatile修饰,另外就是用同步锁机制。

  • 指令重排与happens-before原则

    指令重排与happens-before原因,是不同的,也是不冲突的。正常情况下,也就是说单线程情况下,指令的执行顺序是按书写顺序从上到下,但不是严格的,虚拟机会在不影响程序结果正确性的前提下对指令进行重排,比如:

int a = 1;
int b = 2;
int c = 3;

这三个指令,哪个先执行,是不会影响程序结果的,这时指令可能重排;而再如:

int a = 1;
int b = a + 1;
int c = a + b;

这种情况下,是无法重排,不可能把第3句放到前面,那样会得不到正确的结果。

而happens-before是指在多线程情况下,虚拟机来保证某些操作的先后性,或者说前面的操作结果,对后面是可见的。比如上面的第二个例子,在多线程情况下,c = a + b是有可能在a, b赋值前执行的,这也恰 恰是我们需要小心解决的由多线程机制带来的问题。

虚拟机的默认支持的happens-before(先行发生)原则:

  • 程序次序规则:一个线程内,按照代码顺序,书写在前面的操作先行发生于书写在后面的操作
  • 锁定规则:一个unLock操作先行发生于后面对同一个锁额lock操作
  • volatile变量规则:对一个变量的写操作先行发生于后面对这个变量的读操作
  • 传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C
  • 线程启动规则:Thread对象的start()方法先行发生于此线程的每个一个动作
  • 线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生
  • 线程终结规则:线程中所有的操作都先行发生于线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值手段检测到线程已经终止执行
  • 对象终结规则:一个对象的初始化完成先行发生于他的finalize()方法的开始

很多规则显而易见的,或者想一下还是很容易想通的,重点解析一下第2, 3, 4条:

  • 锁定规则:一个unLock操作先行发生于后面对同一个锁额lock操作

    这里的意思是,同一个锁(lock),如果处于锁定状态,那么只能先释放锁,然后才能被再次锁定。这么一说就明白了,这是显而易见的,要不然锁不就失去它本身的作用了么。

    注意:这里有必要进一步说明一下,对于可重入锁,这里应该指的就是其他线程再次获得锁之前,锁必须被释放。因为对于可重入锁,锁的持有线程,是可以在不释放的前提下,继续获得锁的。

  • volatile变量规则:对一个变量的写操作先行发生于后面对这个变量的读操作

    这里其实有二层,一个是前面提过的,读volatile总是能读到最新的值,即使是写线程和读线程同时进行。因为,写操作会被更新到主存,读线程的工作内存会被置为无效,需要重新到主存去读,而读主存的地址,是要等待该地址更新后才能成功读取。

    另外,一个就是对于volatile上下文的变量的读写的影响,也就是说它为什么能禁止指令重排:volatile的准确可见性作用是,当一个线程写一个volatile变量时,写完成后会刷新工作内存到主存,这会把目前这个线程所做过修改的所有变量都刷新到主存。举个例子来说明:

int a;
int b;
volatile boolean flag;
			
void write() {
	a = 3;
	b = 4;
	flag = true;
}
			
void read() {
	print(a);
	print(b);
	print(flag);
}

如果线程A调用write(),线程B调用read(),那么B能读到a, b和flag的最新值(A所写的值)。

由此,可以引申出一个volatile的高级应用,可以当作同步锁:

private Object object = null;
private volatile hasNewObject = false;
    		
public void put(Object newObject) {
    while (hasNewObject) {
    	 //wait - do not overwrite existing new object
    }
    object = newObject;
    hasNewObject = true; //volatile write
}
			
public Object take() {
	while (!hasNewObject) { //volatile read
		//wait - don't take old object (or null)
	}
	Object obj = object;
	hasNewObject = false; //volatile write
	return obj;
}

因为写hasNewObject时会把object也刷新了,所以取对象的线程,可以在只要hasNewObject为true时就可以读到正确的值。

  • 传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生

这个就像某些运行符的传递性一样,具体传递性,从而使整个happens-before规则产生实际作用。

volatile的实现机制

计算机科学里面,为了解决复杂性,都会分层。正如一个名人所说:“计算机的任何问题都可以通过增加一个虚拟层来解决”(“All problems in computer science can be solved by another level of indirection”)。volatile虚拟机层引入的,解决语言层面的问题,那么它的实现,必然是靠下一层的支持,也就是需要汇编或者说处理器指令的支持来实现,volatile是靠内存屏障和MESI(缓存一致性协议)来达成的它的作用的。

内存屏障(Memory Barriers)是处理器提供的一组内存操作指令,它的作用是限制内存操作的顺序,也就是说内存屏障像一个栅栏一样,它前面的指令要在它后面的指令之前完成;还能强制把缓存写入到主存;再有的就是触发缓存一致性,就是当有写变量时,会把其他CPU核心的缓存变为无效。

总结

volatile是一个比较复杂的修饰符,想要使用它,就要完全理解它的作用,它能用来做什么,以及不能干什么。如果,不是很确定,要么弄懂,要么就不要使用。事实上,大多数情况下,标志变量,还是非常适合volatile的。

java.util.concurrent.*里面的高级线程安全数据结构像ConcurrentHashMap以及java.util.concurrent.atomic.*等的实现都用到了volatile。可以多看看这些类的实现,以加深对volatile的理解和运用。

参考资料

  • Java 理论与实践: 正确使用 Volatile 变量
  • Java并发编程:volatile关键字解析
  • 深入理解Java内存模型(四)——volatile
  • 聊聊并发(一)——深入分析Volatile的实现原理
  • Java Volatile Keyword
  • volatile (computer programming)
  • Java Memory Model

原创不易,打赏点赞在看收藏分享 总要有一个吧

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/587724.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【图像水印 2022 ACM】PIMoG

【图像水印 2022 ACM】PIMoG 论文题目:PIMoG: An Effective Screen-shooting Noise-Layer Simulation for Deep-Learning-Based Watermarking Network 中文题目:PIMoG:深度学习水印网络中一种有效的截屏噪声层仿真 论文链接:https://dl.acm.o…

Redis-- 缓存预热+缓存雪崩+缓存击穿+缓存穿透

Redis-- 缓存预热缓存雪崩缓存击穿缓存穿透**加粗样式** 一 面试题引入二 缓存预热三 缓存雪崩3.1 问题现象3.2 预防解决 四 缓存穿透4.1 定义4.2 解决方案4.2.1 空对象缓存或者缺省值4.2.2 Google布隆过滤器Guava解决缓存穿透 五 缓存击穿5.1 定义5.2 危害5.3 解决 六 总结 一…

Excel·VBA统计多部门多商品销售量前10%的商品

如图:根据表中唯一的货品ID,有m个事业部中分别有n种货品,统计各事业部销量前10%的货品名称,生成统计表(以下为2种统计方式) 目录 仅统计货品ID方法1:字典嵌套字典结果 方法2:自定义函…

【LED子系统】十、详细实现流程(番外篇)

个人主页:董哥聊技术 我是董哥,高级嵌入式软件开发工程师,从事嵌入式Linux驱动开发和系统开发,曾就职于世界500强公司! 创作理念:专注分享高质量嵌入式文章,让大家读有所得! 文章目录…

Hive ---- 文件格式和压缩

Hive ---- 文件格式和压缩 1. Hadoop压缩概述2. Hive文件格式1. Text File2. ORC3. Parquet3. 压缩1. Hive表数据进行压缩2. 计算过程中使用压缩 1. Hadoop压缩概述 为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器,如下表所示: Hadoo…

CodeForces..李华和迷宫.[简单].[找规律]

题目描述: 题目解读: 存在矩阵迷宫nm,(r,c)表示从顶部开始的第r行和左起第c列。 如果两单元格共享一个边,则是相邻的。路径是相邻空单元格的序列。 每个单元格初始状态都为空。对于从&#x…

代码随想录额外题目——图论部分

记录一下代码随想录中额外题目的图论部分 841.钥匙和房间 有 n 个房间,房间按从 0 到 n - 1 编号。最初,除 0 号房间外的其余所有房间都被锁住。你的目标是进入所有的房间。然而,你不能在没有获得钥匙的时候进入锁住的房间。 当你进入一个…

山海大模型亮相,云知声交出AGI第一份答卷

有人说,AI大模型是少数巨头才能玩得转的游戏。 截至目前,认同此观点的人不在少数。自从ChatGPT去年迅速火遍全球之后,忽如一夜春风来,AI大模型遍地开。Google、Amazon、阿里、百度等巨头们纷纷加入AI大模型的“军备竞赛”&#x…

【数据分享】1929-2022年全球站点的逐日平均气温数据(Shp\Excel\无需转发)

气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、湿度等指标,其中又以气温指标最为常用!说到气温数据,最详细的气温数据是具体到气象监测站点的气温数据!本次我们为大家带来的就是具体到气象监…

大数据分析案例-基于决策树算法构建世界杯比赛预测模型

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

EMC VNX Unified Storage 关机顺序方法

EMC Unfied的VNX存储系统要比单纯的Block系统复杂很多,相当于是两套存储系统,不管在物理硬件上还是逻辑的软件OS上,都复杂很多很多。 客户经常遇到由于机房停电或者机房搬迁等情况,需要对存储系统做关机下电甚至物理搬迁的动作&a…

FPGA基于AXI 1G/2.5G Ethernet Subsystem实现UDP通信DMA传输 提供工程源码和技术支持

目录 1、前言2、我这里已有的UDP方案3、详细设计方案传统UDP网络通信方案本方案详细设计说明DMA和BRAMAXIS-FIFOUDP模块设计UDP模块FIFOAXI 1G/2.5G Ethernet Subsystem:输出 4、vivado工程详解5、上板调试验证并演示注意事项 6、福利:工程代码的获取 1、…

【simple-cache】一款只用一个注解就实现缓存的框架-我们终于迎来了SpringBoot版本

上次我们讲了【simple-cache】的使用: 【simple-cache】我开发了一款只要一个注解就可以轻松实现缓存的框架 这次主要更新的内容为: 添加springboot项目框架中去除了redisconfig类,避免了redis的单机和集群问题用户可以自定义使用自己项目中…

Python之字符串(str)基础知识点

strip() 删除指定字符 当token为空时,默认删除空白符(含’\n’,‘\r’,‘\t’,’ ),当非空时,根据指定的token进行删除。 字符的删除又可分为以下几种情况: string.strip(token):删除string字符串中开头(left)、结尾处(right)的…

【操作系统】02.进程管理

多道程序系统 多道就是将多个程序同时装入内存,使之并发运行。操作系统也是基于多道产生的,提高了资源利用率和系统吞吐量。 进程 定义 进程是程序的一次执行 进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位 在引入线…

会流程图却不会UML活动图?活动图深度剖析,就怕你学不会!

1. UML活动图是啥? 也许很多人都不怎么了解活动图,但是却对流程图很熟悉,你暂且可以简单的把活动图理解为UML里的流程图,用来描述系统的行为特征。不过UML活动图对比于流程图来说也存在不少差异,本文将在第三章节讲解活…

解决 MobaXterm X11 server 打开 wsl2 linux 子系统 rviz 可视化窗口卡顿问题

1、问题 环境: MobaXtermwsl2 Ubuntu-18.04ROS1Intel 核显 一直使用 MobaXterm 这个远程软件 ssh 链接 linux 服务器,因为它集成了 X11 server,即可以显示一些 linux 下有图形化界面的程序,如 ROS 的 rviz 等。 但是 MobaXterm…

宝塔面板一键部署Z-Blog博客 - 内网穿透实现公网访问

文章目录 1.前言2.网站搭建2.1. 网页下载和安装2.2.网页测试2.3.cpolar的安装和注册 3.本地网页发布3.1.Cpolar临时数据隧道3.2.Cpolar稳定隧道(云端设置)3.3.Cpolar稳定隧道(本地设置) 4.公网访问测试5.结语 转发自cpolar极点云的…

一步一步的实现使用 Tensorflow Hub 进行图像分割

在本文中,我们将学习如何使用 TensorFlow Hub中提供的预训练模型执行语义图像分割。TensorFlow Hub 是一个库和平台,旨在共享、发现和重用预训练的机器学习模型。TensorFlow Hub 的主要目标是简化重用现有模型的过程,从而促进协作、减少冗余工…

[比赛简介]ICR - Identifying Age-Related Conditions

比赛链接:https://www.kaggle.com/competitions/icr-identify-age-related-conditions 比赛简介 本次比赛的目标是预测一个人是否患有三种疾病中的任何一种。您被要求预测该人是否患有三种疾病中的任何一种或多种(1 类),或者三种…