Java提供了种类丰富的锁,每种锁因其特性的不同,在适当的场景下能够展现出非常高的效率。
一、Java锁是什么?为什么要用Java锁?
在并发编程中,经常遇到多个线程访问同一个共享资源 ,这时候作为开发者必须考虑如何维护数据一致性,在java
中synchronized
关键字被常用于维护数据一致性。synchronized
机制是给共享资源上锁,只有拿到锁的线程才可以访问共享资源,这样就可以强制使得对共享资源的访问都是顺序的,因为对于共享资源属性访问是必要也是必须的。
一般在java
中所说的锁就是指的内置锁,每个java
对象都可以作为一个实现同步的锁,虽然说在java
中一切皆对象, 但是锁必须是引用类型的,基本数据类型则不可以 。每一个引用类型的对象都可以隐式的扮演一个用于同步的锁的角色,执行线程进入synchronized
块之前会自动获得锁,无论是通过正常语句退出还是执行过程中抛出了异常,线程都会在放弃对synchronized
块的控制时自动释放锁。 获得锁的唯一途径就是进入这个内部锁保护的同步块或方法 。
对共享资源的访问必须是顺序的,也就是说当多个线程对共享资源访问的时候,只能有一个线程可以获得该共享资源的锁,当线程A尝试获取线程B的锁时,线程A必须等待或者阻塞,直到线程B释放该锁为止,否则线程A将一直等待下去,因此java
内置锁也称作互斥锁,也即是说锁实际上是一种互斥机制。
二、一张图总结:
1. 乐观锁 VS 悲观锁
乐观锁与悲观锁是一种广义上的概念,体现了看待线程同步的不同角度。在Java
和数据库中都有此概念对应的实际应用。
(1)悲观锁
对于同一个数据的并发操作,悲观锁认为自己在使用数据的时候一定有别的线程来修改数据,因此在获取数据的时候会先加锁,确保数据不会被别的线程修改。Java
中,synchronized
关键字和Lock
的实现类都是悲观锁。
(2)乐观锁
乐观锁认为自己在使用数据时不会有别的线程修改数据,所以不会添加锁,只是在更新数据的时候去判断之前有没有别的线程更新了这个数据。如果这个数据没有被更新,当前线程将自己修改的数据成功写入。如果数据已经被其他线程更新,则根据不同的实现方式执行不同的操作(例如报错或者自动重试)。
乐观锁在Java
中是通过使用无锁编程来实现,最常采用的是CAS
算法,在 Java 语言中 java.util.concurrent.atomic
包下的原子类中的递增操作就通过CAS
自旋实现的。
(3)两种锁的使用场景
根据从上面的概念描述我们可以发现:
- 悲观锁适合写操作多的场景,先加锁可以保证写操作时数据正确。
- 乐观锁适合读操作多的场景,不加锁的特点能够使其读操作的性能大幅提升,因为不用上锁、释放锁,省去了锁的开销,从而提升了吞吐量。
(4)CAS
CAS
全称 Compare And Swap
(比较与交换),是一种无锁算法。在不使用锁(没有线程被阻塞)的情况下实现多线程之间的变量同步。java.util.concurrent
包中的原子类就是通过CAS来实现了乐观锁。
CAS算法涉及到三个操作数:
- 需要读写的内存值 V。
- 进行比较的值 A。
- 要写入的新值 B。
当且仅当 V 的值等于 A 时,CAS通过原子方式用新值B来更新V的值(“比较+更新”整体是一个原子操作),否则不会执行任何操作。一般情况下,“更新”是一个不断重试的操作。
2. 自旋锁 VS 适应性自旋锁
在介绍自旋锁前,我们需要介绍一些前提知识来帮助大家明白自旋锁的概念。
(1)自旋锁
阻塞或唤醒一个Java
线程需要操作系统切换CPU状态来完成,这种状态转换需要耗费处理器时间。如果同步代码块中的内容过于简单,状态转换消耗的时间有可能比用户代码执行的时间还要长。
在许多场景中,同步资源的锁定时间很短,为了这一小段时间去切换线程,线程挂起和恢复现场的花费可能会让系统得不偿失。如果物理机器有多个处理器,能够让两个或以上的线程同时并行执行,我们就可以让后面那个请求锁的线程不放弃CPU的执行时间,看看持有锁的线程是否很快就会释放锁。
而为了让当前线程“稍等一下”,我们需让当前线程进行自旋,如果在自旋完成后前面锁定同步资源的线程已经释放了锁,那么当前线程就可以不必阻塞而是直接获取同步资源,从而避免切换线程的开销。这就是自旋锁。
(2)缺点
自旋锁本身是有缺点的,它不能代替阻塞。自旋等待虽然避免了线程切换的开销,但它要占用处理器时间。如果锁被占用的时间很短,自旋等待的效果就会非常好。反之,如果锁被占用的时间很长,那么自旋的线程只会白浪费处理器资源。所以,自旋等待的时间必须要有一定的限度,如果自旋超过了限定次数(默认是10次,可以使用-XX:PreBlockSpin
来更改)没有成功获得锁,就应当挂起线程。
(3)实现原理
自旋锁的实现原理同样也是CAS
,AtomicInteger
中调用unsafe
进行自增操作的源码中的do-while
循环就是一个自旋操作,如果修改数值失败则通过循环来执行自旋,直至修改成功。
(4)适应性自旋锁
自旋锁在JDK1.4.2
中引入,使用-XX:+UseSpinning
来开启。JDK 6
中变为默认开启,并且引入了自适应的自旋锁(适应性自旋锁)。
自适应意味着自旋的时间(次数)不再固定,而是由前一次在同一个锁上的自旋时间及锁的拥有者的状态来决定。如果在同一个锁对象上,自旋等待刚刚成功获得过锁,并且持有锁的线程正在运行中,那么虚拟机就会认为这次自旋也是很有可能再次成功,进而它将允许自旋等待持续相对更长的时间。如果对于某个锁,自旋很少成功获得过,那在以后尝试获取这个锁时将可能省略掉自旋过程,直接阻塞线程,避免浪费处理器资源。
(5)常见的锁形式
在自旋锁中 另有三种常见的锁形式:TicketLock
、CLHlock
和MCSlock
。
3. 无锁 VS 偏向锁 VS 轻量级锁 VS 重量级锁
这四种锁是指锁的状态,专门针对synchronized
的。
(1)无锁
无锁没有对资源进行锁定,所有的线程都能访问并修改同一个资源,但同时只有一个线程能修改成功。
无锁的特点就是修改操作在循环内进行,线程会不断的尝试修改共享资源。如果没有冲突就修改成功并退出,否则就会继续循环尝试。如果有多个线程修改同一个值,必定会有一个线程能修改成功,而其他修改失败的线程会不断重试直到修改成功。
上面我们介绍的CAS
原理及应用即是无锁的实现。无锁无法全面代替有锁,但无锁在某些场合下的性能是非常高的。
(2)偏向锁
偏向锁是指一段同步代码一直被一个线程所访问,那么该线程会自动获取锁,降低获取锁的代价。
在大多数情况下,锁总是由同一线程多次获得,不存在多线程竞争,所以出现了偏向锁。其目标就是在只有一个线程执行同步代码块时能够提高性能。
当一个线程访问同步代码块并获取锁时,会在Mark Word
里存储锁偏向的线程ID。在线程进入和退出同步块时不再通过CAS
操作来加锁和解锁,而是检测Mark Word
里是否存储着指向当前线程的偏向锁。引入偏向锁是为了在无多线程竞争的情况下尽量减少不必要的轻量级锁执行路径,因为轻量级锁的获取及释放依赖多次CAS
原子指令,而偏向锁只需要在置换ThreadID
的时候依赖一次CAS
原子指令即可。
偏向锁只有遇到其他线程尝试竞争偏向锁时,持有偏向锁的线程才会释放锁,线程不会主动释放偏向锁。偏向锁的撤销,需要等待全局安全点(在这个时间点上没有字节码正在执行),它会首先暂停拥有偏向锁的线程,判断锁对象是否处于被锁定状态。撤销偏向锁后恢复到无锁(标志位为“01”)或轻量级锁(标志位为“00”)的状态。
偏向锁在JDK 6
及以后的JVM
里是默认启用的。可以通过JVM
参数关闭偏向锁:-XX:-UseBiasedLocking=false
,关闭之后程序默认会进入轻量级锁状态。
(3)轻量级锁
当锁是偏向锁的时候,被另外的线程所访问,偏向锁就会升级为轻量级锁,其他线程会通过自旋的形式尝试获取锁,不会阻塞,从而提高性能。
在代码进入同步块的时候,如果同步对象锁状态为无锁状态(锁标志位为“01”状态,是否为偏向锁为“0”),虚拟机首先将在当前线程的栈帧中建立一个名为锁记录(Lock Record
)的空间,用于存储锁对象目前的Mark Word
的拷贝,然后拷贝对象头中的Mark Word
复制到锁记录中。
拷贝成功后,虚拟机将使用CAS
操作尝试将对象的Mark Word
更新为指向Lock Record
的指针,并将Lock Record
里的owner
指针指向对象的Mark Word
。
如果这个更新动作成功了,那么这个线程就拥有了该对象的锁,并且对象Mark Word
的锁标志位设置为“00”,表示此对象处于轻量级锁定状态。
如果轻量级锁的更新操作失败了,虚拟机首先会检查对象的Mark Word
是否指向当前线程的栈帧,如果是就说明当前线程已经拥有了这个对象的锁,那就可以直接进入同步块继续执行,否则说明多个线程竞争锁。
若当前只有一个等待线程,则该线程通过自旋进行等待。但是当自旋超过一定的次数,或者一个线程在持有锁,一个在自旋,又有第三个来访时,轻量级锁升级为重量级锁。
(4)重量级锁
升级为重量级锁时,锁标志的状态值变为“10
”,此时Mark Word
中存储的是指向重量级锁的指针,此时等待锁的线程都会进入阻塞状态
。
(5)锁状态升级流程
- 偏向锁通过对比
Mark Word
解决加锁问题,避免执行CAS
操作; - 轻量级锁是通过用
CAS
操作和自旋来解决加锁问题,避免线程阻塞和唤醒而影响性能; - 重量级锁是将除了拥有锁的线程以外的线程都阻塞。
(6)补充
① Java对象头
synchronized
是悲观锁,在操作同步资源之前需要给同步资源先加锁,这把锁就是存在Java
对象头里的,而Java
对象头又是什么呢?
我们以Hotspot
虚拟机为例,Hotspot
的对象头主要包括两部分数据:Mark Word
(标记字段)、Klass Pointer
(类型指针)。
Mark Word
:默认存储对象的HashCode
,分代年龄和锁标志位信息。这些信息都是与对象自身定义无关的数据,所以Mark Word
被设计成一个非固定的数据结构以便在极小的空间内存存储尽量多的数据。它会根据对象的状态复用自己的存储空间,也就是说在运行期间Mark Word
里存储的数据会随着锁标志位的变化而变化。
Klass Point
:对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
② Monitor
Monitor
可以理解为一个同步工具或一种同步机制,通常被描述为一个对象。每一个Java
对象就有一把看不见的锁,称为内部锁或者Monitor
锁。
Monitor
是线程私有的数据结构,每一个线程都有一个可用monitor record
列表,同时还有一个全局的可用列表。每一个被锁住的对象都会和一个monitor
关联,同时monitor
中有一个Owner
字段存放拥有该锁的线程的唯一标识,表示该锁被这个线程占用。
现在话题回到synchronized
,synchronized
通过Monitor
来实现线程同步,Monitor
是依赖于底层的操作系统的Mutex Lock
(互斥锁)来实现的线程同步。
如同我们在自旋锁中提到的“阻塞或唤醒一个Java
线程需要操作系统切换CPU状态来完成,这种状态转换需要耗费处理器时间。如果同步代码块中的内容过于简单,状态转换消耗的时间有可能比用户代码执行的时间还要长”。这种方式就是synchronized
最初实现同步的方式,这就是JDK 6之前synchronized
效率低的原因。这种依赖于操作系统Mutex Lock
所实现的锁我们称之为“重量级锁”,JDK 6中为了减少获得锁和释放锁带来的性能消耗,引入了“偏向锁”和“轻量级锁”。
所以目前锁一共有4种状态,级别从低到高依次是:无锁、偏向锁、轻量级锁和重量级锁。锁状态只能升级不能降级。
四种锁状态对应的的Mark Word内容:
锁状态 | 储存内容 | 储存内容 |
---|---|---|
无锁 | 对象的hashCode 、对象分代年龄、是否是偏向锁 | 01 |
偏向锁 | 偏向线程ID、偏向时间戳、对象分代年龄、是否是偏向锁 | 01 |
轻量级锁 | 指向栈中锁记录的指针 | 00 |
重量级锁 | 指向互斥量(重量级锁)的指针 | 10 |
4. 公平锁 VS 非公平锁
(1)公平锁
公平锁是指多个线程按照申请锁的顺序来获取锁,线程直接进入队列中排队,队列中的第一个线程才能获得锁。
公平锁的优点是等待锁的线程不会饿死。
缺点是整体吞吐效率相对非公平锁要低,等待队列中除第一个线程以外的所有线程都会阻塞,CPU唤醒阻塞线程的开销比非公平锁大。
在 java 中可以通过构造函数初始化公平锁
/**
* 创建一个可重入锁,true 表示公平锁,false 表示非公平锁。默认非公平锁
*/
Lock lock = new ReentrantLock(true);
(2)非公平锁
非公平锁是多个线程加锁时直接尝试获取锁,获取不到才会到等待队列的队尾等待。但如果此时锁刚好可用,那么这个线程可以无需阻塞直接获取到锁,所以非公平锁有可能出现后申请锁的线程先获取锁的场景。
非公平锁的优点是可以减少唤起线程的开销,整体的吞吐效率高,因为线程有几率不阻塞直接获得锁,CPU不必唤醒所有线程。
缺点是处于等待队列中的线程可能会饿死,或者等很久才会获得锁。
在 java 中 synchronized 关键字是非公平锁,ReentrantLock默认也是非公平锁。
/**
* 创建一个可重入锁,true 表示公平锁,false 表示非公平锁。默认非公平锁
*/
Lock lock = new ReentrantLock(false);
5. 可重入锁 VS 非可重入锁
(1)可重入锁
可重入锁又名递归锁,是指在同一个线程在外层方法获取锁的时候,再进入该线程的内层方法会自动获取锁(前提锁对象得是同一个对象或者class
),不会因为之前已经获取过还没释放而阻塞。Java
中ReentrantLock
和synchronized
都是可重入锁,可重入锁的一个优点是可一定程度避免死锁。
以 synchronized
为例,看一下下面的代码:
public synchronized void mehtodA() throws Exception{
// Do some magic tings
mehtodB();
}
public synchronized void mehtodB() throws Exception{
// Do some magic tings
}
上面的代码中 methodA
调用 methodB
,如果一个线程调用methodA
已经获取了锁再去调用 methodB
就不需要再次获取锁了,这就是可重入锁的特性。如果不是可重入锁的话,mehtodB
可能不会被当前线程执行,可能造成死锁。
(2)非可重入锁
非可重入锁:NonReentrantLock
首先ReentrantLock
和NonReentrantLock
都继承父类AQS
,其父类AQS
中维护了一个同步状态status
来计数重入次数,status
初始值为0
。
当线程尝试获取锁时,可重入锁先尝试获取并更新status
值,如果status == 0
表示没有其他线程在执行同步代码,则把status
置为1
,当前线程开始执行。如果status != 0
,则判断当前线程是否是获取到这个锁的线程,如果是的话执行status+1
,且当前线程可以再次获取锁。而非可重入锁是直接去获取并尝试更新当前status
的值,如果status != 0
的话会导致其获取锁失败,当前线程阻塞。
释放锁时,可重入锁同样先获取当前status
的值,在当前线程是持有锁的线程的前提下。如果status-1 == 0
,则表示当前线程所有重复获取锁的操作都已经执行完毕,然后该线程才会真正释放锁。而非可重入锁则是在确定当前线程是持有锁的线程之后,直接将status
置为0
,将锁释放。
6. 独享锁 VS 共享锁
独享锁和共享锁同样是一种概念。
(1)独享锁
独享锁也叫排他锁,是指该锁一次只能被一个线程所持有。如果一个线程对数据加上排他锁后,那么其他线程不能再对该数据加任何类型的锁。获得独占锁的线程即能读数据又能修改数据。
JDK
中的synchronized
和java.util.concurrent(JUC)
中Lock
的实现类就是互斥锁。
(2)共享锁
共享锁是指锁可被多个线程所持有。如果一个线程对数据加上共享锁后,那么其他线程只能对数据再加共享锁,不能加独占锁。获得共享锁的线程只能读数据,不能修改数据。
在 JDK
中 ReentrantReadWriteLock
就是一种共享锁。
7. 互斥锁VS读写锁
(1)互斥锁
互斥锁是独占锁的一种常规实现,是指某一资源同时只允许一个访问者对其进行访问,具有唯一性和排它性。
互斥锁一次只能一个线程拥有互斥锁,其他线程只有等待。
(2)读写锁
读写锁是共享锁的一种具体实现。读写锁管理一组锁,一个是只读的锁,一个是写锁。
读锁可以在没有写锁的时候被多个线程同时持有,而写锁是独占的。写锁的优先级要高于读锁,一个获得了读锁的线程必须能看到前一个释放的写锁所更新的内容。
读写锁相比于互斥锁并发程度更高,每次只有一个写线程,但是同时可以有多个线程并发读。
在 JDK
中定义了一个读写锁的接口:ReadWriteLock
public interface ReadWriteLock {
/**
* 获取读锁
*/
Lock readLock();
/**
* 获取写锁
*/
Lock writeLock();
}
ReentrantReadWriteLock
实现了ReadWriteLock
接口。
8. 同步锁与死锁
(1)同步锁
当多个线程同时访问同一个数据时,很容易出现问题。为了避免这种情况出现,我们要保证线程同步互斥,就是指并发执行的多个线程,在同一时间内只允许一个线程访问共享数据。
Java
中可以使用 synchronized
关键字来取得一个对象的同步锁。
(2)死锁
就是多个线程同时被阻塞,它们中的一个或者全部都在等待某个资源被释放。
9. 分段锁
分段锁 是一种锁的设计,并不是具体的一种锁。
分段锁设计目的是将锁的粒度进一步细化,当操作不需要更新整个数组的时候,就仅仅针对数组中的一项进行加锁操作。
在 Java
语言中 CurrentHashMap
底层就用了分段锁,使用Segment
,就可以进行并发使用了。
10. 锁优化
(1)减少锁持有时间
只用在有线程安全要求的程序上加锁
(2)减小锁粒度
将大对象(这个对象可能会被很多线程访问),拆成小对象,大大增加并行度,降低锁竞争。降低了锁的竞争,偏向锁,轻量级锁成功率才会提高。
最最典型的减小锁粒度的案例就是ConcurrentHashMap
。
(3)锁分离
最常见的锁分离就是读写锁 ReadWriteLock
,根据功能进行分离成读锁和写锁,这样读读不互斥,读写互斥,写写互斥,即保证了线程安全,又提高了性能。读写分离思想可以延伸,只要操作互不影响,锁就可以分离。
比如LinkedBlockingQueue
从头部取出,从尾部放数据。
(4)锁粗化
通常情况下,为了保证多线程间的有效并发,会要求每个线程持有锁的时间尽量短,即在使用完公共资源后,应该立即释放锁。但是,凡事都有一个度,如果对同一个锁不停的进行请求、同步和释放,其本身也会消耗系统宝贵的资源,反而不利于性能的优化 。
(5)锁消除
锁消除是在编译器级别的事情。在即时编译器时,如果发现不可能被共享的对象,则可以消除这些对象的锁操作,多数是因为程序员编码不规范引起。
三、常见锁
名称 | 乐观锁 VS 悲观锁 | 公平锁 VS 非公平锁 | 可重入锁 VS 非可重入锁 | 独享锁 VS 共享锁 | 互斥锁VS读写锁 |
---|---|---|---|---|---|
Synchronized | 悲观锁 | 非公平锁 | 可重入锁 | ||
ReentrantLock | 默认为非公平锁 | 可重入锁 | 独享锁 | 互斥锁 | |
ReadWriteLock | 乐观锁 | 共享锁 | 读写锁 |