尚硅谷JUC并发编程(100-111)
ThreadLocal
ThreadLocal 使用
ThreadLocal是什么?ThreadLocal 提供线程局部变量。这些变量与正常的变量有所不同,因为每一个线程在访问ThreadLocal实例的时候(通过其get或set方法)都有自己的、独立初始化的变量副本。ThreadLocal实例通常是类中的私有静态字段,使用它的目的是希望将状态(比如用户ID或者事务ID)与线程关联起来。
ThreadLocal用来干什么的? 实现每一个线程都有自己专属的本地变量副本(自己用自己的变量不麻烦别人,不要和其他人共享,人人有份,人各一份)
主要实现了让每个线程绑定自己的值,通过使用get()和set()方法,获取默认值或将其值更改为当前线程锁存的副本的值,从而避免了线程安全问题。
比如以前加锁:N:1(资源),N个人打电话,1是公用电话
现在使用ThreadLocal:1:1,人手一份
API介绍
get()
、initialValue()
、remove()
、set(T value)
、witgInitial(Supplier<? extends S> supplier)
ThreadLocal使用案例
class House{
public static int sum = 0;
// 总数的房
public static synchronized void getSum(){
sum++;
}
ThreadLocal<Integer> saleCount = ThreadLocal.withInitial(()->0);
// 各顾各的累加一套房
public void sale() {
saleCount.set(saleCount.get()+1);
}
}
public class ThreadLocalDemo {
public static void main(String[] args) throws InterruptedException {
House house = new House();
// 有12个销售经理
for (int i = 0; i < 3; i++) {
new Thread(()->{
int size = new Random().nextInt(5) + 1;
for (int j = 0; j <= size; j++) {
House.getSum();
house.sale();
}
System.out.println(Thread.currentThread().getName()+"号销售员卖出了:"+house.saleCount.get());
},String.valueOf(i)).start();
}
TimeUnit.MICROSECONDS.sleep(300);
System.out.println(Thread.currentThread().getName()+"卖出了:"+House.sum);
}
}
这里要重视对自定义的ThreadLocal变量,尤其在线程池的场景下,线程经常复用,如果不清理自定义的ThreadLocal变量,可能会对后续业务逻辑和造成内存泄漏等问题。尽量在代理中使用try-finally快进行回收。
try {
for (int j = 0; j <= size; j++) {
House.getSum();
house.sale();
}
System.out.println(Thread.currentThread().getName()+"号销售员卖出了:"+house.saleCount.get());
}finally {
house.saleCount.remove();
}
ThreadLocal 源码分析
Q:Thread,ThreadGroup,ThreadLocal,ThreadLocalMap之间的差别
A:Thread里面有个ThreadLocal线程局部变量,ThreadLocalMap是ThreadLocal里的一个静态内部类。打个比方,Thread就好比一个正常的自然人,ThreadLocal就好比一张身份证,ThreadLocalMap就是内容信息身份证号码:名字(key:value)
ThreadLocalMap从字面上看就是一个保持ThreadLocal对象的map(ThreadLocal为Key),这样它的value就是每个线程拥有了自己独立的变量
- Thread:线程类
- ThreadGroup:线程组表示一组线程
- ThreadLocal:提供线程局部变量
- ThreadLocalMap:是ThreadLocal里的一个静态内部类,实际上是以ThreadLocal作为key,任意对象作为value和Entry对象
ThreadLocal内存泄漏
finalize():当垃圾收集确定没有对该对象的更多引用时,由对象上的垃圾收集器调用。在对象被不可丢弃之前执行清理操作。
强引用(软弱虚都是强引用的子类)
当内存不足,JVM开始垃圾回收,对于强引用的对象,就算是出现了OOM也不会对该对象进行回收,死都不收。
强引用是我们最常见的普通对象引用,只要还有强引用指向一个对象,就能表明对象还“活着”,垃圾收集器不会碰这种对象。
在Java中最常见的就是强引用,把一个对象赋给一个引用变量,这个引用变量就是一个强引用。
当一个对象被强引用变量引用时,它处于可达状态,它是不可能被垃圾回收机制回收的,即使该对象以后永远都不会被用到,JVM也不会回收。因此强引用是造成Java内存泄漏的主要原因之一。
对于一个普通的对象,如果没有其他的引用关系,只要超过了引用的作用域或者显式地将相应(强)引用赋值为null,一般认为就是可以被垃圾收集的了(当然具体回收时机还是要看垃圾收集策略)。
实例代码:
class MyObject{
@Override
protected void finalize() throws Throwable {
System.out.println("----------invoke finalize method------------");
}
}
public class ReferenceDemo {
public static void main(String[] args) throws InterruptedException {
MyObject myObject = new MyObject();
System.out.println("gc before:"+myObject);
myObject = null;
System.gc();//人工开启gc,一般不用
TimeUnit.MICROSECONDS.sleep(300);
System.out.println("gc after:" + myObject);
}
}
/**
gc before:com.ffideal.threadlocaldemo.MyObject@4554617c
----------invoke finalize method------------
gc after:null
*/
软引用
软引用是一种相对强引用弱化了一些的引用,需要用java.lang.ref.SoftReference类来实现,可以让对象豁免一些垃圾收集。
对于只有软引用的对象来说,
- 当系统内存充足时,它不会被回收
- 当系统内存不足时,它会被回收。
软引用通常用在对内存敏感的程序中,比如高速缓存就有用到软引用,内存够用的时候就保留,不够用就回收!
实例代码:
//在jvm设置:-Xms10m -Xmx10m
class MyObject{
@Override
protected void finalize() throws Throwable {
System.out.println("----------invoke finalize method------------");
}
}
public class ReferenceDemo {
public static void main(String[] args) throws InterruptedException {
SoftReference<MyObject> softReference = new SoftReference<>(new MyObject());
System.out.println("----------softReference:" + softReference.get());
System.gc();
TimeUnit.SECONDS.sleep(10);
System.out.println("----------gc after 内存够用时:" + softReference.get());
try{
byte[] bytes = new byte[20 * 1024 * 1024];
}catch (Exception e){
}finally {
System.out.println("----------gc after 内存不够用时:" + softReference.get());
}
}
}
/**
----------softReference:com.ffideal.threadlocaldemo.MyObject@4554617c
----------gc after 内存够用时:com.ffideal.threadlocaldemo.MyObject@4554617c
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at com.ffideal.threadlocaldemo.ReferenceDemo.main(ReferenceDemo.java:27)
----------gc after 内存不够用时:null
----------invoke finalize method------------
*/
弱引用
弱引用培要用java.lang.ref.WeakReference类来实现,它比软引用的生存期更短,
对于只有弱引用的对象来说,只要垃圾回收机制一运行,不管JVM的内存空间是否足够,都会回收该对象占用的内存。
代码示例
class MyObject{
@Override
protected void finalize() throws Throwable {
System.out.println("----------invoke finalize method------------");
}
}
public class ReferenceDemo {
public static void main(String[] args) throws InterruptedException {
WeakReference<MyObject> weakReference = new WeakReference<>(new MyObject());
System.out.println("----------weakReference:" + weakReference.get());
System.out.println("----------gc before 内存够用时:" + weakReference.get());
System.gc();
TimeUnit.SECONDS.sleep(5);
System.out.println("----------gc after 内存够用时:" + weakReference.get());
}
}
/**
----------weakReference:com.ffideal.threadlocaldemo.MyObject@4554617c
----------gc before 内存够用时:com.ffideal.threadlocaldemo.MyObject@4554617c
----------invoke finalize method------------
----------gc after 内存够用时:null
*/
虚引用
(1)虚引用必须和引用队列 (ReferenceQueue) 联合使用
虚引用需要
java.lang.ref.PhantomReference
类来实现,顾名思义,就是形同虚设,与其他几种引用都个同,威引用开个会决定对家的生命周期。如果一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收器回收,它不能单独使用也不能通过它访问对象,虚引用必须和引用队列(ReferenceQueue)联合使用。(2)PhantomReference 的 get 方法总是返回null
虚引用的主要作用是跟踪对象被垃圾回收的状态。仅仅是提供了一种确保对象被finalize以后,做某些事情的通知机制。PhantomReference 的 get 方法总是返回null,因此无法访问对应的引用对象。
(3)处理监控通知使用
换句话说,设置虚引用关联对象的唯一目的,就是在这个对象被收集器回收的时候收到一个系统通知或者后续添加进一步的处理,用来实现比finalize机制更灵活的回收操作
实例代码:
class MyObject{
@Override
protected void finalize() throws Throwable {
System.out.println("----------invoke finalize method------------");
}
}
public class ReferenceDemo {
public static void main(String[] args) throws InterruptedException {
MyObject myObject = new MyObject();
ReferenceQueue<MyObject> queue = new ReferenceQueue<>();
PhantomReference<MyObject> phantomReference = new PhantomReference<>(new MyObject(), queue);
System.out.println(phantomReference.get());
List<byte[]> list = new ArrayList<>();
new Thread(()->{
while (true) {
list.add(new byte[1 * 1024 * 1024]);
try {
TimeUnit.SECONDS.sleep(1);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(phantomReference.get()+"\t"+"list add ok");
}
},"t1").start();
System.gc();
new Thread(()->{
while (true) {
Reference<? extends MyObject> reference = queue.poll();
if (reference != null) {
System.out.println("------有虚对象回收加入队列-------");
break;
}
}
},"t2").start();
}
}
/**
null
----------invoke finalize method------------
null list add ok
null list add ok
null list add ok
null list add ok
null list add ok
null list add ok
null list add ok
Exception in thread "t1" java.lang.OutOfMemoryError: Java heap space
at com.ffideal.threadlocaldemo.ReferenceDemo.lambda$main$0(ReferenceDemo.java:30)
at com.ffideal.threadlocaldemo.ReferenceDemo$$Lambda$1/2003749087.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
------有虚对象回收加入队列-------
----------invoke finalize method------------
*/
总结
ThreadLocal是一个壳子,真正的存储结构是ThreadLocal里有ThreadLocaMap这么个内部类,每个Thread对象维护着一个ThreadLocalMap的引用,ThreadLocalMap是ThreadLocal的内部类,用Entry来进行存储。
(1)调用ThreadLocal 的set() 方法时,实际上就是往 ThreadLocalMap 设置值, key 是 ThreadLocal 对象,值 Value 是传递进来的对象。
(2)调用ThreadLocal 的 get() 方法时,实际上就是往 ThreadLocalMap 获取值,key 是 ThreadLocal 对象 ThreadLocal 本身并不存储值(ThreadLocal是一个壳子),它只是自己作为一个key来让线程从ThreadLocalMap获取value。
正因为这个原理,所以ThreadLocal能够实现“数据隔离”,获取当前线程的局部变量值,不受其他线程影响~
为什么源代码用弱引用?
当functiono1方法执行完毕后,栈帧销毁强引用tl也就没有了。
但此时线程的 ThreadLocalMap 里某个 entry 的 key 引用还指向这个对象。
若这个 key 引用是强引用,就会导致key指向的ThreadLocal 对象及 v 指向的对象不能被 gc 回收,造成内存泄漏;
若这个key引用是弱引用就大概率会减少内存泄漏的问题(还有一个key为null的异常,第2个坑后面讲)。
使用弱引用,就可以使ThreadLocal对象在方法执行完毕后顺利被回收且Entry的key引用指向为null。
相当于,线程没了。ThreadLocal中的信息也应该被销毁。Thread 和 ThreadLocalMap 绑定,ThreadLocal 只是一个工具,不能跟ThreadLocalMap绑定,所以是弱引用
清除脏Entry
寻找脏Entry就是key=null的Entry,然后进行删除
从set、getEntry、remove方法看出,在ThreadLocal的生命周期里,针对ThreadLocal存在的内存泄漏问题,都会通过expungeStaleEntry 清理掉key为null的脏entry的
出现OOM
(1)当我们为threadLocal变量赋值,实际上就是当前的Entry(ThreadLocal实例为key,值为value)往这个ThreadLocalMap中存放。Entry中的key是弱引用,当 ThreadLocal 外部强引用被置为 null (tl=null),那么系统GC的时候,根据可达性分析,这个ThreadLocal 实例就没有任何一条链路能够引用到它,这个ThreadLocal势必会被回收。这样一来,ThreadLocalMap 中就会出现key 为 null 的 Entry,就没有办法访问这些 key 的 null 的 Entry 的 value,如果当前线程再迟迟不结束的话,这些key 为 null 的Entry 的 value 就会一直存在一条强引用链:Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value 永远无法回收,造成内存泄漏。
(2)当然,如果当前thread运行结束,threadLocal,threadLocaMap,Entry没有引用链可达,在垃圾回收的时候都会被系统进行回收。
(3)但在实际使用中我们有时候会用线程池去维护我们的线程,比如在Executors.newFixedThreadPoo()时创建线程的时候,为了复用线程是不会结束的,所以ThreadLocal内存泄漏就值得我们小心
key为null的entry的原理
ThreadLocalMap使用ThreadLocal的弱引用作为key,如果一个ThreadLocal没有外部强引用引用他,那么系统gc的时候,这个ThreadLocal势必会被回收。
这样一来,ThreadLocalMap中就会出现key为null的Entry,就没有办法访问这些key为null的Entry的value,如果当前线程再迟迟不结束的话(比如正好用在线程池),这些key为null的Entry的value就会一直存在一条强引用链。
虽然弱引用,保证了 key指向的ThreadLocal对象能被及时回收,但是v指向的value对象是需要ThreadLocalMap调用get、set时发现key osnul时 才会去回收整个entry、 value,因此弱引用不能100%保证内存不泄露。
我们要在不使用某个ThreadLocal对象后,手动调川remoev方法来制除它,尤其是在线程池中,不仅仅是内存泄露的问题,因为线程池中的线程是重复使用的,意味着这个线程的ThreadLoclMap对象也是重复使用的,如果我们不手动调用remove方法,那么后面的线程就有可能获取到上个线程遗留下来的value值,造成bug。
ThreadLocal总结
最佳实践
- ThreadLocal.withInitial(()->初始化值),不设置可能会报空指针异常
- 建议把ThreadLocal修饰为static
- 用完记得手动删除remove
总结:
- ThreadLocal并不解决线程间共享数据的问题
- ThreadLocal适用于变量在线程间隔离且在方法间共享的场景
- ThreadLocal通过隐式的在不同线程内创建独立实例副本避免了实例线程安全的问题
- 每个线程持有一个只属于自己的专属Map并维护了ThreadLocal对象与具体实例的映射,该Map由于只被持有它的线程访问,故不存在线程安全以及锁的问题
- ThreadLocalMap的Entry对ThreadLocal的引用为弱引用,避免了ThreadLocal对象无法被回收的问题
- 都会通过expungeStaleEntry,cleanSomeSlots,replaceStaleEntry这三个方法回收键为null的Entry对象的值(即为具体实例)以及Entry对象本身从而防止内存泄漏,属于安全加固的方法
ThreadLocal适用于变量在线程间隔离且在方法间共享的场景 - ThreadLocal通过隐式的在不同线程内创建独立实例副本避免了实例线程安全的问题
- 每个线程持有一个只属于自己的专属Map并维护了ThreadLocal对象与具体实例的映射,该Map由于只被持有它的线程访问,故不存在线程安全以及锁的问题
- ThreadLocalMap的Entry对ThreadLocal的引用为弱引用,避免了ThreadLocal对象无法被回收的问题
- 都会通过expungeStaleEntry,cleanSomeSlots,replaceStaleEntry这三个方法回收键为null的Entry对象的值(即为具体实例)以及Entry对象本身从而防止内存泄漏,属于安全加固的方法