文章目录
- 前言
- 前置知识:堆内存与栈内存
- 普通数据结构类和ThreadLocal存取数据的不同?
- 结合源码来看ThreadLocal如何实现的
- 1. ThreadLocal类get方法
- 2. ThreadLocal类的getMap(Thread)方法
- 3. Thread类的threadLocals属性
- 4. ThreadLocal类的setInitialValue()方法
- 5. 数据结构类 ThreadLocal\$ThreadLocalMap
- 6. 键值对类 ThreadLocal\$ThreadLocalMap\$Entry
- ThreadLocal的内存泄露问题
- ThreadLocal如何导致内存泄露?
- 如何正确使用ThreadLocal以避免内存泄露?
- 结语
前言
在Java多线程编程里,线程之间访问共享区域(堆内存)里的数据时,通常面临需要加锁来保证线程安全性。有时候,我们各个线程其实只关心与之相关的数据,而把这些数据通过堆内存里某种数据结构(如Map、List等)存储时,这个数据结构实例就面临多线程增删改查的一个问题(需要加锁来保证线程安全或不加锁导致的线程不安全性)。
所以JDK提供了一个数据结构或者说机制,让我们能够很方便地不加锁也能实现每个线程单独访问其关联的数据,这就是咱们的ThreadLocal了。
前置知识:堆内存与栈内存
在了解ThreadLocal之前,我们首先需要知道堆内存与栈内存都分别意味着什么?
- 堆内存(Heap memory):进程内的共享内存区域,被称为堆内存。各个不同线程都能轻易访问到。
- 栈内存(Stack memory):进程内的各个线程独享的内存区域。在线程上指令的执行跳转和返回是通过栈帧(stack frame)在线程栈(stack)的压入和弹出来实现的,所以线程独享的内存区域也被称为栈内存。
我们能看到的图解呢,通常长下面这样,每个线程都有其单独的栈内存,整个进程里所有线程共享堆内存。
普通数据结构类和ThreadLocal存取数据的不同?
在前言中我们提到了通过普通数据结构类来存储共享数据的问题,那就是处于多线程环境下的普通数据结构类不是线程安全的,可能会导致数据出问题(比如java8之前多线程操作HashMap会导致死循环的问题)。要想保证线程安全性就得加锁,会损失一部分性能。
但是一些情况下我们其实并不希望加锁,我们仅仅希望有某一种机制能让不同线程的数据放在一起(一个变量里),但又彼此隔离(不需要加锁损失性能)。所以JDK中利用ThreadLocal类和Thread类相互配合实现了这一需求。
普通数据结构和ThreadLocal的不同可以看下图,左边部分是普通数据结构,右边部分是ThreadLocal。
- 普通数据结构:所有线程指令需要访问同一个数据结构,数据结构内部需要通过加锁来实现线程安全,否则就是线程不安全的(如图示的HashMap就是线程不安全的)
- ThreadLocal:ThreadLocal类仅仅作为一个访问器(Accessor)和令牌(Key),我们线程通过ThreadLocal去访问存储在Thread实例内部的ThreadLocalMap数据结构里的数据。
不难看出,它们的区别就是普通数据结构就是一个数据结构实例来服务多个线程,
ThreadLocal这边呢则是每个线程都对应拥有一个自己的数据结构实例(ThreadLocalMap),ThreadLocal仅仅是作为一个访问器或者说代理的作用。
也正是每个线程都拥有自己的数据结构实例,这也是为什么不需要加锁或者说线程独占数据在Heap Memory上实现隔离的原因。
结合源码来看ThreadLocal如何实现的
通过前一章,我们了解到其实ThreadLocal的实现原理真的非常简单,下面我们通过结合源码的方式来看看ThreadLocal具体是怎么实现的
1. ThreadLocal类get方法
- 通过Thread.currentThread()获取到方法执行时的线程实例。
- 通过getMap(Thread)方法获取Thread实例的数据结构类ThreadLocalMap
- 如果数据结构存在,就尝试获取ThreadLocal实例这个Key对应的数据。获取到就直接返回。
- 如果数据结构不存在或者ThreadLocal这个Key不存在,就通过setInitialValue()方法初始化数据结构和添加初始值(null)
2. ThreadLocal类的getMap(Thread)方法
这个方法就很简单了,直接获取Thread实例的threadLocals这个属性。
3. Thread类的threadLocals属性
这个数据结构实例是被Thread实例持有的,这也是为什么说ThreadLocal和Thread一起提供了这个机制。
这个属性的初始化是典型的懒汉初始化(lazy initialization),初始值为null。
4. ThreadLocal类的setInitialValue()方法
这个方法也很简单,如果数据结构ThreadLocalMap不存在就创建ThreadLocalMap实例并添加一个键值对。
- Key: 当前ThreadLocal实例
- Value: initialValue(),这个方法返回的是null。
5. 数据结构类 ThreadLocal$ThreadLocalMap
这是一个类似HashMap的数据结构,你可以通过Key去获取对应的Value。只不过Key的类型被限定为ThreadLocal实例而已。
其键值对信息则是用一个Entry数组来保存。
6. 键值对类 ThreadLocal$ThreadLocalMap$Entry
和HashMap不同的是,ThreadLocalMap的键值对类Entry是WeakReference<ThreadLocal<?>>的子类,是弱引用,也是因为这个弱引用,引入了内存泄露的风险,这个我们会在后面章节讨论。
ThreadLocal的内存泄露问题
ThreadLocal如果使用不当会有内存泄露的风险,内存泄露,英:Memory Leak。内存泄露其实这个翻译笔者并不喜欢,而事实上进程的内存空间被操作系统严格管理,并不会像油箱泄漏那样漏得到处都是,所以这个听上去像是油箱漏油一般的翻译,并不便于我们中国人理解。
事实上,进程的内存中有一块因无法回收导致无法使用的区域存在这一现象被称为Memory Leak,Leak也有漏洞、裂缝的意思。内存裂缝就相对来说比较形象。我的内存像一块板子,上面裂了一块导致我们无法使用。
ThreadLocal如何导致内存泄露?
我们前面章简单看了一下ThreadLocal相关的源码以及简单介绍了内存泄漏时什么,下面我们来梳理一下ThreadLocal机制内的引用关系:
- ThreadLocalMap是Thread的属性,Thread实例强引用了 ThreadLocalMap实例。
- Entry[]是ThreadLocalMap的属性,ThreadLocalMap强引用了Entry数组实例。
- Entry是Entry数组的成员,Entry数组强引用了Entry实例。
- Entry:
4.1. Entry实例强引用了Object实例。
4.2. Entry实例的父类WeakReference<ThreadLocal<?>>,弱引用了ThreadLocal实例。
到4.2这里我们能看到Entry实例是弱引用的ThreadLocal实例,那么一旦ThreadLocal实例的强引用数量为0,那么ThreadLocal实例就会被回收。而我们的数据Entry.value对应的Object实例就会因为一条强引用链的存在导致无法被GC回收,导致出现内存泄漏。
Thread → ThreadLocalMap → Entry[] → Entry → Object
除非我们的Thread指令执行结束被回收,否则Object实例将永远不可能被回收。
如何正确使用ThreadLocal以避免内存泄露?
前面我们也提到了出现内存泄露的前提是ThreadLocal实例被回收,那么避免内存泄漏的方法就很容易想到了,那就是及时使用ThreadLocal的remove()方法清除不再使用的数据。这种方式会把ThreadLocal实例对于的Entry的Key和Value都设为null,避免了上述强引用链的存在。也就是在ThreadLocal被回收之前,我们需要主动手动清理不再使用的数据。
结语
虽然高级编程语言的出现让开发者不再需要关注进程的内存管理这块儿,但是一些类的不当使用依然有导致内存泄漏的风险。理解工具实现的原理以及内存和内存管理的本质,才能更好的编写出高质量稳定运行的程序。
我是虎猫,希望本文对你有所帮助。(=・ω・=)