ThreadLocal深度解析

news2024/12/23 2:15:55

简介

在并发编程中,导致并发bug的问题都会归结于对共享变量的操作不当。多个线程同时读写同一共享变量存在并发问题,我们可以利用写时复制、不变性来突破对原数据的写操作,没有写就没有并发问题,而本篇文章所介绍的技术是突破共享变量,没有共享变量也不会有并发问题。

Java中避免线程共享的一大利器就是ThreadLocal,我们本篇文章重点讲述它的底层原理、常见的一些用途、创建和使用等。

首先介绍一下它是什么:

  • ThreadLocal 是 Java 的一个类,位于 java.lang 包下。它为每一个线程提供了一个独立的变量副本,使得每个线程可以独立地改变自己的副本,而不会影响其他线程所对应的副本。

它的主要作用就是避免线程间共享,除此之外还能避免无必要的同步以及降低变量使用的复杂度:

  • 线程隔离:在多线程环境下,ThreadLocal 可以为每一个线程提供一个独立的变量实例。因此,每个线程都可以独立地操作该变量,而不需要考虑并发问题。这种特性使得 ThreadLocal 成为一个非常方便的保存线程状态或线程局部变量的工具。
  • 避免无必要的同步:由于每个线程都有其自己的变量副本,所以它们可以无需任何同步措施就可以访问这些变量,从而提高了程序的执行效率。
  • 降低复杂度:在某些场景下,如果需要通过参数传递线程局部变量,可能会使得方法签名和调用变得复杂。使用 ThreadLocal 可以避免这种复杂性,因为它允许我们在任何地方获取到线程相关的数据。

工作原理

我们在学习ThreadLocal的时候,如果不了解其底层实现的话,通常会进入一个误区:ThreadLocal类里面维护了一个Map,这个Map的key为线程引用,值为自己设置的值。其实Java真正的实现是ThreadLocal仅是一个工具类,提供线程对数据的访问,实际真正拥有这个数据的角色是线程自身(这也解释了简介中提到的每个线程都有针对某一变量的副本),如下图所示:

在这里插入图片描述

相信大家会有这样一个疑问:为什么Java没有按照我们预想的那样实现呢?其主要原因就是:不容易造成内存泄漏。假设Java按照我们预想的方案实现,我们分析下会造成什么样的问题:ThreadLocal 持有的 Map 会持有 Thread 对象的引用,这就意味着,只要 ThreadLocal 对象存在,那么 Map 中的 Thread 对象就永远不会被回收。ThreadLocal 的生命周期往往都比线程要长,所以这种设计方案很容易导致内存泄露。而 Java 的实现中 Thread 持有 ThreadLocalMap,而且 ThreadLocalMap 里对 ThreadLocal 的引用还是弱引用(WeakReference),所以只要 Thread 对象可以被回收,那么 ThreadLocalMap 就能被回收。Java 的这种实现方案虽然看上去复杂一些,但是更加安全。

另外这里面的关于Entry[]大小的问题有个讨论点:为什么ThreadLocalMap中的Entry[]大小一定是2的幂次方呢?

ThreadLocalMap大小

其主要原因如下:

  • 优化索引计算:当 table 大小为 2 的次幂时,计算索引位置可以通过简单的位操作实现,而不需要执行昂贵的除法操作。例如,如果 table 大小为 16,那么为了得到一个 key 对应的索引位置,只需要计算 key的hashCode & (table.length - 1)。这种位操作比标准的模运算(%)速度快得多。
  • 均匀分布:2 的次幂大小确保了哈希值在 table 中均匀分布,减少了哈希冲突的可能性。这是因为当我们使用 hashCode & (table.length - 1) 这种方式时,hash值的低位将被有效地使用来计算索引,这在大多数情况下可以确保数据在 table 中均匀分布。
  • 容易扩容:当 table 需要扩容时(例如,当存储的元素太多,达到了负载因子的限制),新的大小可以简单地翻倍,仍然保持为 2 的次幂。
  • 历史与一致性:Java 中的其他哈希结构,如 HashMap,也使用了类似的策略,因此保持这种做法在某种程度上也是为了一致性。

总的来说,选择 2 的次幂作为 table 大小是一个优化决策,旨在提高性能、减少哈希冲突并简化内部操作。

常见用途

  1. 数据库连接:使用 ThreadLocal 保存每个线程独立的数据库连接,确保在同一线程中共享同一个数据库连接,而不是频繁地创建和销毁。
  2. 日期格式化:SimpleDateFormat 不是线程安全的,但我们可以用 ThreadLocal 来为每个线程创建独立的 SimpleDateFormat 实例,避免并发问题。
  3. Web 会话管理:在 Web 应用中,可以使用 ThreadLocal 来保存当前请求的用户会话或其他会话相关的信息。
  4. 框架中的上下文信息:许多框架使用 ThreadLocal 来保存线程级别的上下文数据,例如 Spring 中的事务管理。

创建和使用

下面使用ThreadLocal演示一下为每一个线程分配一个线程ID的代码,不同线程拥有不同的线程ID。

package com.markus.concurrent;

import java.util.concurrent.atomic.AtomicLong;

/**
 * @author: markus
 * @date: 2023/8/20 4:16 PM
 * @Description:
 * @Blog: https://markuszhang.com
 * It's my honor to share what I've learned with you!
 */
public class ThreadLocalDemo {

    static class ThreadID {
        static final AtomicLong nextId = new AtomicLong(0);
        static final ThreadLocal<Long> tl = ThreadLocal.withInitial(nextId::incrementAndGet);

        public static Long get() {
            return tl.get();
        }
    }

    static class GetThreadId implements Runnable {

        @Override
        public void run() {
            for (int i = 0; i < 3; i++) {
                System.out.println("Thread [" + Thread.currentThread().getName() + "],its id is " + ThreadID.get());
            }
        }
    }

    public static void main(String[] args) {
        Thread t1 = new Thread(new GetThreadId(), "t1");
        Thread t2 = new Thread(new GetThreadId(), "t2");
        t1.start();
        t2.start();
    }
}

控制台打印:

控制台

优势、缺点与陷阱

在多线程编程中,ThreadLocal 是一个不可或缺的工具。其主要优势在于为每个线程提供了私有的、独立的变量副本,从而消除了多线程并发访问的问题。这种独立性确保了每个线程都可以无需同步就能访问其局部变量,大大提高了程序的并发性和效率。此外,它还能简化代码结构,避免了复杂的参数传递,为线程关联上下文信息提供了便捷手段,如日志记录中的会话ID。

但是,与其带来的好处相伴的是一些潜在的陷阱。最为严重的问题是与内存泄漏相关。因为ThreadLocal 使用弱引用来引用键,但其对应的值则是强引用。如果不适时地清理,尤其是在线程生命周期结束前不调用 remove() 方法,可能会造成内存泄漏。此外,过度或不适当地使用 ThreadLocal 可能导致代码结构混乱,并降低代码的可读性和维护性。

总之,当我们在项目中使用 ThreadLocal 时,应该始终注意其潜在的陷阱和限制。正确、合理地使用 ThreadLocal 可以为我们带来很多好处,但不恰当的使用可能会引发一系列问题。在使用前,充分了解其工作机制并持续关注是非常必要的。

InheritableThreadLocal

顾名思义,可继承的ThreadLocal。我们知道ThreadLocalMap是线程持有的,每个变量都在各自的线程中保存一个副本,每个线程都能拿到自己的值,但是如果父线程创建了一个子线程,那么这个子线程是无法拿到父线程中的ThreadLocalMap中的信息的。InheritableThreadLocal的出现就是解决这个问题的。它继承自ThreadLocal,相关用法与ThreadLocal一致,这里就不介绍了。

最佳实践

  • 限制使用范围:仅在确实需要线程局部变量来解决问题时使用 ThreadLocal。不应该过度使用或在不必要的场合使用它。

  • 及时清理:

    • 一定要在不再需要线程局部变量时调用 ThreadLocalremove() 方法,以释放资源并避免潜在的内存泄漏。
    • 在 Web 容器中,例如 Tomcat,确保在请求结束后清除 ThreadLocal,因为容器可能会重用线程。
  • 避免长时间存活的线程局部变量:如果一个线程预计会长时间存活而不释放(例如线程池中的线程),那么这种线程中的 ThreadLocal 变量也会长时间存活。在这种情况下,应该特别注意清理这些变量。

  • 不要存储大对象:为了避免内存消耗,不应该在 ThreadLocal 中存储大对象或那些你不打算很快释放的对象。、

  • 考虑使用 InheritableThreadLocal:当需要在一个线程及其所有子线程之间共享一个变量时,可以考虑使用 InheritableThreadLocal。但要注意,如果子线程修改了这个变量,它不会影响到父线程中的值。

  • 考虑线程安全性:虽然 ThreadLocal 变量不需要同步来保证线程安全,但存储在其中的对象仍然可能需要同步,尤其是当多个线程可能访问同一个 ThreadLocal 变量中的同一个实例时(例如,使用 InheritableThreadLocal)。

  • 优先使用库提供的线程局部功能:有些库或框架可能已经提供了其自己的线程局部功能,例如 Java EE 和 Spring。在这种情况下,优先使用库或框架提供的功能,除非有特定的需求使得必须使用原生的 ThreadLocal

  • 不要将 ThreadLocal 作为全局变量:尽量避免将 ThreadLocal 作为静态变量,除非你确实需要这样做。静态的 ThreadLocal 变量可能会导致预料之外的问题,尤其是当类被卸载时。

  • 不建议你在线程池中使用 InheritableThreadLocal,不仅仅是因为它具有 ThreadLocal 相同的缺点——可能导致内存泄露,更重要的原因是:线程池中线程的创建是动态的,很容易导致继承关系错乱,如果你的业务逻辑依赖 InheritableThreadLocal,那么很可能导致业务逻辑计算错误,而这个错误往往比内存泄露更要命

总之,ThreadLocal 是一个有用但需要小心使用的工具。确保了解其工作原理,并始终遵循上述的最佳实践,这样可以最大化其价值并避免潜在的问题。

总结

好了,简单总结一下我们本篇讲述的内容,首先讲述了ThreadLocal是什么以及它的作用是什么,并通过图片展示ThreadLocal模型,知道了ThreadLocal其实就是一个工具类,内部不保存数据,真正保存数据的地方是在Thread本身,也就是我们常说的每个Thread都有一个变量的副本。也介绍了ThreadLocalMap中的Entry[]数组为什么大小一定要限制为2的幂次方,后面通过一段代码简单演示了ThreadLocal的使用,并再次声明了它的优势和其缺点以及使用不到出现的陷阱。讲述过程中提到了父子线程不共享变量副本的问题,而Java提供了InheritableThreadLocal解决这一问题。最终我们罗列了ThreadLocal的最佳实践。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/910165.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于swing的销售管理系统java仓库库存信息jsp源代码mysql

本项目为前几天收费帮学妹做的一个项目&#xff0c;Java EE JSP项目&#xff0c;在工作环境中基本使用不到&#xff0c;但是很多学校把这个当作编程入门的项目来做&#xff0c;故分享出本项目供初学者参考。 一、项目描述 基于swing的销售管理系统 系统有1权限&#xff1a;管…

spring依赖注入详解(上)

一、Bean销毁的过程 如果bean销毁时会执行的场景 1、设置DestroyMethodName为(inferred) // 先把DestroyMethodName设置为(inferred) Component public class TestBeanPostProcessor implements MergedBeanDefinitionPostProcessor {Overridepublic void postProcessMergedBe…

Hive(一)

一、DDL 1、数据库操作 1&#xff09;、创建数据库 语法&#xff1a; CREATE DATABASE [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES (property_nameproperty_value, ...)]; 案例&#xff1a; &#xff08;1&…

vue element-ui 菜单管理使用图标选择器组件

目录 &#x1f31f;前言&#x1f31f;安装&#x1f31f;main.js配置&#x1f31f;页面使用&#x1f31f;效果展示 &#x1f31f;前言 哈喽小伙伴们&#xff0c;本文为大家介绍一下 VueElementUI 中图标选择器组件的使用方法&#xff1b;一起来看下吧。 &#x1f31f;安装 np…

RN 尝鲜之旅

React Native 一直没使用过&#xff0c;闲来无事&#xff0c;还是尝鲜了一下下。 目前还没有出新手村&#xff0c;所以写的东西不一定具有任何参考价值&#xff0c;见谅。 关于 RN 的一些说明 RN 与 R RN 与 R 的区别&#xff1a;来自掘金的一篇文章 RN 与 R 不一样&#xf…

报道 | 9月国际运筹优化会议汇总

封面图来源&#xff1a; https://www.pexels.com/zh-cn/photo/1181406/ 九月召开会议汇总&#xff1a; The 96th meeting of the EURO Working Group on Multiple Criteria Decision Aiding (EWG-MCDA) Location: Paris, France Important dates: Conference: September 202…

嵌入式系统常用的开发板

今天&#xff0c;了解一下常用的开发板&#xff0c;像stm32是最近了解的&#xff0c;esp8266系列是之前大三下上物联网导论课程时候接触的&#xff0c;一些树莓派&#xff0c;Arduino听说过&#xff0c;但了解不多。

MySQL索引常见术语(索引下推、索引覆盖、最左匹配等)

一:背景 我们在面试中都知道,对于MySQL索引是必问的。大家也应该都知道MySQL的数据结构,什么是索引。其中在面试中,面试官也经常问,你做过哪些优化?本文主要是介绍MySQL索引的一些常见术语,比如索引下推、索引覆盖、最左匹配等,这些其实也是MySQL优化的一部分,能够熟练…

谷歌浏览器推出全新功能:可自动检测恶意软件!

近日&#xff0c;谷歌正在测试 Chrome 浏览器的一项新功能。该功能可在已安装的扩展程序从 Chrome 网上商城删除时向用户发出恶意软件提示警告。 在Chrome 应用商店里一直有人源源不断的发布浏览器扩展程序&#xff0c;有很多都会通过弹出式广告和重定向广告进行推广。 这些扩…

社交工程和钓鱼攻击防范: 分析针对人类心理和社交工程的攻击技术,并介绍预防这些攻击的方法

第一章&#xff1a;引言 随着科技的不断进步&#xff0c;网络安全问题愈发凸显。在这个数字化时代&#xff0c;社交工程和钓鱼攻击成为黑客们获取敏感信息的常用手段。这些攻击不是基于技术漏洞&#xff0c;而是利用人类心理弱点来进行。本文将深入探讨社交工程和钓鱼攻击的原…

一个改进型的差分运放分析

在使用单个集成运放构成的加减运算电路时&#xff0c;存在两个缺点&#xff1a;一是电阻的选取和调整不方便&#xff0c;而是对于每个信号源的输入电阻均较小&#xff08;即相对于信号源内阻&#xff0c;电路的输入阻抗较小&#xff09;。 因此可以采用下图的两级电路实现差分比…

Obsidian 入门使用手册

文章目录 一、Obsidian 入门1.1 什么是 Obsidian1.2 安装 Obsidian 二、Obsidian 配置2.1 创建第一个笔记2.2 设置界面语言使用中文2.3 主题 三、小结 一、Obsidian 入门 1.1 什么是 Obsidian Obsidian 是一款基于 Markdown 语法编辑的笔记软件。与传统的 Markdown 软件不同的…

图神经网络与分子表征:1. 分子图和图神经网络基础

CSDN的朋友们大家好&#xff0c;好久没写系列文章了。 近期读了很多图神经网络&#xff08;GNN&#xff09;和分子表征&#xff08;molecular representation&#xff09;的论文&#xff0c;正好最近不是很忙&#xff0c;所以我决定把自己的学习过程记录下来&#xff0c;与大家…

Python 在logging.config.dictConfig()日志配置方式下,使用自定义的Handler处理程序

文章目录 一、基于 RotatingFileHandler 的自定义处理程序二、基于 TimedRotatingFileHandler 的自定义处理程序 Python logging模块的基本使用、进阶使用详解 Python logging.handlers模块&#xff0c;RotatingFileHandler、TimedRotatingFileHandler 处理器各参数详细介绍 …

pandas连接查询

df1数据如下 df2数据如下 连接查询代码 -1 import pandas as pddf1 pd.DataFrame({id:[1001,1002,1003,1004],name:[Hu,Dotu,Evp,Swe]}) df2 pd.DataFrame({id:[1001,1001,1003,1004, 1003],course:[c1,c2,c3,c2,c1],score:[100, 98, 64, 84, 69]})result pd.merge(df1, df…

【C++初阶】vector容器

&#x1f466;个人主页&#xff1a;Weraphael ✍&#x1f3fb;作者简介&#xff1a;目前学习C和算法 ✈️专栏&#xff1a;C航路 &#x1f40b; 希望大家多多支持&#xff0c;咱一起进步&#xff01;&#x1f601; 如果文章对你有帮助的话 欢迎 评论&#x1f4ac; 点赞&#x1…

0007Java程序设计-jsp问卷调查系统设计与实现

摘 要 随着社会不断进步与发展&#xff0c;生活节奏不断加快&#xff0c;信息已经成为我们生活中不可缺少的一部分&#xff0c;很多企业需要掌握大量的信息来了解特定用户的需求&#xff0c;传统的做法是组织大量的人力物力对用户散发调查表&#xff0c;然后对收集的信息进行统…

python 基础篇 day 1 初识变量和数据类型

文章目录 变量变量作用——用于存储和表示数据。变量命名规则命名法大驼峰小驼峰下划体n j i a x 通常作为临时变量使用 建议 变量种类全局变量&#xff08;Global Variables&#xff09;局部变量&#xff08;Local Variables&#xff09;静态变量&#xff08;Static Variables…

linux常用基础命令与文件结构汇总

1 学习目标 说出Linux下的目录结构和常见目录的作用熟练使用Linux下的相对路径和绝对路径熟练使用Linux下常用文件和目录操作相关的命令熟练使用修改用户权限、用户和用户组相关的命令熟练使用文件的查找和检索相关的命令熟练掌握Ubuntu下的软件安装和卸载熟练使用压缩工具完成…

七夕节日表白:七大网页风格与其适用人群

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…