线程局部存储(TLS)

news2024/10/1 7:36:01

线程局部存储(Thread Local Storage,TLS),是一种变量的存储方法,这个变量在它所在的线程内是全局可访问的,但是不能被其他线程访问到,这样就保持了数据的线程独立性。而熟知的全局变量,是所有线程都可以访问的,这样就不可避免需要锁来控制,增加了控制成本和代码复杂度。

一、C/C++编程接口

POSIX线程库提供了如下API管理TLS:

// 创建一个TLS变量,并设置析构函数
int pthread_key_create(pthread_key_t *key, void (*destructor)(void*));
// 回收TLS变量,但是注意并不调用TLS的析构函数
int pthread_key_delete(pthread_key_t key);
// 获取TLS变量的当前值
void *pthread_getspecific(pthread_key_t key);
// 给TLS变量赋值
int pthread_setspecific(pthread_key_t key, const void *value);

除了上面API的方式,GCC的编译器也支持语言级别的用法,这样比用API调用,更简单。使用 __thread 关键字可将变量声明为线程局部变量,如下例所示:

__thread int i;
__thread char *p;
__thread struct state s;

使用GCC编译级别支持的方式来实现TLS的一个Demo:

// 编译:g++ main.cc -lpthread
#include<iostream>
#include<pthread.h>
#include<unistd.h>

using namespace std;
__thread int iVar = 100;

void* Thread1(void *arg)
{
    iVar += 200;
    cout<<"Thead1 Val : "<<iVar<<endl;
}

void* Thread2(void *arg)
{
    iVar += 400;
    sleep(1);
    cout<<"Thead2 Val : "<<iVar<<endl;
}

int main()
{
    pthread_t pid1, pid2;
    pthread_create(&pid1, NULL, Thread1, NULL);
    pthread_create(&pid2, NULL, Thread2, NULL);

    pthread_join(pid1, NULL);
    pthread_join(pid2, NULL);

    return 0;
}

在循环优化期间,编译器可根据需要选择创建临时线程局部变量。

适用性
__thread 关键字可以应用于任何全局变量、文件作用域静态变量或函数作用域静态变量。它对于始终是线程局部变量的自动变量没有影响。

初始化
在 C++ 中,如果初始化需要静态构造函数,将无法初始化线程局部变量。否则,可以将线程局部变量初始化为对于普通静态变量合法的任何值。无论是线程局部变量还是其他变量,都不能静态地初始化为线程局部变量的地址。

绑定
线程局部变量可以在外部声明和引用。线程局部变量遵循与普通符号相同的插入规则。

二、ELF中的TLS节

代码中所有的全局变量都存储在.data(静态初始化变量)和.bss(未静态初始化的变量)这两个段。而TLS变量存储位置有所不同:

  • 已初始化的线程局部变量分配在 .tdata.tdata1 节中,节类型为SHT_NOBITS,节属性为SHF_ALLOC + SHF_WRITE + SHF_TLS。此初始化可能需要重定位。
  • 未初始化的线程局部变量定义为 COMMON 符号,最终分配在 .tbss 节中进行,节类型为SHT_PROGBITS,节属性为SHF_ALLOC + SHF_WRITE + SHF_TLS

.data不一样的是,运行时程序不会直接访问这些TLS段。在分配了任何已初始化的节后会立即分配未初始化的节,并进行填充以便正确对齐(内存中.tbss紧跟在.tdata后)。

.tdata.tbss合并的节一起构成 TLS 模板,每次创建新线程时,都会使用此模板分配 TLS,所以每个线程启动时TLS都是相同的。此模板的已初始化部分称为 TLS 初始化映像。所有因已初始化的线程局部变量而生成的重定位将应用于此模板。当新线程需要初始值时,将使用重定位的值。

每个线程的TLS块都是运行时分配的,所以在链接时是不知道其地址的,要访问TLS变量必须借助动态链接器才能计算出其地址。链接时只能知道TLS变量在TLS段中的偏移。

TLS 符号的符号类型为 STT_TLS,这些符号表示相对于 TLS 模板开头的偏移量,而不是实际的虚拟地址。TLS 符号指向 TLS 模板的开头,而不是每个数据项的每个线程副本。在exec文件和共享目标文件中,对于已定义的 TLS 符号,其 st_value 字段包含指定的 TLS 偏移量,而对于未定义的 TLS 符号,此字段通常包含零。

访问 TLS 符号通常需要进行重定位,以便在运行时能够正确地计算 TLS 数据的地址。这些重定位引用 STT_TLS 类型的符号,并且还可以引用与 GOT 项关联的局部节符号。

对于根据 TLS 项进行的重定位,重定位地址在 TLS 模板的末尾编码为负偏移。计算该偏移时,首先将模板大小舍入到 32 位目标文件中最接近的 8 字节边界,然后舍入为 64 位目标文件中最接近的 16 字节边界。此舍入操作确保静态 TLS 模板合理对齐以便可用于任何用途。

在exec文件和共享目标文件中,PT_TLS 程序项用于描述 TLS 模板。此模板包含以下成员:

成员
p_offsetTLS 初始化映像的文件偏移
p_vaddrTLS 初始化映像的虚拟内存地址
p_paddr0
p_fileszTLS 初始化映像的大小
p_memszTLS 模板的总大小
p_flagsPF_R
p_alignTLS 模板的对齐方式

三、TLS运行时分配

在程序的生命周期中,会在三个时间创建 TLS。

  • 程序启动时。
  • 创建新线程时。
  • 程序启动后装入共享目标文件之后,线程第一次引用 TLS 块时。

3.1 TLS布局结构

运行时线程局部数据存储的布局如下图所示。

在这里插入图片描述

线程指针

每个线程 t 都有一个关联的线程指针 t p t tp_t tpt ,该指针指向线程控制块 TCB。线程指针 tp 始终包含当前正在运行的线程的 t p t tp_t tpt 值。

TLS模块偏移

动态链接器将exec文件装载之后,假设与exec文件相关联的动态库有多m个(再假设每个都有TLS模块),所以也就会有m + 1个模块(一个是exec的,假设其有)。动态链接器会将这些模块合并成单个静态模板,在合并的模板中,为每个动态目标文件(exec和共享库)的 TLS模板指定一个偏移 t l s o f f s e t m tlsoffset_m tlsoffsetm

t l s o f f s e t 1 = r o u n d ( t l s s i z e 1 , a l i g n 1 ) tlsoffset_1 = round(tlssize_1, align_1 ) tlsoffset1=round(tlssize1,align1)
t l s o f f s e t m + 1 = r o u n d ( t l s o f f s e t m + t l s s i z e m + 1 , a l i g n m + 1 ) tlsoffset_{m+1} = round(tlsoffset_m + tlssize{m+1}, align_{m+1}) tlsoffsetm+1=round(tlsoffsetm+tlssizem+1,alignm+1)

动态线程向量

动态线程向量(Dynamic Thread Vector,dtv)是在多线程程序中用于管理线程局部存储(TLS)的数据结构之一。每个线程都有一个 dtv,用于存储该线程的 TLS 变量的地址列表。dtv 是一个数组或指针数组,其中的每个元素都指向一个 TLS 变量的地址,这些地址通常相对于线程基址或线程指针(TP)进行偏移(可通过tp + tlsoffset进行访问)。

线程库为当前线程 t 创建一个指针向量 d t v t dtv_t dtvt。每个向量的第一个元素都包含一个生成编号 g e n t gen_t gent,该生成编号用于确定需要扩展向量的时间。 d t v t , m dtv_{t,m} dtvt,m 向量中剩余的每个元素都是一个指针,指向为属于动态目标文件 m 的 TLS的块的地址。

分配模型

有些模块的TLS块跟TCB放在一起,是程序启动时就分配 的(如exec及其依赖的.so),称为静态模型;有些模块是程序运行中动态加载的(通过dlopen()动态加载), TLS块在线程第一次访问时分配,称为动态模型

对于静态模型,在程序启动时动态链接器就可以确定其相对于 t p t tp_t tpt 的偏移值,如 t l s o f f s e t 1 、 t l s o f f s e t 2 、 t l s o f f s e t 3 tlsoffset_1、tlsoffset_2、tlsoffset_3 tlsoffset1tlsoffset2tlsoffset3,编译器生成代码时可以直接使用这些偏移值来访问。

对于动态模型,线程库将延迟分配 TLS 块。分配将在第一次引用已装入的目标文件中的 TLS 变量时进行,需要调用运行时系统提供的__tls_get_addr()获取其地址,如 t l s o f f s e t 4 、 t l s o f f s e t 5 tlsoffset_4、tlsoffset_5 tlsoffset4tlsoffset5

3.2 延迟分配TLS

对于延迟分配的TLS,由于其偏移值在启动时未知,必须借助于__tls_get_addr()获取,定义类似如下:

struct tls_index {
    size_t module_id;
    size_t offset;
};

void* __tls_get_addr(struct tls_index* ti)
{
    // Get the DTV of current thread.
    dtv_t* dtv = GET_CURRENT_DTV();

    // Check if the DTV is stale, and if so, update it.
    if (dtv[0].counter != dl_tls_generation) {
        update_dtv();
    }

    // Get the TLS block. If not allocated yet, allocate now.
    char* tls_block = dtv[ti->module_id];
    if (tls_block == UNALLOCATED_TLS_BLOCK) {
        tls_block = dtv[ti->module_id] = allocate_tls(module_id);
    }

    return tls_block + ti->offset;
}

module_id是模块ID,由动态链接器在加载模块时分配,从1开始(exec文件的模块ID固定是1)。

当动态加载或卸载一个模块时,动态链接器维护的dl_tls_generation会加1,表示模块信息有了变化。由于每个线 程的DTV时延迟更新的,所以每个线程的dtv[0]也会维护自己的generation counter,用于在访问TLS时判断 是否需要更新DTV。

四、TLS的访问模型

每个 TLS 引用都遵循下列访问模型之一。这些模型按照最常见、但最少优化到速度最快、但限制最大的顺序列出。要访问TLS变量需要确定两个信息:

  • 定义TLS变量的模块(可执行程序exec或动态共享库.so)。
  • TLS变量在该模块的TLS段的偏移。

4.1 常规动态 (General Dynamic, GD)-动态 TLS

此模型允许从共享目标文件或exec文件中引用所有 TLS 变量。如果是第一次从特定线程引用 TLS 块,此模型还支持延迟分配此块。

这种模式下不需要链接时知道模块ID和 偏移值。程序启动时动态链接器通过重定向确定模块ID和TLS变量的偏移值,存储在GOT表中。在访问TLS时调用 __tls_get_addr(),传入这两个参数,获取TLS变量的地址。

4.2 局部动态 (Local Dynamic, LD)-局部符号的动态 TLS

此模型是对 GD 模型的优化。编译器可能会确定变量在要生成的目标文件中是局部绑定或受到保护的。在这种情况下,编译器将指示链接器静态绑定动态的 tlsoffset 并使用此模型。与 GD 模型相比,此模型可提供更好的性能。每个函数只需要调用一次 tls_get_addr() 即可确定 d t v 0 , m dtv_{0,m} dtv0,m 的地址。进行链接编辑时绑定的动态 TLS 偏移会与每个引用的 d t v 0 , m dtv_{0,m} dtv0,m 地址相加。

如果链接器确定访问的TLS变量属于本模块(如文件作用域的TLS变量),则采用此模型。TLS变量的偏移值在链接时即可确定,只需要调用__tls_get_addr()确定TLS块的地址即可。由于TLS块的地址可以在不同的本地TLS变量访问时复用,所以相比于GD模型编译器可利用此模型生成有效的代码减少对__tls_get_addr()的调用次数。

4.3 初始可执行 (Initial exec文件utable, IE)-具有指定偏移的静态 TLS

此模型只能引用初始静态 TLS 中包含的 TLS 变量。此模板由进程启动时可用的所有 TLS 块和一个小的备份预留空间组成。在此模型中,给定变量 x 相对于线程指针的偏移存储在 x 的 GOT 项中。

此模型可以从初始进程启动后通过延迟装入、过滤器或 dlopen() 装入的共享库中引用有限数量的 TLS 变量。该访问可通过固定的备份预留空间来实现。此预留空间只能为未初始化的 TLS 数据项提供存储空间。为实现最大的灵活性,共享目标文件应使用动态的 TLS 模型引用线程局部变量。

如果可以确定访问的TLS变量在程序启动时就已分配好,则采用此模型。TLS变量相对于线程寄存器的偏移量可在程序启动时由动态链接器计算好存放在GOT表中。访问TLS变量相当于一次间接地址访问,不需要调用__tls_get_addr()

4.4 局部可执行 (Local exec文件utable, LE)-静态 TLS

此模型只能引用exec文件的 TLS 块中包含的 TLS 变量。链接器静态地计算相对于线程指针的偏移,而不需要进行动态重定位或额外引用 GOT。此模型不能用于引用exec文件外部的变量。

如果可以确定在exec文件中访问exec文件定义的TLS变量,则采用此模型。链接时即可知道TLS变量相对于线程寄存器的偏移量, 计算其地址相当于寄存器加上一个常量,因此访问TLS变量与访问局部变量没有区别。

4.5 模式转换

链接器可以将代码从更常规的访问模型转换为更优化的模型(如果确定适合进行转换)。这种转换可以使用独特的 TLS 重定位来实现。这些重定位不仅请求执行更新,还会标识要使用的 TLS 访问模型。

链接器在了解 TLS 访问模型和要创建的目标文件类型后,便可执行转换。例如,如果一个可重定位目标文件使用 GD 访问模型,被链接到一个exec文件中。在这种情况下,链接器可以适当地使用 IE 或 LE 访问模型转换引用。然后执行模型所需的重定位。

下图说明了不同的访问模型,以及从一个模型到另一个模型的转换。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1549921.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2014年认证杯SPSSPRO杯数学建模C题(第一阶段)土地储备方案的风险评估全过程文档及程序

2014年认证杯SPSSPRO杯数学建模 C题 土地储备方案的风险评估 原题再现&#xff1a; 土地储备&#xff0c;是指市、县人民政府国土资源管理部门为实现调控土地市场、促进土地资源合理利用目标&#xff0c;依法取得土地&#xff0c;进行前期开发、储存以备供应土地的行为。土地…

⼗多种免费Unity VR资源⼯具

1、VRTK是⼀种⾼效的VR⼯具包&#xff0c;⽤于在Unity3d中快速构建VR解决⽅案VRTK - Virtual Reality Toolkit - [ VR Toolkit ] | Integration | Unity Asset StoreUse the VRTK - Virtual Reality Toolkit - [ VR Toolkit ] from Sysdia Solutions Ltd on your next project.…

PyTorch-----torch.nn.Softmax()函数

Softmax原理 Softmax 函数是一种常用的激活函数&#xff0c;通常用于多分类问题中。它将一个含有多个实数值的向量&#xff08;通常称为 logits&#xff09;转换成一个概率分布&#xff0c;使得每个元素都在 (0, 1) 区间内&#xff0c;并且所有元素的和为 1。 假设我们有一个实…

YOLOv5实战记录02 模型检测

本人记录打卡&#xff0c;不够自习&#xff0c;慎看。 今天主要学了计组和计网&#xff0c;YOLO简单打个卡。 指路大佬&#xff1a;【手把手带你实战YOLOv5-入门篇】YOLOv5 模型检测_哔哩哔哩_bilibili 1. 主要讲了几个关键参数&#xff1a; 图源你可是处女座 运行示例&#…

iOS17 隐私协议适配详解

1. 背景 网上搜了很多文章&#xff0c;总算有点头绪了。其实隐私清单最后做出来就是一个plist文件。找了几个常用三方已经配好的看了看&#xff0c;比着做就好了。 WWDC23 中关于隐私部分的更新&#xff08;WWDC23 隐私更新官网&#xff09;&#xff0c;其中提到了第三方 SDK 的…

SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

产品概述 Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品&#xff0c;支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据&#xff0c;已应用于数百家企业生产&#xff0c;也是首个由国人主导贡献到 Apache 基金会的数据集成顶级项目。 SeaTunnel 主…

阿里云ubuntu服务器搭建可视化界面

连接终端 最好初始化服务器的时候 不要以root权限创建 否则会出错 1更新软件: sudo apt-get update2安装ubuntu desktop : sudo apt-get install ubuntu-desktop3 配置ubuntu desktop并重启: sudo apt-get -f install sudo dpkg-reconfigure ubuntu-desktop sudo reboot4 su…

STM32使用HAL库SPI驱动W25Q16 使用FATFS文件系统+USB虚拟U盘

概述 使用stm32F407驱动W25Q16&#xff0c;使用FATFS文件系统&#xff0c;USB虚拟优盘功能&#xff0c;W25Q16一共512个扇区&#xff0c;其中128作为flash存取相关数据&#xff0c;其他的384个扇区用作虚拟U盘使用 CubeMax配置过程 代码 W25Q16.c /***********************…

【深度学习】语义分割(FCN网络/DeepLabV3网络)学习记录

up主学习视频地址&#xff1a; 【语义分割前言】 https://www.bilibili.com/video/BV1ev411P7dR/?share_sourcecopy_web&vd_source49d7ac1e09d11f99978e8cf36c8bad41 这个up主真的很厉害&#xff0c;宝藏up主呀&#xff01;&#xff01;&#xff01; 常见语义分割评价指…

强化安全防护:升级桌面网管软件提升医院信息系统安全

在当今信息化发展的时代&#xff0c;医院作为重要的医疗服务机构&#xff0c;对终端设备的管理尤为重要。然而&#xff0c;随着国家对医院终端管理的要求日益提高&#xff0c;传统的桌面网管软件已经难以满足现代医院的需求。针对这一现状&#xff0c;升级桌面网管软件已成为当…

喜报|珈和科技入选2023“武汉未来之星TOP100”

近日&#xff0c;由清科创业旗下创业与投资资讯平台——“投资界”发起评选的《2023武汉未来之星TOP100》《2023武汉龙门榜TOP30》两大企业评选结果在武汉市举办的“科创点金汇投融资对接会”上隆重揭晓&#xff0c;珈和科技成功入选“2023武汉未来之星TOP100”榜单。 此次榜…

Unity角色多人同步

1.位置同步和状态同步&#xff1a;需要同步的节点上挂载脚本&#xff1a; gameObject.AddComponent<SyncTransform>(); ; //同步gameObject.GetComponent<SyncTransform>().syncId SyncUtilFunc.GetRoleSyncId(PlayerData.Instance.PlayerId); //同步gameObject.G…

PyTorch----torch.nn.init.kaiming_normal_

神经网络为什么要进行权重初始化&#xff1f; 神经网络进行权重初始化的目的在于促进网络的有效训练和收敛。正确的权重初始化可以帮助缓解梯度消失或梯度爆炸等问题&#xff0c;并且有助于加速训练过程。以下是权重初始化的几个重要原因&#xff1a; 1. **避免梯度消失或梯度…

锂离子电池SOC预测 | python代码实现基于Basisformer时间序列锂离子电池SOC预测研究

概述 基于Basisformer时间序列的锂离子电池SOC(State of Charge,即电池的荷电状态)预测研究,是一项结合深度学习和时间序列分析的前沿技术。该研究的目的是利用Basisformer模型对锂离子电池的SOC进行准确预测,从而提高电池使用效率,延长电池寿命,并优化能源管理系统。 …

unity学习(73)——服务器异常--无法处理 123类型的数据包

服务器发送回的数据包&#xff0c;客户端根本读不出来&#xff0c;type都读不出来&#xff0c;拖了三天&#xff0c;把客户端翻了个底朝天&#xff0c;发现客户端一点问题都没有&#xff01; 所有的问题不是unity的模型问题&#xff0c;就是socket网络通信中断&#xff01; 1…

大文件压缩多个小文件

压缩 压缩后 压缩后&#xff0c;符合上传大小规范

矢量(向量)数据库

矢量(向量)数据库 什么是矢量数据库&#xff1f; 在人工智能领域&#xff0c;大量的数据需要有效的分析和处理。随着我们深入研究更高级的人工智能应用&#xff0c;如图像识别、语音搜索或推荐引擎&#xff0c;数据的性质变得更加复杂。这就是矢量数据库发挥作用的地方。与存…

Kafka详细教程(一)

总体目录 1、什么是消息队列 消息队列&#xff0c;英文名&#xff1a;Message Queue&#xff0c;经常缩写为MQ。从字面上来理解&#xff0c;消息队列是一种用来存储消息的队列 。来看一下下面的代码 // 1.创建一个保存字符串的队列Queue<String> queue new LinkedList&…

ssm小区车库停车系统开发mysql数据库web结构java编程计算机网页源码eclipse项目

一、源码特点 ssm小区车库停车系统是一套完善的信息系统&#xff0c;结合springMVC框架完成本系统&#xff0c;对理解JSP java编程开发语言有帮助系统采用SSM框架&#xff08;MVC模式开发&#xff09;&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模…

开源博客项目Blog .NET Core源码学习(12:App.Application项目结构分析)

开源博客项目Blog的App.Application项目主要定义网站页面使用的数据类&#xff0c;同时定义各类数据的增删改查操作接口和实现类。App.Application项目未安装Nuget包&#xff0c;主要引用App.Core项目的类型。   App.Application项目的顶层文件夹如下图所示&#xff0c;下面逐…