学内核之十五:应用层如何实现原子访问

news2025/1/3 2:46:32

在Linux应用层开发中,使用的锁大多都是基于Posix提供的版本。其中,锁的实现,是基于futex调用来完成的,而futex建立在原子访问和内核系统调用上。通过查阅相关资料,发现futex不完全是内核层的实现,如果锁未被占用,则该调用在应用层完成。只有在锁已被其他任务占用,需要将当前任务挂起睡眠时,才通过系统调用进入内核,由内核完成挂起的操作。

在判断锁是否占用时,会涉及原子访问的问题。但是,这个在应用层如何实现?对于内核层,我们知道,原子操作是基于处理器的专用指令来完成的。比如,对于ARMv7,提供了LDREX和STREX分别用于内存数据的加载和存储。在这两个指令之间的数据修改,硬件可以保证是原子的。具体的实现,可以参考博文:

学内核之七:问题三,全局变量加锁与每CPU变量_龙赤子的博客-CSDN博客_全局变量加锁。

回到开头提的问题,在应用层如何实现类似的原子访问?是否也是通过上述指令?我们来具体实践一下,看看结果如何。

通过查找资料(https://gcc.gnu.org/onlinedocs/gcc/_005f_005fsync-Builtins.html#index-_005f_005fsync_005ffetch_005fand_005fadd),发现编译器提供了类似的接口函数,也就是如下一系列函数接口

__sync_fetch_and_##OP##

__sync_##OP##_and_fetch

这里的OP,可以是add、sub、or、and、xor等等。分别对应了不同的运算逻辑。

很多资料都提到了用上述接口实现原子访问。于是,在程序中使用上述接口,实现一个访问共享全局变量的小程序,然后反汇编,检查一下上述接口是否用的是处理器特定的指令。比如,ARMv7的LDREX/STREX类指令。

为了方便汇编分析,例子代码很短很简单。我们随便找了上述一个接口,来测试验证。如下:

基于ARM32平台编译上述代码。

使用objdump反汇编以后,结果如下:

汇编中,如上图133、134行所示,将全局变量的地址放入r0寄存器,将常量1放入r1寄存器,这两个寄存器作为参数,调用sync接口。该接口的反汇编代码如下:

在上述代码里,首先寄存器入栈。然后将10a70位置的内存数据0xffff0fc0存入r7寄存器中。之后通过寄存器操作,将参数传递进来的常量地址处的内容再次存入r0寄存器,跟r6保存的常量进行运算,结果再次存入r1寄存器。并在582行处,执行blx r7(注意,此时,r0和r1寄存器保存了新的参数)。之后,比较r0和0,如果不相等,就继续跳转到10a4c,进行循环处理和判断。否则,将r4的内容放到r0,作为返回值,返回。

可以看到,上面没有明确的LDREX/STREX类指令调用。难道跟上述指令无关?那应用层是如何实现原子操作的?另外,我们也注意到,582行的汇编指令看着有点奇怪。为啥要跳转到r7寄存器位置处?r7寄存器的内容是0xffff0fc0,这个内容有什么特别吗?

暂时放下上面的疑问,我们去看看上述sync函数的实现。下载了一份gcc的源码,搜索了一下,找到了上述函数的定义。

初看,能跟上面的汇编对应上。

这里关键的代码就是

failure = __kernel_cmpxchg (tmp, PFX_OP (tmp INF_OP val), ptr);

这里的__kernel_cmpxchg定义如下:

从字面意义来看,是需要借助内核进行比较和交换。另外,关键的,这里出现了上面汇编里的那个魔术数字0xffff0fc0。将其转换为函数指针变量并调用。

到这里,大概就可以猜到,应用层应该是跳转到这样一个特殊地址,由内核辅助完成了原子操作。这个地址这么特殊,内核里一定有对应的处理。内核应该是给应用开了一个口子。我们可以到内核代码里找找看。这里是针对arm平台,只需要搜索arm平台的目录即可。

在内核代码里查找,发现确实有相关定义

答案越来越近了。为了简便起见,我们直接看内核的汇编代码,跳过上面的各种伪代码。

直接在汇编代码中搜索__kuser_cmpxchg,发现,确实有相关函数定义。且其中使用了LDREX/STREX类指令。至此,答案就基本清楚了。应用层的原子操作,还是通过处理器特定的指令实现的。只不过这个路径,走的有点绕。

额外的,我们看到,__kuser_cmpxchg接口中还加了dmb屏障指令。指令的参数为11,是什么含义呢?对此,我们可以从arm手册中找到答案。

从上图可以看到,参数11对应的是ISH,也就是CPU内部核心和内存之间的数据读写,需要保证一致。这里,就是要保证这个“原子变量”的值在大家眼里是一样的,不能不同核心看到的不一样。

至此,问题就说清楚了。只不过这种实现方式,似乎不是系统调用的模式。显然,这种方式,比起锁等其他实现方式,效率要高很多。

上面的说明中,注意到,0xffff0fc0这个地址是内核空间地址,应用层直接调用这个地址,那么就绕过了内核系统调用,这一点是如何做到的?按说,应用层代码访问内核空间地址时,内核会检测到,并作出处理,这里是如何放过的,于是准备使用qemu调试一下内核,看看系统调用是如何被绕过的?难道内核有特殊检查?

但是,当我用虚拟机里的另一个交叉编译环境编译后,发现汇编代码差异比较大,如下图所示:

看到直接调用了LDREX和STREX指令。简单直接,直达目的。仔细一想也是,就是一个指令的问题,为啥要绕那么个弯子呢?以后有机会再研究吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2043.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图像生成1

搬来好东西啊 ~~ 模型模型来源论文ProGANhttps://sota.jiqizhixin.com/project/0190e1fa-5643-4043-8b75-9b863a6d20db 支持框架:TensorFlowProgressive Growing of GANs for Improved Quality, Stability, and VariationStyleGANhttps://sota.jiqizhixin.com/proj…

c++ SFML 连接ftp

#include <string> #include <SFML/Network.hpp> using namespace std; void loginftp() { // TODO: 在此添加控件通知处理程序代码 sf::IpAddress address "127.0.0.1"; sf::Ftp server; sf::Ftp::Response connectResponse server…

CMake中include的使用

CMake中的include命令用于从文件或模块(file or module)加载并运行CMake code。其格式如下&#xff1a; include(<file|module> [OPTIONAL] [RESULT_VARIABLE <var>][NO_POLICY_SCOPE]) 从给定的文件加载并运行CMake code。变量读写访问调用者的范围(Variable rea…

React-Router之BrowserRouter 与 HashRouter切分方式和基本概念

查看本文 首先 你要对React-Router有一个基本了解 如果不清楚可以查看我的文章 初识react-router 做一个简单的路由切换 然后我们代码是这样 这里 我们有两个路由 对应两个组件 可以看到 我们的形式是 /路由代理名 但我们来看一个京东到家的界面 http://www.jddj.com/#/ …

传输层——UDP+TCP

文章目录传输层UDP协议UDP 概述UDP协议的报文UDP主要特点UDP使用注意事项基于UDP的应用层协议TCP协议TCP 概述TCP报文格式确认应答机制(最重要的机制)TCP协议的缓冲区问题16位窗口大小6个标记位①ACK②SYN③RST④PSH⑤URG⑥FIN三次握手四次挥手超时重传机制连接管理机制——状态…

【线性代数】P2 行列式的性质

本博客内容为&#xff1a;记录行列式的所有性质与推理 性质一&#xff1a;行列式的转置值不变 DDTDD^TDDT 性质二&#xff1a;行列式两行/列互换&#xff0c;值变号 D−D′D-DD−D′ 性质三&#xff1a;行列式中两行相等&#xff0c;值为0 D−D′−D,即2D0,D0D-D-D,即2D0,D0D−…

如何打开iso文件

iso文件用什么打开? iso文件用什么打开 ①使用光驱可以打开iso文件 iso文件是一种光盘(CD)上的系统文件格式&#xff0c;因此我们只需要将iso文件写入到光盘当中&#xff0c;然后用光驱打开光盘即可安装iso文件软件了&#xff0c;目前我们常购买的光盘系统盘就是商家将制作…

UNIAPP实战项目笔记30 购物车内容块布局

UNIAPP实战项目笔记30 购物车内容块布局 主要代码: 主要代码 shopcart.vue <template><view class"shop-view"><!-- 自定义导航栏 --><uniNavBartitle"购物车":rightText" isNavBar ? 完成 : 编辑"fixed"true&quo…

SSM学习42:SpringMVC入门案例(重点)

目录 创建SpringMVC项目 目录 补全目录结构 &#xff1a;添加java项结构 导入jar包 添加tomcat运行快捷键 创建配置类 SpringMvcConfig.class 创建Controller类 使用配置类ServletConfig替换web.xml 运行结果 因为SpringMVC是一个Web框架&#xff0c;将来是要替换Servl…

HTML5期末大作业【红色的电影售票平台网站】web前端 html+css+javascript网页设计实例 企业网站制作

HTML实例网页代码, 本实例适合于初学HTML的同学。该实例里面有设置了css的样式设置&#xff0c;有div的样式格局&#xff0c;这个实例比较全面&#xff0c;有助于同学的学习,本文将介绍如何通过从头开始设计个人网站并将其转换为代码的过程来实践设计。 文章目录一、网页介绍一…

死磕JAVA10余年,呕心整理出了核心知识点已经做成PDF,无私奉献

前言&#xff1a; 想在面试、工作中脱颖而出&#xff1f;想在最短的时间内快速掌握 Java 的核心基础知识点&#xff1f;想要成为一位优秀的 Java 工程师&#xff1f;本篇文章能助你一臂之力&#xff01; 目前正值招聘求职旺季&#xff0c;很多同学对一些新技术名词都能侃侃而…

代码应该怎么写?

目录 前言 代码执行流程 模型图 代码应该怎么写&#xff1f; 前言 编码时&#xff0c;始终牢记两个要点&#xff1a;1、主流程 2、异常监听。 代码执行流程 模型图 代码执行流程&#xff1a;1、正常执行&#xff1b; 2、异常执行。 老规矩&#xff0c;首先在脑海中建立一…

函数高级 — 默认参数、占位参数、函数重载

目录 一、函数默认参数 二、函数占位参数 三、函数重载 1&#xff09;函数重载概述 2&#xff09;函数重载的注意事项&#xff08;坑&#xff09; 一、函数默认参数 在C中&#xff0c;函数形参列表&#xff08;函数声明和函数定义中的参数列表&#xff09;中的形参是可以有…

六十七、Vue-CLI

一 Vue-CLI 项目搭建 vue的脚手架&#xff1a;快速帮我们创建出vue的项目 1.安装nodejs 官网&#xff1a;https://nodejs.org/zh-cn/2.安装cnpm npm install -g cnpm --registryhttps://registry.npm.taobao.org3.安装vue-cli &#xff0c;通过脚手架创建vue项目 cnpm instal…

stm32f103c6t6下的HAL库搭建三种低功耗模式

目录三种低功耗模式介绍睡眠模式&#xff08;sleep mode&#xff09;停止模式&#xff08;stop mode&#xff09;待机模式&#xff08;standby mode&#xff09;前言:最近朋友所托&#xff0c;需要一个可以持续运作至少一天的计数器&#xff0c;我感觉头大&#xff0c;因为之前…

数据结构与算法——栈的表示和实现

&#x1f353;个人主页&#xff1a;bit.. &#x1f352;系列专栏&#xff1a;Linux(Ubuntu)入门必看 C语言刷题 数据结构与算法 目录 1.栈的抽象数据类型的定义 2.顺序栈的表示和实现​编辑 3.顺序栈的初始化 4.判断栈是否为空 5.求顺序栈的长度 6.清空顺序栈 7…

TIDB简介及基础架构

1. 什么是TIDB TiDB 是一个分布式 NewSQL 数据库。它支持水平弹性扩展、ACID 事务、标准 SQL、MySQL 语法和 MySQL 协议&#xff0c;具有数据强一致的高可用特性&#xff0c;是一个不仅适合 OLTP 场景还适合 OLAP 场景的混合数据库。 1.1 什么是NewSQL SQL&#xff0c;传统关…

Kubernetes基础_03_ReplicaSet全解析

系列文章目录 文章目录系列文章目录前言一、创建ReplicaSet1.1 ReplicatSet的三个属性1.2 从ReplicaSet看Pod1.3 从Pod看ReplicaSet1.4 ReplicaSet属性分析ReplicasPod 选择算符Pod 模板二、使用ReplicaSet2.1 删除 ReplicaSet操作2.1.1 删除 ReplicaSet 和它的 Pod2.1.2 只删除…

随便给你一个页面 你该如何去给他布局呢 各位思考一下 ?

随便给你一个页面 你该如何去给他布局呢 各位思考一下 &#xff1f; 学习知识靠的是直接主动去学 不是 被动接受我给出的答案: 化繁为简 &#xff0c;化简为繁 在学习任何知识体系中都是如此 先学习这类知识的知识点 然后用一个案例或者是多个案例实操起来 在写页面时大多数人…

对话张璐:硅谷正在追逐两大赛道创新,融资降温但技术商业化更快了

LG 发自 凹非寺量子位 | 公众号 QbitAI什么是硅谷的New Sexy&#xff1f;张璐这次脱口而出介绍的是Mojo Vision和纳米机器人。前者随着元宇宙概念的火热越来越出圈&#xff0c;后者则跟随医疗AI和机器人深入而展现更大作用。Mojo Vision&#xff0c;AR眼镜&#xff0c;隐形佩戴…