嵌入式Linux应用开发-驱动大全-同步与互斥①

news2024/11/18 17:54:16

嵌入式Linux应用开发-驱动大全-同步与互斥①

  • 第一章 同步与互斥①
    • 1.1 内联汇编
      • 1.1.1 C语言实现加法
      • 1.1.2 使用汇编函数实现加法
      • 1.1.3 内联汇编语法
      • 1.1.4 编写内联汇编实现加法
      • 1.1.5 earlyclobber的例子
    • 1.2 同步与互斥的失败例子
      • 1.2.1 失败例子1
      • 1.2.2 失败例子2
      • 1.2.3 失败例子3

第一章 同步与互斥①

在这里插入图片描述

1.1 内联汇编

要深入理解 Linux内核中的同步与互斥的实现,需要先了解一下内联汇编:在 C函数中使用汇编代码。
现代编译器已经足够优秀,大部分的 C代码转成汇编码后,效率都很高。但是有些特殊的算法需要我们手工优化,这时就需要手写汇编代码;或是有时需要调用特殊的汇编指令(比如使用 ldrex/strex实现互斥访问),这都涉及内联汇编。
实际上你完全可以不使用内联汇编,单独写一个遵守 ATPCS规则的汇编函数,让 C函数去调用它。但是在 C函数中写汇编代码,可以不用另外新建一个汇编文件,比较方便。
内联汇编的完整语法比较复杂,可以参考这 3篇文章:
① GNU C扩展汇编 https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html
② ARM GCC 内嵌(inline)汇编手册 http://blog.chinaunix.net/uid-20543672-id-3194385.html
③ C内联汇编 https://akaedu.github.io/book/ch19s05.html
这 3章文章写得细致而深入,也有些难以理解。你跟着我们的视频或文档,就可以掌握到足够的知识。 下面举 3个例子说明汇编函数、用 C函数中使用内联汇编的方法。

1.1.1 C语言实现加法

使用 GIT下载后,源码在“07_驱动大全\source\01_inline_assembly\01_c_code\main.c”:

01 #include <stdio.h> 
02 #include <stdlib.h> 
03 
04 int add(int a, int b) 
05 { 
06      return a+b; 
07 } 
08 
09 int main(int argc, char **argv) 
10 { 
11      int a; 
12      int b; 
13 
14      if (argc != 3) 
15      { 
16              printf("Usage: %s <val1> <val2>\n", argv[0]); 
17              return -1; 
18      } 
19 
20      a = (int)strtol(argv[1], NULL, 0); 
21      b = (int)strtol(argv[2], NULL, 0); 
22 
23      printf("%d + %d = %d\n", a, b, add(a, b)); 
24      return 0; 
25 } 

上面的 add函数代码最简单,但是对应的汇编也挺复杂:需要入栈、出栈等操作,效率不算高。看看test.dis:

266 00010404 <add>: 
267    10404:   b480            push    {r7} 
268    10406:   b083            sub     sp, #12 
269    10408:   af00            add     r7, sp, #0 
270    1040a:   6078            str     r0, [r7, #4] 
271    1040c:   6039            str     r1, [r7, #0] 
272    1040e:   687a            ldr     r2, [r7, #4] 
273    10410:   683b            ldr     r3, [r7, #0] 
274    10412:   4413            add     r3, r2                // 真正实现加法的只有这条指令 275    10414:   4618            mov     r0, r3 
276    10416:   370c            adds    r7, #12 
277    10418:   46bd            mov     sp, r7 
278    1041a:   f85d 7b04       ldr.w   r7, [sp], #4 
279    1041e:   4770            bx      lr 
280 

1.1.2 使用汇编函数实现加法

使用 GIT下载后,源码在“07_驱动大全\source\01_inline_assembly\02_assembly\add.S”:

01 .text            // 放在代码段 
02 .global  add     // 实现全局函数 add 
03 .thumb           // 使用 thumb指令, main.c默认使用 thumb指令, 所以这里也使用 thumb指令 
04 
05 add: 
06      add r0, r0, r1 
07      bx lr 
08 

根据 ATPCS规则,main函数调用 add(a, b)时,会把第一个参数存入 r0寄存器,把第二个参数存入 r1寄存器。
在上面第 06行里,把 r0、r1累加后,结果存入 r0:根据 ATPCS规则,r0用来保存返回值。
可以看到,这个 add函数连栈都没有使用,非常高效。
这只是一个很简单的例子,我们工作中并不使用汇编来进行“加法优化”,在计算量非常大的地方可以考虑单独编写汇编函数实现优化。

1.1.3 内联汇编语法

从上面例子可以看到,我们完全可以新建一个汇编文件,在 ATPCS规则之下编写代码,这样 C函数就可以直接调用汇编函数。
但是,需要新建汇编文件,有点麻烦。
使用内联汇编,可以在 C代码中内嵌汇编代码。
先看看内联汇编的语法。
在这里插入图片描述

内联汇编语法:
① asm
也可以写作“asm”,表示这是一段内联汇编。
② asm-qualifiers
有 3个取值:volatile、inline、goto。
volatile的意思是易变的、不稳定的,用来告诉编译器不要随便优化这段代码,否则可能出问题。比如汇编指令“mov r0, r0”,它把 r0的值复制到 r0,并没有实际做什么事情,你的本意可能是用这条指令来延时。编译器看到这指令后,可能就把它去掉了。加上 volatile的话,编译器就不会擅自优化。
其他 2个取值我们不关心,也比较难以理解,不讲。
③ AssemblerTemplate
汇编指令,用双引号包含起来,每条指令用“\n”分开,比如:

“mov  %0, %1\n” 
“add  %0, %1, %2\n” 

④ OutputOperands
输出操作数,内联汇编执行时,输出的结果保存在哪里。
格式如下,当有多个变量时,用逗号隔开:
[ [asmSymbolicName] ] constraint (cvariablename)
asmSymbolicName是符号名,随便取,也可以不写。 constraint表示约束,有如下常用取值:
在这里插入图片描述

constraint前还可以加上一些修饰字符,比如“=r”、“+r”、“=&r”,含义如下:
在这里插入图片描述
variablename:C语言的变量名。

示例 1如下:
[result] “=r” (sum)
它的意思是汇编代码中会通过某个寄存器把结果写入 sum变量。在汇编代码中可以使用“%[result]”来引用它。

示例 2如下:
“=r” (sum)
在汇编代码中可以使用“%0”、“%1”等来引用它,这些数值怎么确定后面再说。

⑤ InputOperands
输入操作数,内联汇编执行前,输入的数据保存在哪里。
格式如下,当有多个变量时,用逗号隔开:
[ [asmSymbolicName] ] constraint (cexpression)

asmSymbolicName是符号名,随便取,也可以不写。
constraint表示约束,参考上一小节,跟 OutputOperands类似。

cexpression:C语言的表达式。

示例 1如下:
[a_val]“r”(a), [b_val]“r”(b)
它的意思变量 a、b的值会放入某些寄存器。在汇编代码中可以使用%[a_val]、%[b_val]使用它们。

示例 2如下:
“r”(a), “r”(b) 它的意思变量 a、b的值会放入某些寄存器。在汇编代码中可以使用%0、%1等使用它们,这些数值后面再说。

⑥ Clobbers 在汇编代码中,对于“OutputOperands”所涉及的寄存器、内存,肯定是做了修改。但是汇编代码中,也许要修改的寄存器、内存会更多。比如在计算过程中可能要用到 r3保存临时结果,我们必须在“Clobbers”中声明 r3会被修改。 下面是一个例子: : “r0”, “r1”, “r2”, “r3”, “r4”, “r5”, “memory”

我们常用的是有“cc”、“memory”,意义如下:
在这里插入图片描述

1.1.4 编写内联汇编实现加法

使用 GIT下载后,源码在“07_驱动大全\source\01_inline_assembly\03_inline_assembly\main.c”:

04 int add(int a, int b) 
05 { 
06      int sum; 
07      __asm__ volatile ( 
08              "add %0, %1, %2" 
09              :"=r"(sum) 
10              :"r"(a), "r"(b) 
11              :"cc" 
12      ); 
13      return sum; 

在这里插入图片描述

所以第 08行代码就是:把第 1、2个操作数相加,存入第 0个操作数。也就是把 a、b相加,存入 sum。
还可以使用另一种写法,在 Linux内核中这种用法比较少见。
使用 GIT下载后,源码在“07_驱动大全\source\01_inline_assembly\03_inline_assembly\main2.c”:
在这里插入图片描述

1.1.5 earlyclobber的例子

OutputOperands的约束中经常可以看到“=&r”,其中的“&”表示 earlyclobber,它是最难理解的。有
一些输出操作数在汇编代码中早早就被写入了新值 A,在这之后,汇编代码才去读取某个输入操作数,这个输出操作数就被称为 earlyclobber(早早就被改了)。
这可能会有问题:假设早早写入的新值 A,写到了 r0寄存器;后面读输入操作数时得到数值 B,也可能写入 r0寄存器,这新值 A就被破坏了。
核心原因就在于输出操作数、输入操作数都用了同一个 r0寄存器。为什么要用同一个?因为编译器不知道你是 earlyclobber的,它以为是先读入了所有输入操作数,都处理完了,才去写输出操作数的。按这流程,没人来覆盖新值 A。
所以,如果汇编代码中某个输出操作数是 earlyclobber的,它的 constraint就要加上“&”,这就是告诉编译器:给我分配一个单独的寄存器,别为了省事跟输入操作数用同一个寄存器。
使用 GIT下载后,源码在“07_驱动大全\source\01_inline_assembly\04_earlyclobber\main.c”:
在这里插入图片描述

上面的代码中,输出操作数%0对应的寄存器是 r3,输入操作数%1对应的寄存器也是 r3。
第 8行更新了%0的值后,第 9行修改%1的值,由于%0、%1是同一个寄存器,所以%0的值也被修改了。 最终返回的累加值是错的,增加了 1,如下图所示:
在这里插入图片描述

怎么修改?在第 11行加“&”就可以了,这是告诉编译器,对于%0操作数它是 earlyclobber的,不能跟其他操作数共用寄存器,如下:
在这里插入图片描述

从右边的反汇编码可以知道,%0跟%1、%2使用不一样的寄存器,所以后面第 9、10行无法影响到%0的值。
程序运行结果如下图所示:
在这里插入图片描述

1.2 同步与互斥的失败例子

注意:本节在 GIT上没有源码。
一句话理解同步与互斥:我等你用完厕所,我再用厕所。
什么叫同步?就是条件不允许,我要等等。
什么是互斥?你我早起都要用厕所,谁先抢到谁先用,中途不被打扰。
同步与互斥经常放在一起讲,是因为它们之的关系很大,“互斥”操作可以使用“同步”来实现。我“等”你用完厕所,我再用厕所。这不就是用“同步”来实现“互斥”吗?
有时候看代码更容易理解,伪代码如下:

01 void  抢厕所(void) 
02 { 
03    if (有人在用) 我眯一会; 
04    用厕所; 
05    喂,醒醒,有人要用厕所吗; 
06 } 

假设有 A、B两人早起抢厕所,A先行一步占用了;B慢了一步,于是就眯一会;当 A用完后叫醒 B,B也就愉快地上厕所了。
在这个过程中,A、B是互斥地访问“厕所”,“厕所”被称之为临界资源。我们使用了“休眠-唤醒”的同步机制实现了“临界资源”的“互斥访问”。
上面是一个有“味道”的例子,回到程序员的世界,一个驱动程序同时只能有一个 APP使用,怎么实现?

1.2.1 失败例子1

01 static int valid = 1; 
02 
03 static ssize_t gpio_key_drv_open (struct inode *node, struct file *file) 04 { 
05      if (!valid) 
06      { 
07              return -EBUSY; 
08      } 
09      else 
10      { 
11              valid = 0; 
12      } 
13 
14      return 0; //成功 
15 } 
16 
17 static int gpio_key_drv_close (struct inode *node, struct file *file) 
18 { 
19      valid = 1; 
20      return 0; 21 } 
22 

看第 5行,我们使用一个全局变量 valid来实现互斥访问。这有问题吗?很大概率没问题,但是并非万无一失。
注意:编写驱动程序时,要有系统的概念,程序 A调用驱动程序时,它可能被程序 B打断,程序 B也去调用这个驱动程序。
下图是一个例子,程序 A在调用驱动程序的中途被程序 B抢占了 CPU资源:
在这里插入图片描述

程序 A执行到第 11行之前,被程序 B抢占了,这时 valid尚未被改成 0;
程序 B调用 gpio_key_drv_open时,发现 valid等于 1,所以成功返回 0;
当程序 A继续从第 11行执行时,它最终也成功返回 0;
这样程序 A、B都成功打开了驱动程序。
注意:在内核态,程序 A不是主动去休眠、主动放弃 CPU资源;而是被优先级更高的程序 B抢占了,这种行为被称为“preempt”(抢占)。

1.2.2 失败例子2

上面的例子是不是第 5行到第 11行的时间跨度大长了?再优化一下程序行不行?代码如下:

01 static int valid = 1; 
02 
03 static ssize_t gpio_key_drv_open (struct inode *node, struct file *file) 
04 { 
05      if (--valid) 
06      { 
07              valid++; 
08              return -EBUSY; 
09      } 
10      return 0; 
11 } 
12 
13 static int gpio_key_drv_close (struct inode *node, struct file *file) 
14 { 
15      valid = 1; 
16      return 0; 
17 } 
18 

第 5行先减 1再判断,这样可以更大概率地避免问题,但是还是不能确保万无一失。对数据的修改分为 3步:读出来、修改、写进去。请看下图:
在这里插入图片描述

进程 A在读出 valid时发现它是 1,减 1后为 0,这时 if不成立;但是修改后的值尚未写回内存; 假设这时被程序 B抢占,程序 B读出 valid仍为 1,减 1后为 0,这时 if不成立,最后成功返回; 轮到 A继续执行,它把 0值写到 valid变量,最后也成功返回。
这样程序 A、B都成功打开了驱动程序。

1.2.3 失败例子3

前面 2个例子,都是在修改 valid的过程中被别的进程抢占了,那么在修改 valid的时候直接关中断不就可以了吗?

01 static int valid = 1; 
02 
03 static ssize_t gpio_key_drv_open (struct inode *node, struct file *file) 
04 { 
05       unsigned long flags; 
06       raw_local_irq_save(flags); // 关中断 
07      if (--valid) 
08      { 
09              valid++; 
10              raw_local_irq_restore(flags);  // 恢复之前的状态 
11              return -EBUSY; 
12      } 
13       raw_local_irq_restore(flags);          // 恢复之前的状态 
14      return 0; 
15 } 
16 
17 static int gpio_key_drv_close (struct inode *node, struct file *file) 
18 { 
19      valid = 1; 
20      return 0; 
21 } 

第 06行直接关中断,这样别的线程、中断都不能来打扰本线程了,在它读取、修改 valid变量的过程中无人打扰。
没有问题了?

对于单 CPU核的系统上述代码是没问题的;但是对于 SMP系统,你只能关闭当前 CPU核的中断,别的CPU核还可以运行程序,它们也可以来执行这个函数,同样导致问题,如下图:
在这里插入图片描述

假设 CPU0上进程 A、CPU1上进程 B同时运行到上图中读出 valid的地方,它们同时发现 valid都是 1,减减后都等于 0,在第 07行判断条件都不成立,所以在第 14行都可以返回 0,都可以成功打开驱动。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1059733.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AMD GPU 内核驱动分析(三)-dma-fence 同步工作模型

在Linux Kernel 的AMDGPU驱动实现中&#xff0c;dma-fence扮演着重要角色&#xff0c;AMDGPU的Render/解码操作可能涉及到多个方面同时引用buffer的情况&#xff0c;以渲染/视频解码场景为例&#xff0c;应用将渲染/解码命令写入和GPU共享的BUFFER之后&#xff0c;需要将任务提…

记录UNIAPP打包苹果iOS·APP

用到生成的四个文件:1-1.CSR证书文件、2-2.CER证书文件、3-3.PP文件【证书Profiles文件】、4-4.P12文件【证书私钥】 1. 生成CSR证书文件: 2. 操作苹果后台:Sign In - Applehttps://developer.apple.com/account/resources/certificates/list

高效的开发流程搭建

目录 1. 搭建 AI codebase 环境kaggle的服务器1. 搭建 AI codebase 环境 python 、torch 以及 cuda版本,对AI的影响最大。不同的版本,可能最终计算出的结果会有区别。 硬盘:PCIE转SSD的卡槽,, GPU: 软件源: Anaconda: 一定要放到固态硬盘上。 VS code 的 debug功能…

嵌入式Linux应用开发-驱动大全-同步与互斥④

嵌入式Linux应用开发-驱动大全-同步与互斥④ 第一章 同步与互斥④1.5 自旋锁spinlock的实现1.5.1 自旋锁的内核结构体1.5.2 spinlock在UP系统中的实现1.5.3 spinlock在SMP系统中的实现 1.6 信号量semaphore的实现1.6.1 semaphore的内核结构体1.6.2 down函数的实现1.6.3 up函数的…

关于将对象转成JSON格式的一些问题

1.问题现象&#xff1a; 在ssm项目中&#xff0c;一个controller返回Msg对象&#xff08;自定义Javabean对象&#xff09;&#xff0c;然后利用SpringMVC的ResponseBody注解自动将Msg对象转化成JSON格式&#xff0c;返回给客户端&#xff0c;但是客户端接收到的json字符串只有…

「专题速递」数字人直播带货、传统行业数字化升级、远程协作中的低延时视频、地产物业中的通讯终端...

音视频技术作为企业数字化转型的核心要素之一&#xff0c;已在各行各业展现出广泛的应用和卓越的价值。实时通信、社交互动、高清视频等技术不仅令传统行业焕发新生&#xff0c;还为其在生产、管理、服务提供与维护等各个领域带来了巨大的助力&#xff0c;实现了生产效率和服务…

打字速度测试,生成您的打字速度证书?

趁着十一国庆之际&#xff0c;开发完成了打字侠的速度测试功能。我自己的打字速度约为56字/分钟&#xff0c;算是盲打中速度比较快的。下面是我的打字荣誉证书&#xff0c;欢迎大家免费测试自己的打字速度。 你也想来测试一下自己的打字速度吗&#xff1f; 打字侠速度测试地址…

2023最新简易ChatGPT3.5小程序全开源源码+全新UI首发+实测可用可二开(带部署教程)

源码简介&#xff1a; 2023最新简易ChatGPT3.5小程序全开源源码全新UI首发&#xff0c;实测可以用&#xff0c;而且可以二次开发。这个是最新ChatGPT智能AI机器人微信小程序源码&#xff0c;同时也带部署教程。 这个全新版本的小界面设计相当漂亮&#xff0c;简单大方&#x…

「算法小记」-1:Ackermann函数/阿克曼函数的一点思考解法【递归/非递归/堆栈方法】(C++ )

&#x1f60e; 作者介绍&#xff1a;我是程序员洲洲&#xff0c;一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号&#xff1a;程序员洲洲。 &#x1f388; 本文专栏&#xff1a;本文…

Java架构师角度看架构

目录 1 导学1.1 技术提升依然突破不了职业的瓶颈1.2 技术提升可薪资依然涨不上去1.3 学了架构课程依然觉得自己成长很慢 2 架构的基本认识2.1 什么是架构2.2 为什么要做架构设计 3 深入理解和认识架构。3.1 架构定义的行为。3.2 架构关注系统的主要元素3.3 平衡关注点3.4 架构会…

站长如何能够做到网站的全方位防护呢?

随着互联网的急剧崛起&#xff0c;网站已成为企业塑造品牌形象和吸引潜在客户的首要渠道之一。然而&#xff0c;伴随着这种便捷性&#xff0c;网站安全问题也愈发凸显。DDOS&#xff08;分布式拒绝服务攻击&#xff09;和CC&#xff08;恶意请求攻击&#xff09;攻击成为了黑客…

ROS基础

E: Unable to locate package ros-kinetic-turtle-tf ROS Kinetic 学习笔记 (古月居) https://www.bilibili.com/video/BV1hc411n7N7/ 一、认识ROS 大纲 ROS的总体设计 系统实现 三个层次 1 主要是话题、服务通信模型的实现&#xff1b; 话题&#xff1a; RPC介绍&#…

顾樵 量子力学I 导读(1)

波函数与薛定谔方程 薛定谔方程的获得 经典电磁波理论与德布罗意关系 波函数的性质 波函数是平方可积函数&#xff08;归一化条件&#xff09;波函数和波函数的导数是连续的波函数的单值的波函数在势场奇点以外的地方连续力学量的平均值与期待值 粒子动量的期望值Ehrenfests th…

采用python中的opencv2的库来运用机器视觉移动物体

一. 此次我们来利用opencv2来进行机器视觉的学习 1. 首先我们先来进行一个小的案例的实现. 这次我们是将会进行一个小的矩形手势的移动. import cv2 from cvzone.HandTrackingModule import HandDetectorcap cv2.VideoCapture(0) # cap.set(3, 1280) # cap.set(4, 720) col…

1.1 数据库系统概述

思维导图&#xff1a; 前言&#xff1a; **数据库前言笔记&#xff1a;** 1. **数据库的价值** - 数据管理的高效工具 - 计算机科学的关键分支 2. **信息资源的重要性** - 现代企业或组织的生存和发展关键 - 建立有效的信息系统至关重要 3. **数据库的应用范围**…

Vue中如何进行移动端手势操作

当开发移动端应用程序时&#xff0c;手势操作是提高用户体验的关键部分之一。Vue.js是一个流行的JavaScript框架&#xff0c;它提供了一种简单而强大的方式来实现移动端手势操作。本文将介绍如何在Vue.js中进行移动端手势操作&#xff0c;包括基本手势&#xff0c;如点击、滑动…

闲聊四种旅游方式

十一长假&#xff0c;先不写那些需要深度思考的话题&#xff0c;先写点轻松的。 关于旅游方式&#xff0c;其实也是受梁斌博士一条微博的一些触动&#xff0c;他说他认识个朋友&#xff0c;自由职业&#xff0c;到处旅游&#xff0c;却从不旺季出行&#xff0c;非常省钱&#x…

关系型数据库设计理论及部署实现

ACID 索引实现方式 事务隔离级别 并发场景 写-写冲突 MVCC 数据库隐式字段 读视图 删表语句 insert与replace区别 Mysql相关参数 索引扫描方式 索引下推 复制日志 基于操作语句复制 基于预写日志(WAL)复制 基于行的逻辑日志复制 基于触发器的复制 主从同步 多主复制 Mysql备份 …