Linux是一个多任务操作系统,肯定会存在多个任务共同操作同一段内存或者设备的情况,多个任务甚至中断都能访问的资源叫做共享资源,就和共享单车一样。在驱动开发中要注意对共享资源的保护,也就是要处理对共享资源的并发访问。比如共享单车,大家按照谁扫谁骑走的原则来共用这个单车,如果没有这个并发访问共享单车的原则存在,只怕到时候为了一辆单车要打起来了。在 Linux 驱动编写过程中对于并发控制的管理非常重要,本章我们就来学习一下如何在 Linux 驱动中处理并发。
并发与竞争
1、并发与竞争简介
并发就是多个“用户”同时访问同一个共享资源,比如你们公司有一台打印机,你们公司的所有人都可以使用。现在小李和小王要同时使用这一台打印机,都要打印一份文件。小李要打印的文件内容如下:
小王要打印的内容如下:
这两份文档肯定是各自打印出来的,不能相互影响。当两个人同时打印的话如果打印机不做处理的话可能会出现小李的文档打印了一行,然后开始打印小王的文档,这样打印出来的文档就错乱了,可能会出现如下的错误文档内容:
可以看出,小王打印出来的文档中电话号码错误了,变成小李的了,这是绝对不允许的。如果有多人同时向打印机发送了多份文档,打印机必须保证一次只能打印一份文档,只有打印完成以后才能打印其他的文档。
Linux 系统是个多任务操作系统,会存在多个任务同时访问同一片内存区域,这些任务可能会相互覆盖这段内存中的数据,造成内存数据混乱。针对这个问题必须要做处理,严重的话可能会导致系统崩溃。现在的 Linux 系统并发产生的原因很复杂,总结一下有下面几个主要原因:
①、多线程并发访问,Linux 是多任务(线程)的系统,所以多线程访问是最基本的原因。
②、抢占式并发访问,从 2.6 版本内核开始,Linux 内核支持抢占,也就是说调度程序可以在任意时刻抢占正在运行的线程,从而运行其他的线程。
③、中断程序并发访问,这个无需多说,学过 STM32 的同学应该知道,硬件中断的权利可是很大的。
④、SMP(多核)核间并发访问,现在 ARM 架构的多核 SOC 很常见,多核 CPU 存在核间并发访问。
并发访问带来的问题就是竞争,学过FreeRTOS和UCOS的同学应该知道临界区这个概念,所谓的临界区就是共享数据段,对于临界区必须保证一次只有一个线程访问,也就是要保证临界区是原子访问的,注意这里的“原子”不是正点原子的“原子”。我们都知道,原子是化学反应不可再分的基本微粒,这里的原子访问就表示这一个访问是一个步骤,不能再进行拆分。如果多个线程同时操作临界区就表示存在竞争,我们在编写驱动的时候一定要注意避免并发和防止竞争访问。很多 Linux 驱动初学者往往不注意这一点,在驱动程序中埋下了隐患,这类问题往往又很不容易查找,导致驱动调试难度加大、费时费力。所以我们一般在编写驱动的时候就要考虑到并发与竞争,而不是驱动都编写完了然后再处理并发与竞争。
2、保护内容是什么
前面一直说要防止并发访问共享资源,换句话说就是要保护共享资源,防止进行并发访问。那么问题来了,什么是共享资源?现实生活中的公共电话、共享单车这些是共享资源,我们都很容易理解,那么在程序中什么是共享资源?也就是保护的内容是什么?我们保护的不是代码,而是数据!某个线程的局部变量不需要保护,我们要保护的是多个线程都会访问的共享数据。一个整形的全局变量 a 是数据,一份要打印的文档也是数据,虽然我们知道了要对共享数据进行保护,那么怎么判断哪些共享数据要保护呢?找到要保护的数据才是重点,而这个也是难点,因为驱动程序各不相同,那么数据也千变万化,一般像全局变量,设备结构体这些肯定是要保护的,至于其他的数据就要根据实际的驱动程序而定了。当我们发现驱动程序中存在并发和竞争的时候一定要处理掉,接下来我们依次来学习一下Linux 内核提供的几种并发和竞争的处理方法。
原子操作
原子操作简介
首先看一下原子操作,原子操作就是指不能再进一步分割的操作,一般原子操作用于变量或者位操作。假如现在要对无符号整形变量 a 赋值,值为 3,对于 C 语言来讲很简单,直接就是:
但是 C 语言要先编译为成汇编指令,ARM 架构不支持直接对寄存器进行读写操作,比如要借助寄存器 R0、R1 等来完成赋值操作。假设变量 a 的地址为 0X3000000,“a=3”这一行 C语言可能会被编译为如下所示的汇编代码:
示例代码 47.2.1.1 只是一个简单的举例说明,实际的结果要比示例代码复杂的多。从上述代码可以看出,C 语言里面简简单单的一句“a=3”,编译成汇编文件以后变成了 3 句,那么程序在执行的时候肯定是按照示例代码 47.2.1.1 中的汇编语句一条一条的执行。假设现在线程 A要向 a 变量写入 10 这个值,而线程 B 也要向 a 变量写入 20 这个值,我们理想中的执行顺序如图 47.2.1.1 所示:
按照图 47.2.1.1 所示的流程,确实可以实现线程 A 将 a 变量设置为 10,线程 B 将 a 变量设置为 20。但是实际上的执行流程可能如图 47.2.1.2 所示:
按照图 47.2.1.2 所示的流程,线程 A 最终将变量 a 设置为了 20,而并不是要求的 10!线程B 没有问题。这就是一个最简单的设置变量值的并发与竞争的例子,要解决这个问题就要保证示例代码 47.2.1.2 中的三行汇编指令作为一个整体运行,也就是作为一个原子存在。Linux 内核提供了一组原子操作 API 函数来完成此功能,Linux 内核提供了两组原子操作 API 函数,一组是对整形变量进行操作的,一组是对位进行操作的,我们接下来看一下这些 API 函数。
原子整形操作 API 函数
Linux 内核定义了叫做 atomic_t 的结构体来完成整形数据的原子操作,在使用中用原子变量来代替整形变量,此结构体定义在 include/linux/types.h 文件中,定义如下:
如果要使用原子操作 API 函数,首先要先定义一个 atomic_t 的变量,如下所示:
atomic_t a; //定义 a
也可以在定义原子变量的时候给原子变量赋初值,如下所示:
atomic_t b = ATOMIC_INIT(0); //定义原子变量 b 并赋初值为 0
可以通过宏 ATOMIC_INIT 向原子变量赋初值。
原子变量有了,接下来就是对原子变量进行操作,比如读、写、增加、减少等等,Linux 内核提供了大量的原子操作 API 函数,如表 47.2.2.1 所示:
如果使用 64 位的 SOC 的话,就要用到 64 位的原子变量,Linux 内核也定义了 64 位原子结构体,如下所示:
相应的也提供了 64 位原子变量的操作 API 函数,这里我们就不详细讲解了,和表 47.2.1.1中的 API 函数有用法一样,只是将“atomic_”前缀换为“atomic64_”,将 int 换为 long long。如果使用的是 64 位的 SOC,那么就要使用 64 位的原子操作函数。Cortex-A7 是 32 位的架构,所以本书中只使用表 47.2.2.1 中的 32 位原子操作函数。原子变量和相应的 API 函数使用起来很简单,参考如下示例:
原子位操作 API 函数
位操作也是很常用的操作,Linux 内核也提供了一系列的原子位操作 API 函数,只不过原子位操作不像原子整形变量那样有个 atomic_t 的数据结构,原子位操作是直接对内存进行操作,API 函数如表 47.2.3.1 所示:
自旋锁
自旋锁简介
原子操作只能对整形变量或者位进行保护,但是,在实际的使用环境中怎么可能只有整形变量或位这么简单的临界区。举个最简单的例子,设备结构体变量就不是整型变量,我们对于结构体中成员变量的操作也要保证原子性,在线程 A 对结构体变量使用期间,应该禁止其他的线程来访问此结构体变量,这些工作原子操作都不能胜任,需要本节要讲的锁机制,在 Linux内核中就是自旋锁。
当一个线程要访问某个共享资源的时候首先要先获取相应的锁,锁只能被一个线程持有,只要此线程不释放持有的锁,那么其他的线程就不能获取此锁。对于自旋锁而言,如果自旋锁正在被线程 A 持有,线程 B 想要获取自旋锁,那么线程 B 就会处于忙循环-旋转-等待状态,线程 B 不会进入休眠状态或者说去做其他的处理,而是会一直傻傻的在那里“转圈圈”的等待锁可用。比如现在有个公用电话亭,一次肯定只能进去一个人打电话,现在电话亭里面有人正在打电话,相当于获得了自旋锁。此时你到了电话亭门口,因为里面有人,所以你不能进去打电话,相当于没有获取自旋锁,这个时候你肯定是站在原地等待,你可能因为无聊的等待而转圈圈消遣时光,反正就是哪里也不能去,要一直等到里面的人打完电话出来。终于,里面的人打完电话出来了,相当于释放了自旋锁,这个时候你就可以使用电话亭打电话了,相当于获取到了自旋锁。
自旋锁的“自旋”也就是“原地打转”的意思,“原地打转”的目的是为了等待自旋锁可以用,可以访问共享资源。把自旋锁比作一个变量 a,变量 a=1 的时候表示共享资源可用,当 a=0的时候表示共享资源不可用。现在线程 A 要访问共享资源,发现 a=0(自旋锁被其他线程持有),那么线程 A 就会不断的查询 a 的值,直到 a=1。从这里我们可以看到自旋锁的一个缺点:那就等待自旋锁的线程会一直处于自旋状态,这样会浪费处理器时间,降低系统性能,所以自旋锁的持有时间不能太长。所以自旋锁适用于短时期的轻量级加锁,如果遇到需要长时间持有锁的场景那就需要换其他的方法了,这个我们后面会讲解。
Linux 内核使用结构体 spinlock_t 表示自旋锁,结构体定义如下所示:
在使用自旋锁之前,肯定要先定义一个自旋锁变量,定义方法如下所示:
spinlock_t lock; //定义自旋锁
定义好自旋锁变量以后就可以使用相应的 API 函数来操作自旋锁。
自旋锁 API 函数
最基本的自旋锁 API 函数如表 47.3.2.1 所示:
表47.3.2.1中的自旋锁API 函数适用于SMP或支持抢占的单CPU下线程之间的并发访问,也就是用于线程与线程之间,被自旋锁保护的临界区一定不能调用任何能够引起睡眠和阻塞的API 函数,否则的话会可能会导致死锁现象的发生。自旋锁会自动禁止抢占,也就说当线程 A得到锁以后会暂时禁止内核抢占。如果线程 A 在持有锁期间进入了休眠状态,那么线程 A 会自动放弃 CPU 使用权。线程 B 开始运行,线程 B 也想要获取锁,但是此时锁被 A 线程持有,而且内核抢占还被禁止了!线程 B 无法被调度出去,那么线程 A 就无法运行,锁也就无法释放,好了,死锁发生了!
表 47.3.2.1 中的 API 函数用于线程之间的并发访问,如果此时中断也要插一脚,中断也想访问共享资源,那该怎么办呢?首先可以肯定的是,中断里面可以使用自旋锁。这里就要理解普通线程使用同一把锁和中断使用同一把锁的区别,假设线程A在使用一把锁LOCK,此时,如果线程B想要使用这把锁,因为这把锁当前被A占用,所以线程B会一直自旋等待,直到线程A执行完,才可能轮得到B执行;但是中断不一样,当线程A执行时,中断会抢占普通线程的执行,因为中断的优先级高于普通线程,所以在线程使用这个锁的时候,也是会被中断打断,如下图所示:
在图 47.3.2.1 中,线程 A 先运行,并且获取到了 lock 这个锁,当线程 A 运行 functionA 函数的时候中断发生了,中断抢走了 CPU 使用权。右边的中断服务函数也要获取 lock 这个锁,但是这个锁被线程 A 占有着,中断就会一直自旋,等待锁有效。但是有个问题就是,中断不执行完,是不会返回去执行程序A的,就好比线程 A 说“你先放手”,中断说“你先放手”,场面就这么僵持着,死锁发生!为了避免锁死现象的发生,如果知道线程A的锁会被中断使用到,就需要线程A在使用这个锁之前,禁止本地中断(也就是本 CPU 中断,对于多核 SOC来说会有多个 CPU 核),于是,线程A在释放锁之前,中断都无法抢占,这也要求,线程A的占用过程不能过长,否则会影响中断的执行。Linux 内核提供了相应的 API 函数,如表47.3.2.2 所示:
使用 spin_lock_irq/spin_unlock_irq 的时候需要用户能够确定加锁之前的中断状态,但实际上内核很庞大,运行也是“千变万化”,我们是很难确定某个时刻的中断状态,因此不推荐使用spin_lock_irq/spin_unlock_irq。建议使用 spin_lock_irqsave/spin_unlock_irqrestore,因为这一组函数会保存中断状态,在释放锁的时候会恢复中断状态。一般在线程中使用 spin_lock_irqsave/spin_unlock_irqrestore,在中断中使用 spin_lock/spin_unlock,示例代码如下所示:
下半部(BH)也会竞争共享资源,有些资料也会将下半部叫做底半部。关于下半部后面的章节会讲解,如果要在下半部里面使用自旋锁,可以使用表 47.3.2.3 中的 API 函数:
自旋锁使用注意事项
综合前面关于自旋锁的信息,我们需要在使用自旋锁的时候要注意一下几点:
①、因为在等待自旋锁的时候处于“自旋”状态,因此锁的持有时间不能太长,一定要短,否则的话会降低系统性能。如果临界区比较大,运行时间比较长的话要选择其他的并发处理方式,比如稍后要讲的信号量和互斥体。
②、自旋锁保护的临界区内不能调用任何可能导致线程休眠的 API 函数,否则的话可能导致死锁。
③、不能递归申请自旋锁,因为一旦通过递归的方式申请一个你正在持有的锁,那么你就必须“自旋”,等待锁被释放,然而你正处于“自旋”状态,根本没法释放锁。结果就是自己把自己锁死了!
④、在编写驱动程序的时候我们必须考虑到驱动的可移植性,因此不管你用的是单核的还是多核的 SOC,都将其当做多核 SOC 来编写驱动程序。
Linux中的信号量是一种同步机制,用于在进程或线程之间协调对共享资源的访问。在内核态和用户态中,信号量的实现和使用方式有所不同。
信号量
注意,驱动中的信号量和应用中的信号量是不一样的,别搞混了。
Linux驱动中的信号量
定义功能:
信号量是内核提供的一种同步机制,用于保护临界区,防止多个进程或中断同时访问同一资源。
它主要用于互斥(保证资源不会被同时访问)和同步(协调进程执行顺序)。
类型操作:
分为计数信号量和二值信号量。当信号量的初始值大于等于2时为计数信号量,等于1时为二值信号量。
主要操作包括初始化、获取、释放等,通过函数如
sema_init()
,down()
,up()
等实现。应用场景:
常用于驱动程序中,例如在字符设备驱动中控制对设备的并发访问。
可以用来避免竞态条件,确保数据一致性和完整性。
优点缺点:
优点是能有效避免进程间的冲突和数据不一致问题。
缺点是使用不当可能导致死锁或性能下降。
Linux应用中的信号量
定义功能:
应用层信号量主要用于进程间通信(IPC),可以协调不同进程或线程之间的执行顺序和资源共享。
它可以创建在内核中也可以创建在用户空间中,后者称为无名信号量。
类型操作:
包括POSIX信号量和System V信号量,前者更为现代和灵活。
相关操作有创建、等待、发送信号等,通过
semget()
,semop()
,semctl()
等函数实现。应用场景:
广泛用于各种需要进程同步的场景,如生产者消费者问题、读者写者问题等。
适用于需要协调多个独立进程执行的情况。
优点缺点:
优点是提供了丰富的同步原语,能适应多种复杂的进程间同步需求。
缺点是相比其他简单机制如互斥锁,信号量使用更复杂,且可能引入额外的系统开销。
总的来说,Linux驱动中的信号量主要关注内核层面的资源管理和同步,而应用中的信号量则侧重于进程间的通信和同步。两者虽然都是信号量,但应用场景和具体实现有所不同,体现了操作系统在不同层面上对资源管理和进程协调的需求。
这里说的是驱动中的信号量。
信号量简介
大家如果有学习过 FreeRTOS 或者 UCOS 的话就应该对信号量很熟悉,因为信号量是同步的一种方式。Linux 内核也提供了信号量机制,信号量常常用于控制对共享资源的访问。举一个很常见的例子,某个停车场有 100 个停车位,这 100 个停车位大家都可以用,对于大家来说这100 个停车位就是共享资源。假设现在这个停车场正常运行,你要把车停到这个这个停车场肯定要先看一下现在停了多少车了?还有没有停车位?当前停车数量就是一个信号量,具体的停车数量就是这个信号量值,当这个值到 100 的时候说明停车场满了。停车场满的时你可以等一会看看有没有其他的车开出停车场,当有车开出停车场的时候停车数量就会减一,也就是说信号量减一,此时你就可以把车停进去了,你把车停进去以后停车数量就会加一,也就是信号量加一。这就是一个典型的使用信号量进行共享资源管理的案例,在这个案例中使用的就是计数型信号量。
相比于自旋锁,信号量可以使线程进入休眠状态,比如 A 与 B、C 合租了一套房子,这个房子只有一个厕所,一次只能一个人使用。某一天早上 A 去上厕所了,过了一会 B 也想用厕所,因为 A 在厕所里面,所以 B 只能等到 A 用来了才能进去。B 要么就一直在厕所门口等着,等 A 出来,这个时候就相当于自旋锁。B 也可以告诉 A,让 A 出来以后通知他一下,然后 B 继续回房间睡觉,这个时候相当于信号量。可以看出,使用信号量会提高处理器的使用效率,毕竟不用一直傻乎乎的在那里“自旋”等待。但是,信号量的开销要比自旋锁大,因为信号量使线程进入休眠状态以后会切换线程,切换线程就会有开销。总结一下信号量的特点:
①、因为信号量可以使等待资源线程进入休眠状态,因此适用于那些占用资源比较久的场合。
②、因此信号量不能用于中断中,因为信号量会引起休眠,中断不能休眠。
③、如果共享资源的持有时间比较短,那就不适合使用信号量了,因为频繁的休眠、切换线程引起的开销要远大于信号量带来的那点优势。
信号量有一个信号量值,相当于一个房子有 10 把钥匙,这 10 把钥匙就相当于信号量值为10。因此,可以通过信号量来控制访问共享资源的访问数量,如果要想进房间,那就要先获取一把钥匙,信号量值减 1,直到 10 把钥匙都被拿走,信号量值为 0,这个时候就不允许任何人进入房间了,因为没钥匙了。如果有人从房间出来,那他要归还他所持有的那把钥匙,信号量值加 1,此时有 1 把钥匙了,那么可以允许进去一个人。相当于通过信号量控制访问资源的线程数,在初始化的时候将信号量值设置的大于 1,那么这个信号量就是计数型信号量,计数型信号量不能用于互斥访问,因为它允许多个线程同时访问共享资源。如果要互斥的访问共享资源那么信号量的值就不能大于 1,此时的信号量就是一个二值信号量。
信号量 API 函数
Linux 内核使用 semaphore 结构体表示信号量,结构体内容如下所示:
要想使用信号量就得先定义,然后初始化信号量。有关信号量的 API 函数如表 47.4.2.1 所示:
信号量的使用如下所示:
示例代码 47.4.2.2 信号量使用示例 struct semaphore sem; /* 定义信号量 */ sema_init(&sem, 1); /* 初始化信号量 */ down(&sem); /* 申请信号量 */ /* 临界区 */ up(&sem); /* 释放信号量 */
互斥体
同样的,linux内核中的互斥体和应用中的互斥锁有所区别。
Linux中的互斥体(mutex)和应用中的互斥锁(Mutex)是两种常用的同步机制,它们在实现方式、使用场景以及性能特点等方面存在区别。具体分析如下:
实现方式
内核互斥体:内核互斥体的实现基于原子操作和自旋锁,确保了高效的线程安全性。它通过
atomic_t count
来表示锁定状态,并通过spinlock_t wait_lock
和struct list_head wait_list
来管理等待队列。应用互斥锁:应用互斥锁通常由操作系统提供的库函数实现,如POSIX线程库中的pthread_mutex。这些锁的实现可能涉及系统调用,因此比内核锁更慢,但提供了更高级的线程同步功能。
使用场景
内核互斥体:内核互斥体主要用于内核模块中,保护对共享数据结构的访问,避免并发访问导致的数据不一致问题。由于其高效性,常用于中断处理程序和下半部上下文中。
应用互斥锁:应用互斥锁广泛用于用户空间的多线程编程中,特别是在需要保护共享资源不被多个线程同时修改时。它们适用于各种应用程序,从简单的命令行工具到复杂的企业级软件。
性能特点
内核互斥体:内核互斥体由于直接在内核中实现,通常比应用层的互斥锁更快,因为它们减少了用户态到内核态的切换次数。内核互斥体还支持自适应锁机制,根据锁的竞争程度动态调整锁的行为。
应用互斥锁:应用互斥锁虽然速度较慢,但提供了更丰富的功能,如递归锁和时间限制的尝试加锁操作。这些特性使得应用互斥锁更适合于复杂的多线程应用。
可重入性
内核互斥体:内核互斥体通常不支持递归加锁,这意味着同一线程不能多次获得同一把锁而不释放之前获得的锁。
应用互斥锁:许多应用互斥锁实现支持递归加锁,允许同一线程多次获得同一把锁,这在某些情况下非常有用,例如避免死锁或简化代码逻辑。
综上所述,内核互斥体主要应用于内核模块中,提供高效的同步机制,而应用互斥锁则广泛用于用户空间的多线程编程,提供更高级的特性和灵活性。在选择适当的同步机制时,开发者应考虑具体的应用场景和需求,以实现最佳的性能和资源利用率。
互斥体简介
在 FreeRTOS 和 UCOS 中也有互斥体,将信号量的值设置为 1 就可以使用信号量进行互斥访问了,虽然可以通过信号量实现互斥,但是 Linux 提供了一个比信号量更专业的机制来进行互斥,它就是互斥体—mutex。互斥访问表示一次只有一个线程可以访问共享资源,不能递归申请互斥体。在我们编写 Linux 驱动的时候遇到需要互斥访问的地方建议使用 mutex。Linux 内核使用 mutex 结构体表示互斥体,定义如下(省略条件编译部分):
在使用 mutex 之前要先定义一个 mutex 变量。在使用 mutex 的时候要注意如下几点:
①、mutex 可以导致休眠,因此不能在中断中使用 mutex,中断中只能使用自旋锁。
②、和信号量一样,mutex 保护的临界区可以调用引起阻塞的 API 函数。
③、因为一次只有一个线程可以持有 mutex,因此,必须由 mutex 的持有者释放 mutex。并且 mutex 不能递归上锁和解锁。
互斥体 API 函数
有关互斥体的 API 函数如表 47.5.2.1 所示:
互斥体的使用如下所示:
示例代码 47.5.2.1 互斥体使用示例 1 struct mutex lock; /* 定义一个互斥体 */ 2 mutex_init(&lock); /* 初始化互斥体 */ 3 4 mutex_lock(&lock); /* 上锁 */ 5 /* 临界区 */ 6 mutex_unlock(&lock); /* 解锁 */
关于 Linux 中的并发和竞争就讲解到这里,Linux 内核还有很多其他的处理并发和竞争的机制,本章我们主要讲解了常用的原子操作、自旋锁、信号量和互斥体。以后我们在编写 Linux驱动的时候就会频繁的使用到这几种机制,希望大家能够深入理解这几个常用的机制。
Linux 并发与竞争实验
在上一章中我们学习了 Linux 下的并发与竞争,并且学习了四种常用的处理并发和竞争的机制:原子操作、自旋锁、信号量和互斥体。本章我们就通过四个实验来学习如何在驱动中使用这四种机制。
具体参考正点原子第四十八章《Linux 并发与竞争实验》,本文暂略。