自旋锁
Note:
在使用自旋锁时应该避免长时间持有锁,否则可能会导致其他线程或进程无法访问共享资源。因此,建议将锁的持有时间尽量缩短,以提高系统的并发性能。
Linux中的自旋锁机制是一种用于同步多个线程或进程访问共享资源的技术。当一个线程或进程获得了自旋锁之后,其他的线程或进程将会被阻塞,直到拥有锁的线程或进程释放该锁为止。
自旋锁的特点在于当锁已经被占用时,等待的线程或进程并不会被挂起,而是不断地尝试获取锁,直到成功为止。这种方式相比传统的互斥锁可以减少线程或进程上下文切换的开销,提高系统的效率。
在Linux内核中,自旋锁由spinlock_t结构体来表示,其中包含一个整数值和一个锁标志位。当锁未被占用时,锁标志位为0;当锁被占用时,锁标志位为1,并且整数值记录了当前占用锁的CPU编号。
以下是一个简单的示例,演示了如何使用自旋锁来保护一个共享变量:
#include <linux/spinlock.h>
static DEFINE_SPINLOCK(my_lock);
static int shared_var = 0;
void my_function(void)
{
unsigned long flags;
spin_lock_irqsave(&my_lock, flags); // 获取自旋锁
shared_var++; // 修改共享变量
spin_unlock_irqrestore(&my_lock, flags); // 释放自旋锁
}
在上面的示例中,使用DEFINE_SPINLOCK宏定义了一个自旋锁my_lock,并且定义了一个共享变量shared_var。当调用my_function函数时,先获取自旋锁my_lock,然后修改共享变量shared_var,最后释放自旋锁。
需要注意的是,在使用自旋锁时应该避免长时间持有锁,否则可能会导致其他线程或进程无法访问共享资源。因此,建议将锁的持有时间尽量缩短,以提高系统的并发性能。
spin_lock_irqsave
使用spin_lock_irqsave()
函数可以确保在获取自旋锁时,中断被禁止,以防止可能会发生的中断竞争问题。
当一个中断处理程序正在运行时,如果另一个中断请求到来并且需要访问同一个共享资源,那么就会发生中断竞争问题。这种情况下,需要使用自旋锁来保护共享资源,同时在获取锁时禁止其他中断请求,避免中断竞争问题的发生。
spin_lock_irqsave()
函数可以实现在获取自旋锁时禁止中断,并将当前CPU的中断状态保存在flags参数中,以便在释放锁后恢复中断状态。这样可以确保在获取自旋锁期间不会被中断打断,从而保证了共享资源的安全性。
在使用spin_lock_irqsave()
函数时应该避免长时间持有锁,否则可能会导致其他线程或进程无法访问共享资源。因此,建议将锁的持有时间尽量缩短,以提高系统的并发性能。
禁止中断原因
禁止中断是为了避免在获取自旋锁时出现中断竞争问题。当一个中断处理程序正在运行时,如果另一个中断请求到来并且需要访问同一个共享资源,那么就会发生中断竞争问题。这种情况下,如果没有使用自旋锁来保护共享资源,并且也没有禁止中断,就可能会导致死锁的发生。
中断竞争可能会导致死锁的原因如下:
-
中断处理程序在获取锁之前被打断,而此时另一个中断请求到来并尝试获取同一个锁。由于锁已经被占用,因此该中断请求将一直等待,从而导致死锁。
-
中断处理程序获取锁后被打断,而此时另一个中断请求到来并尝试获取同一个锁。由于中断处理程序持有锁,因此该中断请求将一直等待,从而导致死锁。
因此,在获取自旋锁时应该禁止中断,以避免中断竞争问题的发生,并确保共享资源的安全性。同时,需要注意不要长时间持有锁,否则可能会导致其他线程或进程无法访问共享资源,从而降低系统的并发性能。
内核中涉及到自旋锁机制的源码文件和函数
在Linux内核中,自旋锁机制的实现涉及到以下几个文件和函数:
-
include/linux/spinlock.h
头文件中定义了spinlock_t结构体和相关的宏和函数。 -
kernel/locking/spinlock.c
文件中实现了spinlock_t结构体相关的函数,包括spin_lock()
、spin_unlock()
、spin_lock_irqsave()
等函数。 -
kernel/locking/rwsem-spinlock.c
文件中实现了读写自旋锁的相关函数,包括read_lock()
、write_lock()
、read_unlock()
、write_unlock()
等函数。
这些函数主要用于获取和释放自旋锁,并保证在获取自旋锁时禁止中断。同时,还有一些其他的函数,如spin_trylock()
、spin_is_locked()
等函数,用于检查锁的状态和尝试获取锁。
自旋锁宏定义解释
#define __lockfunc __section(".spinlock.text")
__lockfunc 是一个宏,用于将下面的函数定义放置到 .spinlock.text 段中。.spinlock.text 是Linux内核中专门用于存放自旋锁相关代码的代码段。
由于自旋锁是用于保护共享资源的关键机制,因此其实现需要非常高效和可靠。将自旋锁相关代码放置在独立的代码段中,可以使得该部分代码具有更好的可读性、可维护性和可移植性,并且不会被其他部分的代码所干扰。同时,这也可以方便进行自旋锁相关的优化和调试。
在Linux内核中,自旋锁相关的代码通常会被放置在 `.spinlock.text` 段中。`.spinlock.text` 是一个专门用于存放自旋锁相关代码的代码段,其具体位置和大小可能会因不同的架构、编译器以及内核版本而有所不同。
一般来说,`.spinlock.text` 会被放置在内核代码段的后面,紧跟着其他的代码段(如 `.text`、`.rodata`、`.data` 等)。当内核启动时,`.spinlock.text` 中的代码会被加载到内存中,并根据需要执行。由于自旋锁是保护共享资源的重要机制,因此自旋锁相关的代码通常会被频繁地执行。为了获得更好的性能,`.spinlock.text` 中的代码可能会被放置在与CPU缓存相对应的内存页中,以减少缓存失效的情况。
#define raw_spin_trylock(lock) __cond_lock(lock, _raw_spin_trylock(lock))
#define raw_spin_lock(lock) _raw_spin_lock(lock)
raw_spin_trylock(lock)是一个宏,它尝试获取指向 lock 的原始自旋锁。如果锁当前没有被占用,则获取该锁并返回1;否则,返回0。
raw_spin_lock(lock)是一个宏,它会获取指向 lock 的原始自旋锁。如果该锁已经被占用,调用线程将被阻塞,直到该锁可用。
`__cond_lock(lock, _raw_spin_trylock(lock))` 是一个宏,用于在特定条件下调用 `_raw_spin_trylock(lock)` 函数尝试获取自旋锁。具体来说,这个宏使用了Linux内核中的条件变量机制,当自旋锁处于忙碌状态时,线程会在条件变量上等待直到自旋锁可用。如果自旋锁可用,则该宏返回1,并且线程可以获得该自旋锁;否则,该宏返回0。
`_raw_spin_lock(lock)` 是一个函数,用于获取指向 `lock` 的原始自旋锁。该函数使用了硬件提供的原子操作机制,以确保该操作是原子的、不可分割的,并且不会被其他线程打断。当自旋锁处于忙碌状态时,调用线程将被阻塞,直到该自旋锁可用。如果自旋锁已经被占用,则该函数将一直自旋,直到该自旋锁可用并成功获取。
#define raw_spin_lock_irqsave_nested(lock, flags, subclass) \
raw_spin_lock_irqsave(lock, flags)
`raw_spin_lock_irqsave_nested()` 宏通常用于在中断上下文中获取自旋锁。在Linux内核中,由于中断处理程序可以随时打断正在运行的进程或线程,因此需要使用自旋锁来保护共享资源以避免竞争条件。
具体来说,当中断处理程序需要访问某个共享资源时,它会调用 `raw_spin_lock_irqsave_nested()` 宏来获取该资源的自旋锁,并且将当前CPU的中断状态保存到 `flags` 变量中。这样,在执行临界区代码期间,其他中断无法打断当前中断处理程序,从而保证了数据的一致性和可靠性。当中断处理程序完成对共享资源的访问后,它会调用 `raw_spin_unlock_irqrestore()` 函数释放自旋锁并恢复中断状态。
需要注意的是,由于 `raw_spin_lock_irqsave_nested()` 宏会屏蔽当前CPU的中断,因此应尽可能地减少在中断处理程序中使用自旋锁,以避免中断响应时间过长或出现死锁等问题。
raw_spin_lock_irqsave_nested() 宏相比于 raw_spin_lock_irqsave() 函数多了一个 subclass 参数。这个参数主要用于在分析自旋锁性能问题时进行标记,以便确定哪些自旋锁被频繁地访问或出现竞争。这对于Linux内核的性能优化和调试非常有帮助。
#define raw_spin_trylock(lock) __cond_lock(lock, _raw_spin_trylock(lock))
#define raw_spin_lock_irq(lock) _raw_spin_lock_irq(lock)
#define raw_spin_lock_bh(lock) _raw_spin_lock_bh(lock)
#define raw_spin_unlock(lock) _raw_spin_unlock(lock)
#define raw_spin_unlock_irq(lock) _raw_spin_unlock_irq(lock)
#define raw_spin_lock(lock) _raw_spin_lock(lock)
这些宏都是用于实现自旋锁的,具体解释如下:
1. `raw_spin_trylock(lock)`
该宏用于尝试获取一个自旋锁,如果锁当前没有被持有,则会立即获取锁并返回true,否则直接返回false。
使用场景:当需要在不阻塞线程的情况下尝试获取锁时可以使用该宏。
2. `raw_spin_lock_irq(lock)`
该宏用于获取一个自旋锁,并禁用中断。该操作保证了在获取锁期间不会被其他中断打断。
使用场景:当需要对共享资源进行保护,并且需要避免中断的干扰时可以使用该宏。
3. `raw_spin_lock_bh(lock)`
该宏用于获取一个自旋锁,并禁用软中断。该操作保证了在获取锁期间不会被其他软中断打断。
使用场景:当需要对共享资源进行保护,并且需要避免软中断的干扰时可以使用该宏。
4. `raw_spin_unlock(lock)`
该宏用于释放一个自旋锁。
使用场景:当不再需要访问共享资源时需要释放锁。
5. `raw_spin_unlock_irq(lock)`
该宏用于释放一个自旋锁,并恢复之前禁用的中断。
使用场景:当获取锁期间禁用了中断,需要释放锁并恢复中断时可以使用该宏。
6. `raw_spin_lock(lock)`
该宏用于获取一个自旋锁。
使用场景:当需要对共享资源进行保护时可以使用该宏。
内核代码
void raw_spin_rq_lock_nested(struct rq *rq, int subclass)
{
raw_spinlock_t *lock;
/* Matches synchronize_rcu() in __sched_core_enable() */
preempt_disable();
if (sched_core_disabled()) {
raw_spin_lock_nested(&rq->__lock, subclass);
/* preempt_count *MUST* be > 1 */
preempt_enable_no_resched();
return;
}
for (;;) {
lock = __rq_lockp(rq);
raw_spin_lock_nested(lock, subclass);
if (likely(lock == __rq_lockp(rq))) {
/* preempt_count *MUST* be > 1 */
preempt_enable_no_resched();
return;
}
raw_spin_unlock(lock);
}
}
解释:
-
raw_spinlock_t *lock;
:定义一个指向自旋锁的指针变量lock
。 -
preempt_disable();
:禁用抢占,防止在获取自旋锁期间被其他线程打断。 -
if (sched_core_disabled()) {
:判断调度器是否已经被禁用(即内核正在进行RCU同步)。 -
raw_spin_lock_nested(&rq->__lock, subclass);
:如果调度器已经被禁用,则直接获取给定运行队列的自旋锁,并允许使用嵌套锁。 -
preempt_enable_no_resched();
:启用抢占,但不会立即触发调度,而是等待当前执行完成后再进行调度。 -
return;
:返回函数。 -
lock = __rq_lockp(rq);
:获取当前运行队列的自旋锁。 -
raw_spin_lock_nested(lock, subclass);
:尝试获取自旋锁。 -
if (likely(lock == __rq_lockp(rq))) {
:检查当前获取的自旋锁是否与之前获取的锁相同。 -
preempt_enable_no_resched();
:如果两个锁相同,则启用抢占并返回函数。 -
return;
:返回函数。 -
raw_spin_unlock(lock);
:如果两个锁不同,则释放之前获取的锁,并重新尝试获取自旋锁。
该函数的作用是获取给定运行队列的自旋锁,并允许使用嵌套锁。它采用了自旋锁和循环等机制来保证线程安全性,并禁用抢占来避免竞争条件。在调度器被禁用时,该函数直接获取自旋锁并返回;否则,它会循环尝试获取自旋锁,直到成功为止。
小知识
上述代码中有一段注释
/* Matches synchronize_rcu() in __sched_core_enable() */
这段注释的意思是该函数中的代码逻辑与__sched_core_enable()
函数中的synchronize_rcu()
调用相匹配。
在Linux内核中,RCU(Read-Copy-Update)是一种非阻塞的同步机制,它通过延迟更新操作来避免了锁的使用。当需要对共享资源进行修改时,RCU会先创建一个新的副本,并将修改操作应用于该副本。然后,在适当的时间点,RCU会将修改后的副本与原始数据合并,从而完成更新操作。在这个过程中,读操作仍然可以继续访问原始数据,因为它们只会访问不可变的数据副本。
在调度器中,当需要禁用调度器时,需要确保当前所有CPU上的任务都已经进入空闲状态。为了达到这个目的,内核会使用RCU来同步所有CPU上的任务。具体来说,当禁用调度器时,内核会调用__sched_core_disable()
函数,该函数会调用synchronize_rcu()
函数来等待所有CPU上的RCU回调函数执行完毕。当所有RCU回调函数都执行完毕后,内核才会继续执行禁用调度器的操作。因此,在synchronize_rcu()
函数执行期间,所有CPU上的任务都处于被阻塞的状态。
在本题中,该函数中的代码逻辑与synchronize_rcu()
函数的调用相匹配,因为它在禁用抢占之前先判断了调度器是否已经被禁用。如果调度器已经被禁用,则直接获取自旋锁并启用抢占;否则,循环尝试获取自旋锁,直到成功为止。这样可以确保当前所有CPU上的任务都已经进入空闲状态,并避免在获取自旋锁期间被其他线程打断。
#define preempt_disable() uatomic_inc(&preempt_count)
#define preempt_enable() uatomic_dec(&preempt_count)
这两个宏定义是用于在Linux内核中禁用和启用抢占的。
1. `preempt_disable()`:该宏会使用原子操作(uatomic_inc)将当前CPU上的抢占计数器(preempt_count)加1,
2. 从而禁用抢占。当抢占被禁用时,当前进程会一直运行,直到主动放弃CPU或者抢占被重新启用。
3. `preempt_enable()`:该宏会使用原子操作(uatomic_dec)将当前CPU上的抢占计数器(preempt_count)减1,
4. 从而启用抢占。当抢占被启用时,当前进程可能会被其他高优先级进程打断,从而让出CPU资源。
这两个宏通常用于对临界区进行保护,以确保在访问共享资源期间不会被其他进程或中断打断。
例如,在内核中对共享数据结构进行修改时,可以使用`preempt_disable()`来禁用抢占,
并使用相应的自旋锁或信号量等机制来保护共享数据结构。然后,再使用`preempt_enable()`来启用抢占,
以允许其他进程或中断打断当前进程。
内核代码
static inline void __raw_read_lock(rwlock_t *lock)
{
preempt_disable();
rwlock_acquire_read(&lock->dep_map, 0, 0, _RET_IP_);
LOCK_CONTENDED(lock, do_raw_read_trylock, do_raw_read_lock);
}
这是一个内联函数,实现了读锁的获取操作。函数接受一个指向rwlock_t类型的锁变量指针作为参数。
函数首先调用preempt_disable()函数来禁用抢占,以确保在持有锁期间不会发生任务切换。然后调用rwlock_acquire_read()函数来获取读锁,并传递了相关的参数。该函数是内核中用于获取读写锁的通用函数,会根据锁当前的状态和是否存在竞争情况进行相应的处理。
如果读锁当前被占用,或者其他进程正在竞争该读锁,则会调用LOCK_CONTENDED宏来执行等待(自旋)操作。其中,do_raw_read_trylock()和do_raw_read_lock()分别是尝试获取读锁和真正获取读锁的函数,具体哪个函数会被调用取决于当前的锁状态。
该函数通过禁用抢占、调用通用的读锁获取函数和等待机制,实现了对读锁的获取操作。