目录
1. Linux线程互斥
进程线程间的互斥相关背景概念
互斥量mutex
互斥量的接口
初始化互斥量
销毁互斥量
互斥量加锁和解锁
互斥量实现原理探究
可重入VS线程安全
概念
常见的线程不安全的情况
常见的线程安全的情况
常见不可重入的情况
常见可重入的情况
可重入与线程安全联系
可重入与线程安全区别
2. 常见锁概念
死锁
死锁四个必要条件
避免死锁
避免死锁算法
后记:●由于作者水平有限,文章难免存在谬误之处,敬请读者斧正,俚语成篇,恳望指教!
——By 作者:新晓·故知
1. Linux线程互斥
进程线程间的互斥相关背景概念
- 临界资源:多线程执行流共享的资源就叫做临界资源
- 临界区:每个线程内部,访问临界资源的代码,就叫做临界区
- 互斥:任何时刻,互斥保证有且只有一个执行流进入临界区,访问临界资源,通常对临界资源起保护作用
- 原子性(后面讨论如何实现):不会被任何调度机制打断的操作,该操作只有两态,要么完成,要么未完成
凡是在寄存器中的数据,全部都是线程的内部上下文,多个线程看起来是在同时访问寄存器,但是互不影响!
互斥量mutex
- 大部分情况,线程使用的数据都是局部变量,变量的地址空间在线程栈空间内,这种情况,变量归属单个线程,其他线程无法获得这种变量。
- 但有时候,很多变量都需要在线程间共享,这样的变量称为共享变量,可以通过数据的共享,完成线程之间的交互。
- 多个线程并发的操作共享变量,会带来一些问题
// 操作共享变量会有问题的售票系统代码 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <pthread.h> int ticket = 100; void *route(void *arg) { char *id = (char *)arg; while (1) { if (ticket > 0) { usleep(1000); printf("%s sells ticket:%d\n", id, ticket); ticket--; } else { break; } } } int main() { pthread_t t1, t2, t3, t4; pthread_create(&t1, NULL, route, (void*)"thread 1"); pthread_create(&t2, NULL, route, (void*)"thread 2"); pthread_create(&t3, NULL, route, (void*)"thread 3"); pthread_create(&t4, NULL, route, (void*)"thread 4"); pthread_join(t1, NULL); pthread_join(t2, NULL); pthread_join(t4, NULL); }
一次执行结果:
thread 4 sells ticket:100
...
thread 4 sells ticket:1
thread 2 sells ticket:0
thread 1 sells ticket:-1
thread 3 sells ticket:-2
为什么可能无法获得争取结果?
- if 语句判断条件为真以后,代码可以并发的切换到其他线程
- usleep 这个模拟漫长业务的过程,在这个漫长的业务过程中,可能有很多个线程会进入该代码段
- --ticket 操作本身就不是一个原子操作
取出ticket--部分的汇编代码objdump -d a.out > test.objdump 152 40064b: 8b 05 e3 04 20 00 mov 0x2004e3(%rip),%eax # 600b34 <ticket> 153 400651: 83 e8 01 sub $0x1,%eax 154 400654: 89 05 da 04 20 00 mov %eax,0x2004da(%rip) # 600b34 <ticket>
-- 操作并不是原子操作,而是对应三条汇编指令:
- load :将共享变量ticket从内存加载到寄存器中
- update : 更新寄存器里面的值,执行-1操作
- store :将新值,从寄存器写回共享变量ticket的内存地址
要解决以上问题,需要做到三点:
- 代码必须要有互斥行为:当代码进入临界区执行时,不允许其他线程进入该临界区。
- 如果多个线程同时要求执行临界区的代码,并且临界区没有线程在执行,那么只能允许一个线程进入该临界区。
- 如果线程不在临界区中执行,那么该线程不能阻止其他线程进入临界区。
要做到这三点,本质上就是需要一把锁。 Linux 上提供的这把锁叫互斥量。互斥量的接口
初始化互斥量
初始化互斥量有两种方法:
- 方法1,静态分配:pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER
- 方法2,动态分配:
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t*restrict attr);参数:mutex :要初始化的互斥量attr : NULL
销毁互斥量
销毁互斥量需要注意:
- 使用 PTHREAD_ MUTEX_ INITIALIZER 初始化的互斥量不需要销毁
- 不要销毁一个已经加锁的互斥量
- 已经销毁的互斥量,要确保后面不会有线程再尝试加锁
int pthread_mutex_destroy(pthread_mutex_t *mutex) ;互斥量加锁和解锁
int pthread_mutex_lock(pthread_mutex_t *mutex); int pthread_mutex_unlock(pthread_mutex_t *mutex); 返回值:成功返回0,失败返回错误号
调用 pthread_ lock 时,可能会遇到以下情况 :
- 互斥量处于未锁状态,该函数会将互斥量锁定,同时返回成功
- 发起函数调用时,其他线程已经锁定互斥量,或者存在其他线程同时申请互斥量,但没有竞争到互斥量,那么pthread_ lock调用会陷入阻塞(执行流被挂起),等待互斥量解锁。
改进上面的售票系统 :#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <pthread.h> #include <sched.h> int ticket = 100; pthread_mutex_t mutex; void *route(void *arg) { char *id = (char*)arg; while ( 1 ) { pthread_mutex_lock(&mutex); if ( ticket > 0 ) { usleep(1000); printf("%s sells ticket:%d\n", id, ticket); ticket--; pthread_mutex_unlock(&mutex); // sched_yield(); 放弃CPU } else { pthread_mutex_unlock(&mutex); break; } } } int main( void ) { pthread_t t1, t2, t3, t4; pthread_mutex_init(&mutex, NULL); pthread_create(&t1, NULL, route, "thread 1"); pthread_create(&t2, NULL, route, "thread 2"); pthread_create(&t3, NULL, route, "thread 3"); pthread_create(&t4, NULL, route, "thread 4"); pthread_join(t1, NULL); pthread_join(t2, NULL); pthread_join(t3, NULL); pthread_join(t4, NULL); pthread_mutex_destroy(&mutex); }
#include <iostream> #include <cstring> #include <unistd.h> #include <pthread.h> #include <unistd.h> #include <sys/syscall.h> using namespace std; // int 票数计数器 // 临界资源 int tickets = 10000; // 临界资源,可能会因为共同访问,可能会造成数据不一致问题。 pthread_mutex_t mutex; void *getTickets(void *args) { const char *name = static_cast<const char *>(args); while (true) { // 临界区,只要对临界区加锁,而且加锁的粒度约细越好 // 加锁的本质是让线程执行临界区代码串行化 // 加锁是一套规范,通过临界区对临界资源进行访问的时候,要加就都要加 // 锁保护的是临界区, 任何线程执行临界区代码访问临界资源,都必须先申请锁,前提是都必须先看到锁! // 这把锁,本身不就也是临界资源吗?锁的设计者早就想到了 // pthread_mutex_lock: 竞争和申请锁的过程,就是原子的! // 难度在加锁的临界区里面,就没有线程切换了吗???? pthread_mutex_lock(&mutex); if (tickets > 0) { usleep(1000); cout << name << " 抢到了票, 票的编号: " << tickets << endl; tickets--; pthread_mutex_unlock(&mutex); //other code usleep(123); //模拟其他业务逻辑的执行 } else { // 票抢到几张,就算没有了呢?0 cout << name << "已经放弃抢票了,因为没有了..." << endl; pthread_mutex_unlock(&mutex); break; } } return nullptr; } // 如何理解exit? int main() { pthread_mutex_init(&mutex, nullptr); pthread_t tid1; pthread_t tid2; pthread_t tid3; pthread_t tid4; pthread_create(&tid1, nullptr, getTickets, (void *)"thread 1"); pthread_create(&tid2, nullptr, getTickets, (void *)"thread 2"); pthread_create(&tid3, nullptr, getTickets, (void *)"thread 3"); pthread_create(&tid4, nullptr, getTickets, (void *)"thread 4"); // sleep(1); // 倾向于:让主线程,分离其他线程 // pthread_detach(tid1); // pthread_detach(tid2); // pthread_detach(tid3); // 1. 立即分离,延后分离 -- 线程活着 -- 意味着,我们不在关心这个线程的死活。4. 线程退出的第四种方式,延后退出 // 2. 新线程分离,但是主线程先退出(进程退出) --- 一般我们分离线程,对应的main thread一般不要退出(常驻内存的进程) // sleep(1); int n = pthread_join(tid1, nullptr); cout << n << ":" << strerror(n) << endl; n = pthread_join(tid2, nullptr); cout << n << ":" << strerror(n) << endl; n = pthread_join(tid3, nullptr); cout << n << ":" << strerror(n) << endl; n = pthread_join(tid4, nullptr); cout << n << ":" << strerror(n) << endl; pthread_mutex_destroy(&mutex); return 0; }
互斥量实现原理探究
- 经过上面的例子,大家已经意识到单纯的 i++ 或者 ++i 都不是原子的,有可能会有数据一致性问题
- 为了实现互斥锁操作,大多数体系结构都提供了swap或exchange指令,该指令的作用是把寄存器和内存单元的数据相交换,由于只有一条指令,保证了原子性,即使是多处理器平台,访问内存的 总线周期也有先后, 一个处理器上的交换指令执行时另一个处理器的交换指令只能等待总线周期。 现在我们把lock和unlock的伪代码改一下
可重入VS线程安全
概念
- 线程安全:多个线程并发同一段代码时,不会出现不同的结果。常见对全局变量或者静态变量进行操作,并且没有锁保护的情况下,会出现该问题。
- 重入:同一个函数被不同的执行流调用,当前一个流程还没有执行完,就有其他的执行流再次进入,我们称之为重入。一个函数在重入的情况下,运行结果不会出现任何不同或者任何问题,则该函数被称为可重入函数,否则,是不可重入函数。
常见的线程不安全的情况
- 不保护共享变量的函数
- 函数状态随着被调用,状态发生变化的函数
- 返回指向静态变量指针的函数
- 调用线程不安全函数的函数
常见的线程安全的情况
- 每个线程对全局变量或者静态变量只有读取的权限,而没有写入的权限,一般来说这些线程是安全的
- 类或者接口对于线程来说都是原子操作
- 多个线程之间的切换不会导致该接口的执行结果存在二义性
常见不可重入的情况
- 调用了malloc/free函数,因为malloc函数是用全局链表来管理堆的
- 调用了标准I/O库函数,标准I/O库的很多实现都以不可重入的方式使用全局数据结构
- 可重入函数体内使用了静态的数据结构
malloc 底层一定要调用底层申请函数,brk,常见可重入的情况
- 不使用全局变量或静态变量
- 不使用用malloc或者new开辟出的空间
- 不调用不可重入函数
- 不返回静态或全局数据,所有数据都有函数的调用者提供
- 使用本地数据,或者通过制作全局数据的本地拷贝来保护全局数据
可重入与线程安全联系
- 函数是可重入的,那就是线程安全的
- 函数是不可重入的,那就不能由多个线程使用,有可能引发线程安全问题
- 如果一个函数中有全局变量,那么这个函数既不是线程安全也不是可重入的。
可重入与线程安全区别
- 可重入函数是线程安全函数的一种
- 线程安全不一定是可重入的,而可重入函数则一定是线程安全的。
- 如果将对临界资源的访问加上锁,则这个函数是线程安全的,但如果这个重入函数若锁还未释放则会产生死锁,因此是不可重入的。
#include <iostream> #include <cstdio> #include <cstring> #include <unistd.h> #include <pthread.h> #include "Lock.hpp" #include <mutex> using namespace std; #define NAMESIZE 64 typedef struct threadData { char name[NAMESIZE]; pthread_mutex_t *mutexp; } threadData; int tickets = 1000; Mutex mymutex; // 函数本质是一个代码块, 会被多个线程同时调用执行,该函数被重复进入 - 被重入了 bool getTickets() { static int cnt = 0; //统计该函数被调用的次数 bool ret = false; // 函数的局部变量,在栈上保存,线程具有独立的栈结构,每个线程各自一份 LockGuard lockGuard(&mymutex); //局部对象的声明周期是随代码块的! if (tickets > 0) { usleep(1001); //线程切换了 cout << "thread: " << pthread_self() << " get a ticket: " << tickets << endl; tickets--; ret = true; } cnt++; return ret; } void *startRoutine(void *args) { const char *name = static_cast<const char *>(args); while(true) { if(!getTickets()) { break; } cout << name << " get tickets success" << endl; //其他事情要做 sleep(1); } } int main() { pthread_t t1, t2, t3, t4; pthread_create(&t1, nullptr, startRoutine, (void *)"thread 1"); pthread_create(&t2, nullptr, startRoutine, (void *)"thread 2"); pthread_create(&t3, nullptr, startRoutine, (void *)"thread 3"); pthread_create(&t4, nullptr, startRoutine, (void *)"thread 4"); pthread_join(t1, nullptr); pthread_join(t2, nullptr); pthread_join(t3, nullptr); pthread_join(t4, nullptr); }
2. 常见锁概念
死锁
- 死锁是指在一组进程中的各个进程均占有不会释放的资源,但因互相申请被其他进程所站用不会释放的资源而处于的一种永久等待状态。
死锁四个必要条件
- 互斥条件:一个资源每次只能被一个执行流使用
- 请求与保持条件:一个执行流因请求资源而阻塞时,对已获得的资源保持不放
- 不剥夺条件:一个执行流已获得的资源,在末使用完之前,不能强行剥夺
- 循环等待条件:若干执行流之间形成一种头尾相接的循环等待资源的关系
避免死锁
- 破坏死锁的四个必要条件
- 加锁顺序一致
- 避免锁未释放的场景
- 资源一次性分配
避免死锁算法
- 死锁检测算法
- 银行家算法
#include <iostream> #include <cstdio> #include <cstring> #include <unistd.h> #include <pthread.h> #include "Lock.hpp" using namespace std; pthread_mutex_t mutexA = PTHREAD_MUTEX_INITIALIZER; pthread_mutex_t mutexB = PTHREAD_MUTEX_INITIALIZER; void *startRoutine1(void *args) { while (true) { pthread_mutex_lock(&mutexA); sleep(1); pthread_mutex_lock(&mutexB); cout << "我是线程1,我的tid: " << pthread_self() << endl; pthread_mutex_unlock(&mutexA); pthread_mutex_unlock(&mutexB); } } void *startRoutine2(void *args) { while (true) { pthread_mutex_lock(&mutexB); sleep(1); pthread_mutex_lock(&mutexA); cout << "我是线程2, 我的tid: " << pthread_self() << endl; pthread_mutex_unlock(&mutexB); pthread_mutex_unlock(&mutexA); } } int main() { pthread_t t1, t2; pthread_create(&t1, nullptr, startRoutine1, nullptr); pthread_create(&t2, nullptr, startRoutine2, nullptr); pthread_join(t1, nullptr); pthread_join(t2, nullptr); return 0; }