并发编程–条件量与死锁及其解决方案
文章目录
- 并发编程--条件量与死锁及其解决方案
- 1.条件量
- 1.1条件量基本概念
- 1.2条件量的使用
- 2. 死锁
1.条件量
1.1条件量基本概念
在许多场合中,程序的执行通常需要满足一定的条件,条件不成熟的时候,任务应该进入睡眠阻塞等待,条件成熟时应该可以被快速唤醒。另外,在并发程序中,会其他任务同时访问该条件,因此任何时候都必须以互斥的方式对条件进行访问。条件量就是专门解决上述场景的逻辑机制。
注意,上述表述中,条件和条件量是两个不同的东西,所谓条件就是指程序要继续运行所需要的前提条件,比如文件是否读完、内存是否清空等具体的场景限定,而条件量(即pthread_cond_t
)是本节课件要讨论的一种同步互斥变量,专用于解决上述逻辑场景。
条件量的逻辑
说明:
- 在进行条件判断前,先加锁(防止其他任务并发访问)
- 成功加锁后,判断条件是否允许
- 若条件允许,则直接操作临界资源,然后释放锁
- 若条件不允许,则进入条件量的等待队列中睡眠,并同时释放锁
- 在条件量中睡眠的任务,可以被其他任务唤醒,唤醒时重新判定条件是否允许程序继续执行,当然也是必须先加锁。
1.2条件量的使用
条件量一般要跟互斥锁(或二值信号量)配套使用,互斥锁提供锁住临界资源的功能,条件量提供阻塞睡眠和唤醒的功能。
一般流程示例
以取款为例,假设有多个任务可同时访问存款余额 balance
,其中某个任务希望从中取出 ¥100
元,并且要求满足如下逻辑:
- 如果余额中有大于等于100元,则立即取出
- 如果余额小于100元,则进入睡眠等待
- 当有别的任务修改了余额时可被唤醒,并继续判定是否可取款
pthread_mutex_t m; // 互斥锁
pthread_cond_t v; // 条件量
// 银行余额(全局变量,意味着有别的进程可随时访问)
extern int balance;
int main()
{
// 1,初始化
pthread_mutex_init(&m, NULL);
pthread_cond_init(&v, NULL);
// 2,对m加锁
pthread_mutex_lock(&m);
// 2,当条件不允许时,进入条件量中睡眠
// 进入睡眠时,会自动对m解锁
// 退出睡眠时,会自动对m加锁
while(balance < 100)
pthread_cond_wait(&v, &m);
// 3,取款
balance -= 100;
// 4,对m解锁
pthread_mutex_unlock(&m);
}
其他任务,可以在适当的时候,通过如下接口来唤醒处于睡眠态的任务:
// 单个唤醒,唤醒第一个进入条件量中睡眠的任务
pthread_cond_signal(&v);
// 集体唤醒,唤醒进入条件量中睡眠的所有任务
pthread_cond_broadcast(&v);
2. 死锁
死锁指的是由于某种逻辑问题,导致等待一把永远无法获得的锁的困境。比如最简单的是同一线程,连续对同一锁资源进行加锁,就进入了死锁。
最简单的死锁示例
pthread_mutex_t m;
int main()
{
pthread_mutex_init(&m, NULL);
// 正常加锁
pthread_mutex_lock(&m);
// 未释放锁前重复加锁,进入死锁状态
pthread_mutex_lock(&m);
// 下面的代码永远无法执行
...
...
}
以上死锁的例子,可以通过仔细检查代码得以避免,但在现实场景中,有些产生死锁的情况是无法避免的,比如如下情形:
一条线程持有一把锁,期间不能屏蔽取消指令
然后又恰巧被取消指令强制终止,此时死锁的产生变得不可避免。
产生死锁示例
void *routine(void *arg)
{
thread_pool *pool = (thread_pool *)arg;
struct task *p;
while(1)
{
// 操作临界资源之前,加锁
pthread_mutex_lock(&pool->lock);
// 条件不允许时,进入条件量等待
while(pool->waiting_tasks == 0 && !pool->shutdown)
pthread_cond_wait(&pool->cond, &pool->lock);
// 条件允许时,操作临界资源
p = pool->task_list->next;
pool->task_list->next = p->next;
pool->waiting_tasks--;
// !!! 注意 !!!
// 线程若恰好在此处被意外终止,将导致死锁
// 解锁
pthread_mutex_unlock(&pool->lock);
// 其他操作
pthread_setcancelstate(PTHREAD_CANCEL_DISABLE, NULL);
(p->do_task)(p->arg);
pthread_setcancelstate(PTHREAD_CANCEL_ENABLE, NULL);
free(p);
}
pthread_exit(NULL);
}
上述代码中,若线程在中间被取消,则导致死锁。对于这种情况,一个可行的解决办法是:
- 提前准备一个解锁处理函数,并将其压入线程专用的函数栈中备用。
- 准备操作临界资源,加锁
- 操作临界资源
- 重点:
- 若线程在此期间意外终止,则会自动调用处理函数解锁
- 解锁
- 在函数栈中弹出处理函数。
说明:
上述做法实际上相当于现实生活中的立遗嘱,因为人去世之后是无法再做任何事情的,因此为了防止死亡在关键阶段意外到来,可以在提前立遗嘱,万一不幸遇到该情况就有了预案(处理函数),但如果并未发生此种情形,那么就将遗嘱作废(弹出处理函数且不执行)即可。
根据以上思路,可将上述代码改良为如下代码:
// 意外处理函数:
// 自动解锁
void handler(void *arg)
{
pthread_mutex_unlock((pthread_mutex_t *)arg);
}
void *routine(void *arg)
{
thread_pool *pool = (thread_pool *)arg;
struct task *p;
while(1)
{
/*
** push a cleanup functon handler(), make sure that
** the calling thread will release the mutex properly
** even if it is cancelled during holding the mutex.
**
** NOTE:
** pthread_cleanup_push() is a macro which includes a
** loop in it, so if the specified field of codes that
** paired within pthread_cleanup_push() and pthread_
** cleanup_pop() use 'break' may NOT break out of the
** truely loop but break out of these two macros.
** see line 56 below.
*/
//================================================//
pthread_cleanup_push(handler, (void *)&pool->lock); // 提前准备好意外处理函数
pthread_mutex_lock(&pool->lock);
//================================================//
// 1, no task, and is NOT shutting down, then wait
while(pool->waiting_tasks == 0 && !pool->shutdown)
pthread_cond_wait(&pool->cond, &pool->lock);
// 2, no task, and is shutting down, then exit
if(pool->waiting_tasks == 0 && pool->shutdown == true)
{
pthread_mutex_unlock(&pool->lock);
pthread_exit(NULL); // CANNOT use 'break';
}
// 3, have some task, then consume it
p = pool->task_list->next;
pool->task_list->next = p->next;
pool->waiting_tasks--;
//================================================//
pthread_mutex_unlock(&pool->lock);
pthread_cleanup_pop(0); // 弹出处理函数且不执行
//================================================//
pthread_setcancelstate(PTHREAD_CANCEL_DISABLE, NULL);
(p->do_task)(p->arg);
pthread_setcancelstate(PTHREAD_CANCEL_ENABLE, NULL);
free(p);
}
pthread_exit(NULL);
}
注意:
pthread_cleanup_push()
用于将处理函数填入栈中,在线程意外终止后会被自动调用。pthread_cleanup_pop()
用于将栈中的处理函数弹出,若参数为0则意味着不执行,参数不为零则意味着执行该函数。pthread_cleanup_push()
和pthread_cleanup_pop()
必须成对出现。