目录
1. 死锁
解决死锁问题
2. 同步
2.1 条件变量函数 cond
2.2 条件变量的使用:
3.CP 问题--理论
4. 基于 BlockingQueue 的生产者消费者模型
1. 基本概念
2.BlockQueue.hpp
基本设置:
生产关系控制:
消费关系的控制
⭕思考点
test 函数:
进化执行 Task.hpp
3. 注意点
1. 死锁
• 死锁是指在一组进程中的各个进程均占有不会释放的资源,但因互相申请被其他进程所占用不会释放的资源,而处于的一种永久等待状态。
死锁四个必要条件 (必须同时满足)
- 互斥条件:一个资源每次只能被一个执行流使用--前提
- 请求与保持条件:一个执行流因请求资源而阻塞时,对已获得的资源保持不放--原则
- 不剥夺条件:一个执行流已获得的资源,在末使用完之前,不能强行剥夺--原则
- 循环等待条件:若干执行流之间形成一种头尾相接的循环等待资源的关系--重要条件
解决死锁问题
理念:破坏四个必要条件--只需要一个不满足就可以的
方法:
- 加锁顺序一致
我们在申请锁的时候,A线程先申请A锁,在申请B锁,而B线程先申请B锁,在申请A锁,所以两个线程天然申请锁的顺序就是环状的。我们可以尽量不让线程出现这个环路情况,我们让两个线程申请锁的顺序保持一致,就可以破坏循环等待问题。两个线程都是先申请A锁在申请B锁。
- 避免锁未释放的场景
接口:pthread_mutex_trylock
,失败了就会返回退出,释放锁
- 资源一次性分配
资源一次性分配,比如说你有一万行代码,有五处要申请锁,你可以最开始一次就给线程分配好,而不要把五处申请打散到代码各个区域里所导致加锁场景非常复杂
避免死锁算法
- 死锁检测算法(了解)
- 银行家算法(了解)
2. 同步
同步!同步问题是保证数据安全的情况下,让我们的线程访问资源具有一定的顺序性
保证线程安全同步了,为什么还要设置锁?
注意前言和后果。排队是结果。例如突然新来了一个线程,被锁挡在了门外,才开始到后面排队的。
分配均衡的可以使用纯互斥,同步是解决分配不均衡问题的
- 快速提出解决方案 条件变量
- 锁和铃铛(条件变量--布尔类型)都是一个结构体,OS 先描述再组织
- 条件变量必须依赖于锁的使用(条件就是被锁了,所以才加入等待队列)
条件变量
• 当一个线程互斥地访问某个变量时,它可能发现在其它线程改变状态之前,它 什么也做不了。
• 例如一个线程访问队列时,发现队列为空,它只能等待,只到其它线程将一个 节点添加到队列中。这种情况就需要用到条件变量。
2.1 条件变量函数 cond
条件变量就相当于是铃铛,和锁的设置非常的相似
- 初始化 – pthread_cond_init()
-
- 静态分配:
pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
-
- 动态分配:
-
-
- 原型:
-
int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);
-
-
- 参数:
-
-
-
-
- cond: 需要初始化的条件变量
- attr: 初始化条件变量的属性,一般设置为
nullptr
-
-
-
-
- 返回值: 成功返回
0
,失败返回错误码
- 返回值: 成功返回
-
- 销毁 – pthread_cond_destroy()
-
- 原型:
int pthread_cond_destroy(pthread_cond_t *cond);
-
- 参数:
-
-
- cond: 需要销毁的条件变量
-
-
- 返回值: 成功返回
0
,失败返回错误码 - 注意: 使用
PTHREAD_COND_INITIALIZER
初始化的条件变量不需要销毁
- 返回值: 成功返回
- 等待条件变量 – pthread_cond_wait()
-
- 原型:
int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
-
- 参数:
-
-
- cond: 需要等待的条件变量
- mutex: 当前线程所处临界区对应的互斥锁
-
- ⭕ (为什么要传这个锁变量呢?
- 1. pthread_cond_wait让线程等待的时候,会自动释放锁,将其加入到等待队列中,不用管临界资源的状态情况
-
- 返回值: 成功返回
0
,失败返回错误码 - 注意:
wait
一定要在加锁和解锁之间进行!
- 返回值: 成功返回
- 唤醒等待
-
- 唤醒全部线程 – pthread_cond_broadcast()
-
-
- 原型:
-
int pthread_cond_broadcast(pthread_cond_t *cond);
-
-
- 功能: 唤醒等待队列中的全部线程
- 参数:
-
-
-
-
- cond: 需要等待的条件变量
-
-
-
-
- 返回值: 成功返回
0
,失败返回错误码
- 返回值: 成功返回
-
-
- 唤醒首个线程 – pthread_cond_signal()
-
-
- 原型:
-
int pthread_cond_signal(pthread_cond_t *cond);
-
-
- 功能: 唤醒等待队列中的首个线程
- 参数:
-
-
-
-
- cond: 需要等待的条件变量
-
-
-
-
- 返回值: 成功返回
0
,失败返回错误码
- 返回值: 成功返回
-
测试:
错乱原因:多线程打印出现错乱,显示器是文件,看作一个共享资源
uint64 是什么?
一种跨平台的方式来表示至少 64 位的无符号整数
2.2 条件变量的使用:
原理图,以我们的单人自习室为例
对于线程的管理: 先所有都锁上,再依次唤醒,就实现了每个人进去执行一次,退出,下一个执行
while(true)
{
pthread_mutex_lock(&mutex);
pthread_cond_wait(&cond, &mutex);
std::cout << "pthread: " << number << " , cnt: " << cnt++ << std::endl;
pthread_mutex_unlock(&mutex);
}
}
int main()
{
for(uint64_t i = 0; i < 5; i++)
{
pthread_t tid;
pthread_create(&tid, nullptr, Count, (void*)i);
}
while(true)
{
sleep(1);
pthread_cond_broadcast(&cond);
std::cout << "signal one thread..." << std::endl;
}
return 0;
}
我们怎么知道我们要让一个线程去等待了?
一定是临界资源(自习室里面有人)不就绪,没错,临界资源也是有状态的!!
直接走人叫互斥,去后面排队叫同步
你怎么知道临界资源是就绪还是不就绪的?即怎么知道自习室里面有没有人
你判断出来的!判断是访问临界资源(自习室) 吗?必须是的,也就是判断必须在加锁之后!!!
所以等待的过程,一定要在加锁和解锁之间, pthread_cond_wait让线程等待的时候,会自动释放锁,将其加入到等待队列中
sum
- 等待条件满足的时候往往是在临界区内等待的
-
- 当该线程进入等待的时候,互斥锁会自动释放
- 而当该线程被唤醒时,又会自动获得对应的互斥锁
- 条件变量需要配合互斥锁使用,其中条件变量是用来完成同步的,而互斥锁是用来完成互斥的
3.CP 问题--理论
生产者消费者模型(consumer producter
)
存在超市的原因
- 效率高,中转站
- 大号的缓存,解决了忙闲不均。生产者视角:有多少存储空间,消费者:有多少商品数
- 让生产和消费的行为,进行一定程度的解耦
在计算机中,抽象出来
- 生产者:线程承担
- 超市:特定结构的内存空间->共享资源->存在并发问题
- 消费者:线程承担
将商品理解为数据,执行流在做通信
如何高效的通信
互斥是一个保证安全的手段
研究超市的并发 三种关系:
- 生产者 vs 生产者(竞争的互斥关系,只允许一个)
- 消费者 vs 消费者(互斥)
- 生产者 vs 消费者(互斥--安全,同步--一定的顺序性)
321 原则(便与记忆和给别人介绍) :
- 3 种关系
- 2 种角色--生产和消费
- 1 个交易场所--特点结构的内存空间
例如解耦 add 和 main ,实现高并发
4. 基于 BlockingQueue 的生产者消费者模型
1. 基本概念
在多线程编程中,阻塞队列(Blocking Queue)是一种常用的数据结构,用于实现生产者和消费者模型。与普通队列相比,阻塞队列具有以下特点:
- 当队列为空时,从队列获取元素的操作将会被阻塞,直到队列中有新元素被放入。
- 当队列满时,往队列里存放元素的操作也会被阻塞,直到队列中有元素被取出。
- 其余时间就是边生产边消费,同时进行
2.BlockQueue.hpp
基本设置:
template <class T>
class BlockQueue
{
static const int defalutnum = 20;
public:
BlockQueue(int maxcap = defalutnum):maxcap_(maxcap)
{
pthread_mutex_init(&mutex_, nullptr);
pthread_cond_init(&c_cond_, nullptr);
pthread_cond_init(&p_cond_, nullptr);
// low_water_ = maxcap_/3;
// high_water_ = (maxcap_*2)/3;
}
~BlockQueue()
{
pthread_mutex_destroy(&mutex_);
pthread_cond_destroy(&c_cond_);
pthread_cond_destroy(&p_cond_);
}
private:
std::queue<T> q_;
//int mincap_;
int maxcap_; // 极值
pthread_mutex_t mutex_;
pthread_cond_t c_cond_;
pthread_cond_t p_cond_;
// int low_water_;
// int high_water_;
};
- 队列 q_ 共享资源, q被当做整体使用的,q只有一份,加锁
生产关系控制:
void push(const T &in)
{
pthread_mutex_lock(&mutex_);
while(q_.size() == maxcap_){
pthread_cond_wait(&p_cond_, &mutex_);
}
q_.push(in);
// if(q_.size() > high_water_) pthread_cond_signal(&c_cond_);
pthread_cond_signal(&c_cond_);
pthread_mutex_unlock(&mutex_);
}
细节点:
- 你想生产,就直接能生产吗?不一定。你得先确保生产条件满足
pthread_mutex_lock(&mutex_);
while(q_.size() == maxcap_)
- 判断也是在访问临界资源,在内部进行判断的,所以锁要放在外面保护
- 货物满了,就伪唤醒后加入等待队列
消费关系的控制
T pop()
{
pthread_mutex_lock(&mutex_);
while(q_.size() == 0)
{
pthread_cond_wait(&c_cond_, &mutex_);
}
T out = q_.front();
q_.pop();
// if(q_.size()<low_water_) pthread_cond_signal(&p_cond_);
pthread_cond_signal(&p_cond_);
pthread_mutex_unlock(&mutex_);
return out;
}
细节点:
- 生产和消费需要分别设置两个等待队列
- 你想消费,就直接能消费吗?不一定。你得先确保消费条件满足,
while
判断队列情况
⭕思考点
谁来唤醒呢?
例如:有生产,就可以解锁唤醒消费队列了
q_.pop();
pthread_mutex_unlock(&mutex_);
对策略的添加:
发现生产和消费的同步,通过水位线来进行范围管控,例如:
if(q_.size()>high_water_) pthread_cond_signal(&c_cond_);
//大于某一水位后,唤醒尽快消费if(q_.size()<low_water_) pthread_cond_signal(&p_cond_);
test 函数:
#include "BlockQueue.hpp"
#include "Task.hpp"
#include <unistd.h>
#include <ctime>
void *Consumer(void *args)
{
BlockQueue<Task> *bq = static_cast<BlockQueue<Task> *>(args);
while (true)
{
// 消费(存在管控的加入执行,调用等待队列的封装接口)
Task t = bq->pop();
std::cout << "处理任务: " << t.GetTask() << " 运算结果是: " << t.GetResult() << " thread id: " << pthread_self() << std::endl;
t.run();//接收到的任务对象,调用接口跑起来了
sleep(1);//Pop前已经检验测试一大堆了
}
}
void *Productor(void *args)
{
int len = opers.size();
BlockQueue<Task> *bq = static_cast<BlockQueue<Task> *>(args);
int x = 10;
int y = 20;
while (true)
{
// 模拟生产者生产数据
int data1 = rand() % 10 + 1; // [1,10]
usleep(10);
int data2 = rand() % 10;
char op = opers[rand() % len];
Task t(data1, data2, op);
// 生产
bq->push(t);
std::cout << "生产了一个任务: " << t.GetTask() << " thread id: " << pthread_self() << std::endl;
sleep(1);
}
}
int main()
{
srand(time(nullptr));
// 因为 321 原则
BlockQueue<Task> *bq = new BlockQueue<Task>();
pthread_t c[3], p[5];
for (int i = 0; i < 3; i++)
{
pthread_create(c + i, nullptr, Consumer, bq);
}
for (int i = 0; i < 5; i++)
{
pthread_create(p + i, nullptr, Productor, bq);
}
for (int i = 0; i < 3; i++)
{
pthread_join(c[i], nullptr);
}
for (int i = 0; i < 5; i++)
{
pthread_join(p[i], nullptr);
}
delete bq;
return 0;
}
BlockQueue 内部可不可以传递其他数据,比如对象?比如任务???
可以。进化为基于任务的阻塞队列了
进化执行 Task.hpp
Task t = bq->pop();
,cout 执行
直接变为t.run()
例如执行如下任务
#pragma once
#include <iostream>
#include <string>
std::string opers="+-*/%";
enum{
DivZero=1,
ModZero,
Unknown
};
class Task
{
public:
Task(int x, int y, char op) : data1_(x), data2_(y), oper_(op), result_(0), exitcode_(0)
{
}
void run()
{
switch (oper_)
{
case '+':
result_ = data1_ + data2_;
break;
case '-':
result_ = data1_ - data2_;
break;
case '*':
result_ = data1_ * data2_;
break;
case '/':
{
if(data2_ == 0) exitcode_ = DivZero;
else result_ = data1_ / data2_;
}
break;
case '%':
{
if(data2_ == 0) exitcode_ = ModZero;
else result_ = data1_ % data2_;
} break;
default:
exitcode_ = Unknown;
break;
}
}
void operator ()()
{
run();
}
std::string GetResult()
{
std::string r = std::to_string(data1_);
r += oper_;
r += std::to_string(data2_);
r += "=";
r += std::to_string(result_);
r += "[code: ";
r += std::to_string(exitcode_);
r += "]";
return r;
}
std::string GetTask()
{
std::string r = std::to_string(data1_);
r += oper_;
r += std::to_string(data2_);
r += "=?";
return r;
}
~Task()
{
}
private:
int data1_;
int data2_;
char oper_;
int result_;
int exitcode_;
};
生产者消费者模型高效在哪里?
答案是生产者消费者模式并不高效在队列中拿放,而是在生产之前和消费之后,让线程并行执行!!
同样生产者消费者的意义也不再队列中,而是在放之前同时生产,拿之后同时消费。
3. 注意点
- 判断生产消费条件
-
- 这是因为线程可能被伪唤醒(即线程被唤醒但条件仍未满足),使用
while
可以确保线程在真正满足条件时才继续执行。
- 这是因为线程可能被伪唤醒(即线程被唤醒但条件仍未满足),使用
- pthread_cond_wait 函数
-
pthread_cond_wait
是让当前线程进入等待状态的函数。- 如果调用失败,线程将继续执行,可能导致逻辑错误(如尝试从空队列中取数据或向满队列中添加数据)。
- 多消费者情况下的唤醒
-
- 使用
pthread_cond_broadcast
唤醒所有等待的消费者时,若只有一个数据可供消费,则会导致其他消费者被伪唤醒。 - 为了避免这种情况,线程在被唤醒后应再次检查条件是否满足。
- 使用
- 使用 while 判断的必要性
- 在判断是否满足生产或消费条件时,应使用
while
循环而非if
语句。
-
- 为了防止伪唤醒导致的问题,必须使用
while
,确保线程在满足条件时才继续执行。
- 为了防止伪唤醒导致的问题,必须使用
思路:上锁访问,检查达到某一条件,等待,未达到执行,检查完后解锁,所检查完后满足的线程,接收任务同时跑,线程再上锁访问,尝试获取下一个任务以此循环。
cp 模型的思路如上,简单实现了代码,下一章将结合信号量,优化完善代码并进行测试~