「前言」文章是关于C++11线程库相关的
「归属专栏」C嘎嘎
「笔者」枫叶先生(fy)
「座右铭」前行路上修真我
「枫叶先生有点文青病」
「每篇一句」
请不要把陌生人的些许善意,
视为珍稀的瑰宝,
却把身边亲近人的全部付出,
当做天经地义的事情,
对其视而不见
——烽火戏诸侯《剑来》
目录
一、简介
二、线程库(thread)
三、互斥量库(mutex)
四、原子性操作库(atomic)
五、条件变量库(condition_variable)
六、实现两个线程交替打印
一、简介
在C++11之前,涉及到多线程问题,都是和平台相关的,比如 windows 和 linux 下各有自己的接口,这使得代码的可移植性比较差。C++11中最重要的特性就是对线程进行支持了,使得C++在并行编程时不需要依赖第三方库,而且在原子操作中还引入了原子类的概念。
C++11大致增加了五个库,其中常见的有:线程库(thread)、互斥量库(mutex)、原子性操作库(atomic)、条件变量库(condition_variable)
二、线程库(thread)
要使用标准库中的线程,必须包含 <thread> 头文件,thread的文档介绍:thread
成员函数有以下:
构造函数如下:
- 第一个是无参的构造函数,调用无参的构造函数创建出来的线程对象没有关联任何线程函数,即没有启动任何线程
- 第二个是带参的构造函数,调用带参的构造函数创建线程对象,能够将线程对象与线程函数fn进行关联
- 第三个是拷贝构造函数,线程是禁止拷贝的
- 第四个是移动构造函数,能够使用一个右值线程对象来构造一个线程对象
thread中常用的成员函数介绍如下:
使用无参的构造函数
thread() noexcept;
注:noexcept表示该函数不会抛异常
创建一个无参的线程如下:
thread t1;
调用无参的构造函数创建出来的线程对象没有关联任何线程函数,即没有启动任何线程。
thread提供了移动赋值函数,后续需要让该线程对象与线程函数关联时,可以使用带参的方式创建一个匿名对象,然后调用移动赋值将该匿名对象关联线程的状态转移给该线程对象,例如:
void func(int n)
{
for (int i = 0; i < n; i++)
{
cout << i << endl;
}
}
int main()
{
thread t1;//无参构造
t1 = thread(func, 20);//匿名对象移动赋值
t1.join();//线程等待
cout << "等待成功" << endl;
return 0;
}
无参构造使用场景:在线程池中就是首先需要先创建一批线程,但一开始这些线程什么也不做,当有任务到来时再让这些线程来处理这些任务
带参的构造函数
template <class Fn, class... Args>
explicit thread (Fn&& fn, Args&&... args);
参数:
- fn:可调用对象,比如函数指针、仿函数、lambda表达式、被包装器包装后的可调用对象等
- args:调用可调用对象fn时所需要的若干参数
当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。线程函数一般情况下可按照以下三种方式提供:函数指针、lambda表达式、函数对象
void ThreadFunc(int a)
{
cout << "Thread1 " << a << endl;
}
class TF
{
public:
void operator()()
{
cout << "Thread3" << endl;
}
};
int main()
{
// 线程函数为函数指针
thread t1(ThreadFunc, 10);
// 线程函数为lambda表达式
thread t2([] {cout << "Thread2" << endl; });
// 线程函数为函数对象
TF tf;
thread t3(tf);
t1.join();
t2.join();
t3.join();
cout << "Main thread!" << endl;
return 0;
}
运行结果
移动构造函数
thread (thread&& x) noexcept;
thread提供了移动构造函数,能够用一个右值线程对象来构造一个线程对象
void func(int n)
{
for (int i = 0; i < n; i++)
{
cout << i << endl;
}
}
int main()
{
thread t3 = thread(func, 10);
t3.join();
return 0;
}
注意:
- thread类是防拷贝的,不允许拷贝构造以及赋值,但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不意向线程的执行
可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效:
- 采用无参构造函数构造的线程对象
- 线程对象的状态已经转移给其他线程对象
- 线程已经调用jion或者detach结束
还有一个要注意:获取线程id(get_id)
调用thread的成员函数get_id以获取线程的id,但该方法必须通过线程对象来调用get_id函数,如果要在线程对象关联的线程函数中获取线程id,必须要使用 this_thread::get_id(),this_thread是一个命名空间
例如:
void func()
{
cout << this_thread::get_id() << endl; //获取线程id
}
int main()
{
thread t(func);
t.join();
return 0;
}
该命名空间下有四个函数,文档介绍
线程函数参数问题
线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参
void ThreadFunc1(int x)
{
x++;
}
int main()
{
int a = 10;
// 在线程函数中对a修改,不会影响外部实参
thread t1(ThreadFunc1, a);
t1.join();
cout << a << endl;
return 0;
}
如果要通过线程函数的形参改变外部的实参,可以参考以下三种方式:借助std::ref函数、地址的拷贝、lambda表达式
void ThreadFunc1(int& x)
{
x++;
}
void ThreadFunc2(int* x)
{
*x += 10;
}
int main()
{
int a = 10;
// 如果想要通过形参改变外部实参时,必须借助std::ref()函数
thread t2(ThreadFunc1, std::ref(a));
t2.join();
cout << a << endl;
// 地址的拷贝
thread t3(ThreadFunc2, &a);
t3.join();
cout << a << endl;
return 0;
}
运行结果
启动一个线程后,当这个线程退出时,需要对该线程所使用的资源进行回收,否则可能会导致内存泄露等问题。hread库给我们提供了如下两种回收线程资源的方式:线程等待(join)、线程分离(detach)
三、互斥量库(mutex)
要使用互斥量,必须包含 <mutex> 头文件,mutex文档介绍:mutex
mutex的种类
在C++11中,Mutex总共包了四个互斥量的种类
std::mutex
C++11提供的最基本的互斥量,该类的对象之间不能拷贝,也不能进行移动。mutex最常用的三个函数
注意,线程函数调用lock()时,可能会发生以下三种情况:
- 如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock之前,该线程一直拥有该锁
- 如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
- 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
线程函数调用try_lock()时,可能会发生以下三种情况
- 如果当前互斥量没有被其他线程占有,则该线程锁住互斥量,直到该线程调用 unlock释放互斥量
- 如果当前互斥量被其他线程锁住,则当前调用线程返回 false,而并不会被阻塞掉
- 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
std::recursive_mutex
其允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权,释放互斥量时需要调用与该锁层次深度相同次数的 unlock(),除此之外,std::recursive_mutex 的特性和 std::mutex 大致相同
std::timed_mutex
特性和 std::mutex 大致相同,timed_mutex 比 std::mutex 多了两个成员函数,try_lock_for(),try_lock_until()
try_lock_for()
- 接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与std::mutex 的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false
try_lock_until()
- 接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住,如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false
std::recursive_timed_mutex
recursive_timed_mutex就是recursive_mutex和timed_mutex的结合,recursive_timed_mutex既支持在递归函数中进行加锁操作,也支持定时尝试申请锁
加锁示例
int ThreadProc()
{
for (int i = 0; i < 100; i++)
{
g_lock.lock();//加锁
++number;
cout << "thread 1 :" << number << endl;
g_lock.unlock();//解锁
}
return 0;
}
int main()
{
thread t1(ThreadProc);
thread t2(ThreadProc);
t1.join();
t2.join();
cout << "number:" << number << endl;
return 0;
}
在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能通过锁的方式来进行控制
锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常。因此:C++11采用RAII的方式对锁进行了封装,即lock_guard和unique_lock
lock_guard
std::lock_gurad 是 C++11 中定义的模板类。定义如下:
template<class _Mutex>
class lock_guard
{
public:
// 在构造lock_gard时,_Mtx还没有被上锁
explicit lock_guard(_Mutex& _Mtx)
: _MyMutex(_Mtx)
{
_MyMutex.lock();
}
// 在构造lock_gard时,_Mtx已经被上锁,此处不需要再上锁
lock_guard(_Mutex& _Mtx, adopt_lock_t)
: _MyMutex(_Mtx)
{}
~lock_guard() _NOEXCEPT
{
_MyMutex.unlock();
}
lock_guard(const lock_guard&) = delete;
lock_guard& operator=(const lock_guard&) = delete;
private:
_Mutex& _MyMutex;
};
lock_guard类模板主要是通过RAII的方式,对其管理的互斥量进行了封装,在需要加锁的地方,只需要用上述介绍的任意互斥体实例化一个lock_guard,调用构造函数成功上锁,出作用域前,lock_guard对象要被销毁,调用析构函数自动解锁,可以有效避免死锁问题。
lock_guard的缺陷:太单一,用户没有办法对该锁进行控制,因此C++11又提供了unique_lock
模拟实现lock_guard
namespace fy
{
template<class Mutex>
class lock_guard
{
public:
lock_guard(Mutex& mtx)
:_mtx(mtx)
{
mtx.lock(); //加锁
}
~lock_guard()
{
mtx.unlock(); //解锁
}
lock_guard(const lock_guard&) = delete;
lock_guard& operator=(const lock_guard&) = delete;
private:
Mutex& _mtx;
};
}
unique_lock
与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。
- 在构造(或移动(move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,
- 新创建的 unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。
- 使用以上类型互斥量实例化unique_lock的对象时,自动调用构造函数上锁,
- unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。
与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:
- 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
- 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
- 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相同)、mutex(返回当前unique_lock所管理的互斥量的指针)
四、原子性操作库(atomic)
多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的,那么没问题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。
文档介绍:<atomic> - C++ Reference (cplusplus.com)
比如:
unsigned long sum = 0;
void fun(size_t num)
{
for (size_t i = 0; i < num; ++i)
sum++;
}
int main()
{
cout << "Before joining,sum = " << sum << std::endl;
thread t1(fun, 10000000);
thread t2(fun, 10000000);
t1.join();
t2.join();
cout << "After joining,sum = " << sum << std::endl;
return 0;
}
上述代码中分别让两个线程对同一个变量n进行了10000000次++
操作,理论上最终n的值应该是20000000,但最终打印出n的值却是小于200000的
C++98中传统的解决方式:可以对共享修改的数据可以加锁保护
unsigned long sum = 0L;
void fun(size_t num)
{
for (size_t i = 0; i < num; ++i)
{
m.lock();
sum++;
m.unlock();
}
}
int main()
{
cout << "Before joining,sum = " << sum << std::endl;
thread t1(fun, 10000000);
thread t2(fun, 10000000);
t1.join();
t2.join();
cout << "After joining,sum = " << sum << std::endl;
return 0;
}
虽然加锁可以解决,但是加锁有一个缺陷就是:只要一个线程在对sum++时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁
因此C++11中引入了原子操作。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入的原子操作类型,使得线程间数据的同步变得非常高效
注意:需要使用以上原子操作变量时,必须添加头文件 <atomic>
修改上面的代码,使用原子性操作
atomic_long sum = { 0 };
void fun(size_t num)
{
for (size_t i = 0; i < num; ++i)
sum++; // 原子操作
}
int main()
{
cout << "Before joining, sum = " << sum << std::endl;
thread t1(fun, 1000000);
thread t2(fun, 1000000);
t1.join();
t2.join();
cout << "After joining, sum = " << sum << std::endl;
return 0;
}
注意: 需要用大括号对原子类型的变量进行初始化。
在C++11中,程序员不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的访问。
更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型
atmoic<T> t; // 声明一个类型为T的原子类型变量t
注意:
- 原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了
五、条件变量库(condition_variable)
condition_variable文档介绍:condition_variable - C++ Reference (cplusplus.com)
condition_variable中提供的成员函数,可分为wait系列和notify系列两类。
wait系列成员函数的作用就是让调用线程进行阻塞等待,notify系列成员函数的作用就是唤醒等待的线程
注:条件变量是配合互斥量使用的
wait函数提供了两个不同版本的接口:
wait:
- 调用第一个版本的wait函数时只需要传入一个互斥锁,线程调用wait后会立即被阻塞,直到被唤醒。
- 调用第二个版本的wait函数时除了需要传入一个互斥锁,还需要传入一个返回值类型为bool的可调用对象,与第一个版本的wait不同的是,当线程被唤醒后还需要调用传入的可调用对象,如果可调用对象的返回值为false,那么该线程还需要继续被阻塞
notify:
notify_one
:唤醒等待队列中的首个线程,如果等待队列为空则什么也不做notify_all
:唤醒等待队列中的所有线程,如果等待队列为空则什么也不做
六、实现两个线程交替打印
实现两个线程交替打印,一个打印奇数,一个打印偶数
int main()
{
int n = 100;
mutex mtx;
condition_variable condv;
bool flag = true;
//奇数
thread t1([&] {
int i = 1;
while (i <= 100)
{
unique_lock<mutex> ul(mtx);
condv.wait(ul, [&flag]()->bool {return flag; }); //等待条件变量满足
cout << this_thread::get_id() << ":" << i << endl;
i += 2;
flag = false;
condv.notify_one(); //唤醒条件变量下等待的一个线程
}
});
//偶数
thread t2([&] {
int j = 2;
while (j <= 100)
{
unique_lock<mutex> ul(mtx);
condv.wait(ul, [&flag]()->bool {return !flag; }); //等待条件变量满足
cout << this_thread::get_id() << ":" << j << endl;
j += 2;
flag = true;
condv.notify_one(); //唤醒条件变量下等待的一个线程
}
});
t1.join();
t2.join();
return 0;
}
注:线程库(thread)、互斥量库(mutex)、原子性操作库(atomic)、条件变量库(condition_variable)在Linux有类似详细解释,这里不再详细解释
--------------------- END ----------------------
「 作者 」 枫叶先生
「 更新 」 2023.5.22
「 声明 」 余之才疏学浅,故所撰文疏漏难免,
或有谬误或不准确之处,敬请读者批评指正。