目录
🚩多线程代码的健壮性
🚩多线程控制
🚩线程返回值问题
🚩关于Linux线程库
🚩对Linux线程简单的封装
在观看本博客之前,建议大家先看一文搞懂Linux多线程【上】由于上一篇博客篇幅太长,为了更好的阅读体验,我拆成了两篇博客。那么接下来,在上一篇的基础上,我们继续学习Linux信号部分。今天,我们主要学习Linux多线程控制问题。
🚩多线程代码的健壮性
一份代码写的如何,一项重要的指标就是这份代码的健壮性
我们来写一份代码:
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
using namespace std;
int g_val=0;
void* pthread_routine(void *args)
{
while(1)
{
cout<<"我是新进程,我正在运行,g_val:"<< g_val++<<" &g_val: "<<&g_val<<endl;
int n=0;
n=n/0;
// 发生除零错误,
sleep(1);
}
}
int main()
{
pthread_t tid;
int n=pthread_create(&tid,nullptr,pthread_routine,(void *)"thread one");
assert(n==0);
(void)n;
while(1)
{
cout<<"我是主进程,我正在运行,g_val:"<<g_val<<" &g_val:"<<&g_val<<endl;
sleep(1);
}
return 0;
}
在新线程中,出现了除零错误。
我们发现:新线程和主线程一起被干掉了。为什么?
这是因为代码中出现了错误,操作系统堆整个进程发送信号,操作系统要回收这个进程的资源,而线程是从进程那里得到的字眼,进程都没了,线程也就没法存在了。这个进程中的所有的线程都会被终止。
举个例子:在某互联网大厂,张三是一名程序员,他所在项目组敷个某个程序的开发。有一天,张三在写代码之前干了一瓶二锅头,代码中出现了很严重的bug,张三写代码出现了问题,就是这个项目组出现了问题。公司要对这个事情做出惩罚。所以就对张三的项目组长进行了谈话和警告。这个项目组就是一个进程,项目组的每一个成员就是一个线程(轻量级进程)。成员出现了错误,自然要惩罚这个项目组。
所以:多线程的代码的健壮性非常不好,这也是线程很大的一个缺点。
🚩多线程控制
Linux多线程控制是一个很重要的部分,这其中包括线程创建,线程等待,线程替换等等话题。
🚀Linux线程创建
我们在之前讲过如何创建线程,今天,我想一次性创建多个线程。让一个进程中包括若干个执行流。并同时运行。
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
using namespace std;
void *start_routine(void *args)
{
char *buf=static_cast<char*>(args);
int cnt=10;
while(cnt)
{
cout<<"我是新线程, "<<buf<<" cnt:"<<cnt<<endl;
cnt--;
sleep(1);
}
}
int main()
{
for(int i=0;i<10;i++)
{
pthread_t id;
char buffer[64];
snprintf(buffer,sizeof buffer,"%s:%d","thread",i);
pthread_create(&id,nullptr,start_routine,buffer);
}
while(1)
{
cout<<"我是新线程,我一直在运行"<<endl;
sleep(1);
}
}
我们发现:我们创建的新线程的打印信息都是thread:9 。但是我们通过命令查询到我们的确创建了多个线程。但为什么都是9号呢?
我们知道,如上的两点代码是两个不同的执行流,究竟是哪个执行流先被执行呢?不确定,这是由编译器的调度顺序决定的。但是我们的运行的结果证明是主线程先被执行。为什么?
我们在for循环中定义了一个字符串,在pthread_create循环中传入了字符串的起始地址。有没有可能这块空间里的内容在被打印之前就被修改了呢?事实证明就是如此。主线程在新线程读取字符串内容之前,先将字符串的内容进行了修改。
这种现象的背后的根本原因是:字符串是一个共享资源,被所有线程所共享。由此造成这一系列问题。
如何更改这种现象呢?
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
using namespace std;
class Threads
{
public:
pthread_t id;
char buffer[64];
};
void* pthread_routine(void *args)
{
int cnt=5;
Threads *newThreads=static_cast<Threads *>(args);
while(cnt--)
{
cout<<"new thread make success,name: "<<newThreads->buffer<<" cnt:"<<cnt<<endl;
sleep(1);
}
// delete newThreads;
// return nullptr;
}
int main()
{
for(int i=0;i<10;i++)
{
Threads *id=new Threads();
snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread", i);
pthread_create(&id->id,nullptr,pthread_routine,id);
}
while(1)
{
cout<<"我是主进程,我正在运行"<<endl;
sleep(1);
}
return 0;
}
我们顶定义一个类,每个线程被创建之初都会创建一个独立的类对象,这个类归线程所属,是私有的,所以不会出现上面的情况,关于这个类的相关数据储存在哪里,我们后面再谈。
接下来,我们就改过的代码来回答几个问题:
在这份代码中,start_routine函数被几个执行流执行呢?10个
start_routine函数处于什么状态?可重入状态。
那这个函数是可重入函数吗?是的。
这个函数内的变量是被所有的线程共享的吗?我们实验一下:
我们对打印内容做稍稍改动:
我们发现:不同的执行流的cnt地址都不同,说明每一个线程都有一个独立的栈结构。 至于在什么位置,我们后面再说。
线程创建我们掌握了,那如何让线程终止呢?
🚀Linux线程终止
方法一
在线程对应的代码中,return返回,这个线程就终止了。
但是不能调用exit函数,我们说过exit是用来终止进程的,这时所有的线程都会跟着终止。
方法二
调用pthread_exit函数
该函数的作用是终止调用这个函数的线程。
参数我们默认设为nullptr。
方法三
一个跑起来的线程是可以被取消的。取消线程的函数为pthread_cancel。下面,我们简单介绍一下:
#include <pthread.h>
int pthread_cancel(pthread_t thread);
参数很简单,一看就明白
返回值:成功时返回0,失败错误码被设置。
下面,我们感受一下:
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
#include<string>
using namespace std;
class Threads
{
public:
pthread_t id;
char buffer[64];
};
class ThreadReturn
{
public:
int return_result;
int return_code;
};
void* pthread_routine(void *args)
{
int cnt=5;
Threads *newThreads=static_cast<Threads *>(args);
while(cnt--)
{
cout<<"new thread make success,name: "<<newThreads->buffer<<endl;
sleep(1);
}
return (void*)123;
}
int main()
{
vector<Threads *> iter;
for(int i=0;i<10;i++)
{
Threads *id=new Threads();
snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread", i);
pthread_create(&id->id,nullptr,pthread_routine,id);
iter.push_back(id);
}
sleep(5);
// 将创建的线程先取消一半
for(int i=0;i<iter.size()/2;i++)
{
pthread_cancel(iter[i]->id);
cout<<"pthread_cancel:"<<iter[i]->buffer<<" successful"<<endl;
}
for(auto &it:iter)
{
void *ret;
int n = pthread_join(it->id, (void**)&ret);
assert(n == 0);
cout << "join " << it->id << " successful" <<(long long)ret<< endl;
}
cout<<"main thread quit"<<endl;
}
如果一个线程被pthread_cancel取消,这个线程的返回值会被设为-1。
🚀Linux线程等待
线程也是需要等待的,如果不等待,会造成类似僵尸进程问题,否则会造成内存泄漏。线程必须要被等待的。等待工作需要:
- 获取新线程的退出信息。
- 回收新线程对应的PCB资源,防止内存泄漏。
所以,我们有必要且必须对线程进行等待,线程等待函数是pthread_join。下面,我们简单介绍一下这个函数。
参数:
第一个参数为:要等待的线程的thread,第二个我们先不需要了解,默认为nullptr。
返回值:
等待成功,返回0;等待失败,返回相应的错误码。
接下来,我们来试一下:
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
using namespace std;
class Threads
{
public:
pthread_t id;
char buffer[64];
};
void* pthread_routine(void *args)
{
int cnt=5;
Threads *newThreads=static_cast<Threads *>(args);
while(cnt--)
{
cout<<"new thread make success,name: "<<newThreads->buffer<<" cnt:"<<cnt<<" &cnt"<<&cnt<<endl;
sleep(1);
}
pthread_exit(nullptr);
}
int main()
{
vector<Threads *> iter;
for(int i=0;i<10;i++)
{
Threads *id=new Threads();
snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread", i);
pthread_create(&id->id,nullptr,pthread_routine,id);
iter.push_back(id);
}
for(auto &it:iter)
{
int n=pthread_join(it->id,nullptr);
assert(n==0);
cout<<"join "<<it->id<<" successful"<<endl;
}
cout<<"main thread quit"<<endl;
}
运行一下:
如我们所见:所有的线程同一时间全部退出,接着主线程退出。
🚀Linux线程分离
- ‘’默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释放资源,从而造成系统泄漏。
- 如果不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放线程资源。
- 一个线程被分离,就不能调用pthread_join()进行线程等待。
接下来,我们简单介绍一下几个函数。
pthread_self()
#include <pthread.h>
pthread_t pthread_self(void);
使用起来很简单,作用就是返回调用该线程的Id。由于太简单,这里我们就不再演示了。
pthread_detech()
#include <pthread.h>
int pthread_detach(pthread_t thread);
参数很简单,要对哪个线程进行分离,就传入哪个线程的Id。
返回值;成功的话,返回0;失败时,错误码被设置。
接下来,我们尝试使用一下:
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
#include<string>
#include<cstring>
using namespace std;
string changeId(const pthread_t &id)
{
char buffer[128];
snprintf(buffer,sizeof buffer,"0x%x",id);
return buffer;
}
void *start_routine(void *args)
{
pthread_detach(pthread_self());
int cnt=5;
while(cnt)
{
cout<<"new spthread running..... Id:"<< changeId(pthread_self())<<endl;
sleep(1);
cnt--;
}
}
int main()
{
pthread_t id;
int n=pthread_create(&id,nullptr,start_routine,(void*)"thread noe");
assert(n==0);
(void)n;
pthread_detach(id);
sleep(5);
return 0;
}
这个函数的调用原则为:一般让主线程对新线程进行分离,在主线程中进行调用。
🚩线程返回值问题
我们刚刚在讲解pthread_join()和pthread_exit()函数时,我们一般将参数设为nullptr。至于原因,我们当时没说,现在我们就来分析一下这些参数。这些参数都是输出
一切的一切都在告诉我们这个参数不简单,我们先写个代码试一下这个参数的作用。
#include<pthread.h>
#include<iostream>
#include<unistd.h>
#include<cassert>
#include<vector>
using namespace std;
class Threads
{
public:
pthread_t id;
char buffer[64];
};
void* pthread_routine(void *args)
{
int cnt=5;
Threads *newThreads=static_cast<Threads *>(args);
while(cnt--)
{
cout<<"new thread make success,name: "<<newThreads->buffer<<endl;
sleep(1);
}
return (void*)123;
}
int main()
{
vector<Threads *> iter;
for(int i=0;i<10;i++)
{
Threads *id=new Threads();
snprintf(id->buffer,sizeof(id->buffer),"%s:%d","thread", i);
pthread_create(&id->id,nullptr,pthread_routine,id);
iter.push_back(id);
}
for(auto &it:iter)
{
void *ret;
int n=pthread_join(it->id,&ret);
assert(n==0);
cout<<"join "<<it->id<<" successful"<<" ret:"<<(long long)ret<<endl;
}
cout<<"main thread quit"<<endl;
}
我们在线程调用的函数中返回了 return (void*)123;
运行一下:
看,我们输入的123成功读取到了 。我们是怎么做到的?为了方便叙述,我将相关的代码块拎出来。
请看如下图:pthread_join的第二个参数是输出型参数
在pthread库中,有一个变量存储的数据为void* 。我们将在线程函数的返回值强转成void*,存储在这个变量中,我们暂且将这个存储的数据叫做X数据。
现在,我们在代码层面同样定义了一个void*的变量ret。如何将X数据转到我们用户层面的ret中呢?办法有两种:
方案1:直接把x的值赋值给ret。因为他们都是一级指针,解引用就可以得到数据(123)。
方案2:对ret取地址,对数据X取地址,都得到二级指针,然进行赋值,再解引用得到数据(123)。
在这里,OS采用的是第二种方式。因为我们调用的是函数来获取,无法实现简单的赋值。
接下来,我们看图理解一下
大家懂的话,可以返回任意类型的数据,但是:必须是new出来的类型,因为new出来的类型不会因为出了函数空间被释放。接下来,我给大家示范一下:
来看:
成功打出来。
进程退出时,都会设置对应的退出码,线程这里为什么没有退出码呢?
线程异常,收到信号,整个进程都会退出。
pthread_join默认就认为函数可以调用成功,不考虑异常,异常是进程应该来考虑的事情。
🚩关于Linux线程库
其实,C++也可以写多线程代码:
#include<iostream>
#include<thread>
#include<unistd.h>
using namespace std;
void start_routine()
{
cout<<"我是新线程"<<endl;
sleep(1);
}
int main()
{
std::thread t1(start_routine);
while(1)
{
cout<<"我是主线程"<<endl;
sleep(1);
}
t1.join();
return 0;
}
但是,在编译时必须指明要链接pthread库。
任何语言在Linux下使用多线程,必须使用pthread库。
c++的多线程,在Linux下,本质是对pthread库的封装。
我们遗留的问题,现在有必要搞清楚了。
我们已经确认每一个线程都有自己的独立栈结构,这个栈结构在哪里?
我们每创建一个线程,都会有一个线程的Id,这个Id看起来是个地址,究竟是什么地址?
原生线程库中有可能会存在很多的线程,要不要对这些进行有效的管理?要,管理的方式就是先描述,再组织。相对于进程的属性,线程的属性就显得非常少,因为在进程的PCB中,有一部分属性就是线程的属性。
如图,用户每在用户层面创建一个线程,就会在pthread库中创建一个属性集数据结构,该属性集指向操作系统内的一个用户级进程。
在该属性集中一定包括线程独立栈的地址,LWP值等等。
Linux方案:用户级进程,用户关心的线程属性在库中,内核(操作系统)负责提供操作系统执行流的调度。
Linux用户级线程:轻量级进程=1:1;
用户级线程库可以当作磁盘中的一个文件(也就是一个动态库)。该线程库经过映射,可以通过mmap区域找到这个动态库。一个进程的所有线程的属性集(就是TCB结构体)都会被保存在这里。 我们可以想象成一个数组。但是我们不是通过下标查找。我们创建线程返回的地址,就是对应线程的TCP在此处的起始地址,通过这个地址就可以找到这个线程私有的栈结构。
那创建一个线程,pthread库应该帮我们做哪个工作呢?
帮我们在pthread库中创建线程控制块(TCB)。然后返回TCB的起始地址,便于用户对线程进行操作。属于新线程私有的数据都会存储在线程私有栈中,主线程的数据则存储在共享区中。
🚀线程的局部存储。
废话不说,上码:
#include <pthread.h>
#include <iostream>
#include <unistd.h>
#include <cassert>
#include <vector>
#include <string>
#include <cstring>
using namespace std;
int g_val = 100;
void *start_routine(void *args)
{
while (1)
{
cout << "new pthread running..... g_val: " << g_val << " &g_val " << &g_val << endl;
sleep(1);
g_val++;
}
}
int main()
{
pthread_t id;
int n = pthread_create(&id, nullptr, start_routine, (void *)"thread noe");
assert(n == 0);
(void)n;
while (1)
{
cout << "main pthread running..... g_val: " << g_val << " &g_val " << &g_val << endl;
sleep(1);
}
pthread_join(id,nullptr);
return 0;
}
全局变量被所有进程所共享,所以新线程对数据进行修改后,主线程立刻就可以读取。
接着,我们做部分代码修改
__thread int g_val = 100;
我们发现,新线程对数据进行修改,但主线程读取的数据并未改变,并且地址读取的地址也不同。
对比,我们发现,前后地址差别好大。这就是__thread的作用了。
__thread的作用是什么?
在一个全局变量前加__thread,可以将一个内置类型设置为线程局部存储(就本例子而言,未添加前,数据存储在已初始化数据段;添加后,在运行时,会将数据给每个线程都拷贝一份,存储在自己的栈中,线程之间数据修改彼此互不影响。
由于存储的地址空间发生改变,空间中越往上地址越大,所以我们读取的地址理所当然的变大了。
🚩对Linux线程简单的封装
代码如下:
#pragma once
#include <iostream>
#include <string>
#include <cstring>
#include <cassert>
#include <functional>
#include <pthread.h>
// header only 开源代码
class Thread;
//上下文,当成一个大号的结构体
class Context
{
public:
Thread *this_;
void *args_;
public:
Context():this_(nullptr), args_(nullptr)
{}
~Context()
{}
};
class Thread
{
public:
// using func_t = std::function<void*(void*)>;
typedef std::function<void*(void*)> func_t;
const int num = 1024;
public:
Thread(func_t func, void *args = nullptr, int number = 0): func_(func), args_(args)
{
// name_ = "thread-";
// name_ += std::to_string(number);
char buffer[num];
snprintf(buffer, sizeof buffer, "thread-%d", number);
name_ = buffer;
// 异常 == if: 意料之外用异常或者if判断
// assert: 意料之中用assert
Context *ctx = new Context();
ctx->this_ = this;
ctx->args_ = args_;
int n = pthread_create(&tid_, nullptr, start_routine, ctx); //TODO
assert(n == 0); //编译debug的方式发布的时候存在,release方式发布,assert就不存在了,n就是一个定义了,但是没有被使用的变量
// 在有些编译器下会有warning
(void)n;
}
// 在类内创建线程,想让线程执行对应的方法,需要将方法设置成为static
static void *start_routine(void *args) //类内成员,有缺省参数!
{
Context *ctx = static_cast<Context *>(args);
void *ret = ctx->this_->run(ctx->args_);
delete ctx;
return ret;
// 静态方法不能调用成员方法或者成员变量
}
void join()
{
int n = pthread_join(tid_, nullptr);
assert(n == 0);
(void)n;
}
void *run(void *args)
{
return func_(args);
}
~Thread()
{
//do nothing
}
private:
std::string name_;
func_t func_;
void *args_;
pthread_t tid_;
};
到这里,本篇内容就结束了,我们下期内容,再见!!。