Linux中线程的介绍

news2024/12/23 19:14:16

目录

一.线程概念

1.什么是线程

二.Linux进程与线程

三.pthread库

3.1线程创建

3.2线程等待

3.2线程终止

 3.4分离线程

四.线程ID及进程地址空间布局


一.线程概念

1.什么是线程

1.在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列”
2.一切进程至少都有一个执行线程
3.线程在进程内部运行,本质是在进程地址空间内运行
4.在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化
5.透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就了线程执行流
补充:一个进程的创建实际上伴随着其进程控制块(task_struct)、进程地址空间(mm_struct)以及页表的创建,虚拟地址和物理地址就是通过页表建立映射的。进程都有自己独立的进程地址空间和独立的页表,也就意味着所有进程在运行时本身就具有独立性。
如果我们在创建“进程”时,只创建task_struct,并要求创建出来的task_struct和父task_struct共享进程地址空间和页表,如图:

上面就创建了4个线程,其中每一个线程都是当前进程里面的一个执行流。

重新理解进程与线程:

进程:是上面图中框中的内容,包含task_struct,进程地址空间,页表,文件。信号等等,合起来称之为一个进程。站在内核角度来理解进程:承担分配系统资源的基本实体,叫做进程。

线程:是最小的基本调度单位,一个进程内的线程共享其中的资源。

其中,Linux系统中没有真正意义上的线程,而是用进程模拟的。

操作系统要支持真的线程,那么就需要对这些线程进行管理。比如说创建线程、终止线程、调度线程、切换线程、给线程分配资源、释放资源以及回收资源等,而在Linux看来,描述线程的控制块和描述进程的控制块是类似的,因此Linux并没有重新为线程设计数据结构,而是直接复用了进程控制块,所以我们说Linux中的所有执行流都叫做轻量级进程。没有真正的线程,那么也就绝对没有真正意义上的线程相关的系统调用!

但是Linux可以提供创建轻量级进程的接口,如vfork函数,原生线程库pthread

pid_t vfork(void);

返回值与fork函数相同

  • 给父进程返回子进程的PID。
  • 给子进程返回0。

原生线程库:原生线程库实际就是对轻量级进程的系统调用进行了封装,在用户层模拟实现了一套线程相关的接口。

线程的优点:

创建一个新线程的代价要比创建一个新进程小得多。
与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多。
线程占用的资源要比进程少很多。
能充分利用多处理器的可并行数量。
在等待慢速IO操作结束的同时,程序可执行其他的计算任务。
计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现。
IO密集型应用,为了提高性能,将IO操作重叠,线程可以同时等待不同的IO操作。
线程的缺点:
性能损失: 一个很少被外部事件阻塞的计算密集型线程往往无法与其他线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。

健壮性降低: 编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说,线程之间是缺乏保护的。

缺乏访问控制: 进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。

编程难度提高: 编写与调试一个多线程程序比单线程程序困难得多。
线程异常:
  • 单个线程如果出现除零、野指针等问题导致线程崩溃,进程也会随着崩溃。
  • 线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该进程内的所有线程也就随即退出。

二.Linux进程与线程

进程是资源分配的基本单位 ,线程是调度的基本单位
线程共享进程数据,但也拥有自己的一部分数据:
线程ID
一组寄存器(存储每个线程的上下文信息)
栈(每个线程都有临时的数据,需要压栈出栈)
errno(C语言提供的全局变量,每个线程都有自己的)
信号屏蔽字
调度优先级
进程的多个线程共享:

因为是在同一个地址空间,因此所谓的代码段(Text Segment)、数据段(Data Segment)都是共享的:

如果定义一个函数 , 在各线程中都可以调用, 如果定义一个全局变量 , 在各线程中都可以访问到

除此之外,各线程还共享以下进程资源和环境:

文件描述符表。(进程打开一个文件后,其他线程也能够看到)
每种信号的处理方式。(SIG_IGN、SIG_DFL或者自定义的信号处理函数)
当前工作目录。(cwd)
用户ID和组ID。

三.pthread库

pthread线程库是应用层的原生线程库:

  • 要使用这些函数库,要通过引入头文件<pthreaad.h>。
  • 链接这些线程函数库时,要使用编译器命令的“-lpthread”选项
  • 应用层指的是这个线程库并不是系统接口直接提供的,而是由第三方帮我们提供的。
  • 原生指的是大部分Linux系统都会默认带上该线程库。
  • 与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以“pthread_”打头的。

3.1线程创建

创建线程的函数:pthread_create

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

参数介绍:

  • thread:获取创建成功的线程ID,该参数是一个输出型参数。
  • attr:用于设置创建线程的属性,传入NULL表示使用默认属性。
  • start_routine:该参数是一个函数地址,表示线程例程,即线程启动后要执行的函数。
  • arg:传给线程例程的参数。

返回值:线程创建成功返回0,失败返回错误码。

一个程序启动时,就有一个进程被操作系统创建,与此同时一个线程也立刻运行,这个线程就叫做主线程。主线程调用pthread_create函数创建一个新线程,此后新线程就会跑去执行自己的新例程,而主线程则继续执行后续代码。

例如:

#include<iostream>
using namespace std;
#include<pthread.h>
#include<unistd.h>
void* rountine(void* argv)
{
  while (true)
  {
    string s = (char *)argv;
    cout << s << " pid=" << getpid() << endl;
    sleep(1);
  }
}
int main()
{
  pthread_t tid1;
  pthread_t tid2;
  pthread_t tid3;

  pthread_create(&tid1,nullptr,rountine,(void*)"thread1");
  pthread_create(&tid2,nullptr,rountine,(void*)"thread2");
  pthread_create(&tid3,nullptr,rountine,(void*)"thread3");

  while(true)
  {
    cout<<"mainthread running"<<"pid= "<<getpid()<<endl;
    sleep(1);
  }
  return 0;
}

结果:

 用ps -aL命令查看显示当前的轻量级进程。

  • 默认情况下,不带-L,看到的就是一个个的进程。
  • -L就可以查看到每个进程内的多个轻量级进程。

例如:

 其中,LWP(Light Weight Process)就是轻量级进程的ID,可以看到显示的三个轻量级进程的PID是相同的,因为它们属于同一个进程。

注意: 在Linux中,应用层的线程与内核的LWP是对应的,实际上操作系统调度的时候采用的是LWP,而并非PID,只不过我们之前接触到的都是单线程进程,其PID和LWP是相等的,所以对于单线程进程来说,调度时采用PID和LWP是一样的。

获取线程ID:

  • 创建线程时通过输出型参数获得。
  • 通过调用pthread_self函数获得。

pthread_self函数:

pthread_t pthread_self(void);

例如:

void *rountine(void *argv)
{
  while (true)
  {
    string s = (char *)argv;
    cout << s << " pid=" << getpid() <<" "<<"tid="<<pthread_self()<< endl;
    sleep(1);
  }
}
int main()
{
  pthread_t tid1;
  pthread_t tid2;
  pthread_t tid3;

  pthread_create(&tid1, nullptr, rountine, (void *)"thread1");
  pthread_create(&tid2, nullptr, rountine, (void *)"thread2");
  pthread_create(&tid3, nullptr, rountine, (void *)"thread3");

  while (true)
  {
    cout << "mainthread running"
         << " pid=" << getpid() << endl;
    cout<<"mainthread running"<<" "<<"tid1="<<tid1<<" ""tid2="<<tid2<<" "<<"tid3="<<tid3<<endl;
    sleep(1);
  }
  return 0;
}

结果:

 可以看出主线程打印的tid与每个线程打印的tid是相同的。

注意: 用pthread_self函数获得的线程ID与内核的LWP的值是不相等的,pthread_self函数获得的是用户级原生线程库的线程ID,而LWP是内核的轻量级进程ID,它们之间是一对一的关系。

3.2线程等待

与进程类似,如果主线程不对新线程进行等待,那么这个新线程的资源也是不会被回收的。所以线程需要被等待,如果不等待会产生类似于“僵尸进程”的问题,也就是内存泄漏。

等待线程函数:pthread_join

int pthread_join(pthread_t thread, void **retval);

参数说明:

  • thread:被等待线程的ID。
  • retval:线程退出时的退出码信息。

返回值说明:

  • 线程等待成功返回0,失败返回错误码。

注意:调用该函数的线程会将挂起等待,直到ID为thread的线程终止,thread线程以不同的方法终止,通过pthread_join得到的终止状态是不同的。

如果thread线程通过return返回,retval所指向的单元里存放的是thread线程函数的返回值。
如果thread线程被别的线程调用pthread_cancel异常终止掉,retval所指向的单元里存放的是常数PTHREAD_CANCELED。
如果thread线程是自己调用pthread_exit终止的,retval所指向的单元存放的是传给pthread_exit的参数。
如果对thread线程的终止状态不感兴趣,可以传NULL给retval参数。

3.2线程终止

  1. 从线程函数return。
  2. 线程可以自己调用pthread_exit函数终止自己。
  3. 一个线程可以调用pthread_cancel函数终止同一进程中的另一个线程。

例如:

void *rountine(void *argv)
{
  while (true)
  {
    string s = (char *)argv;
    cout << s << " pid=" << getpid() <<" "<<"tid="<<pthread_self()<< endl;
    sleep(1);

    //return (void*)1314;
    //pthread_exit((void*)1314);
    pthread_cancel(pthread_self());//退出码为-1;
  }
}

举例子:

主线程运行3秒后,取消1,2号线程,3号线程运行5秒后自己退出。

void *rountine(void *argv)
{
  while (true)
  {
    string s = (char *)argv;
    cout << s << " pid=" << getpid() <<" "<<"tid="<<pthread_self()<< endl;
    sleep(1);
   
  }
}
void *rountine2(void *argv)
{
  for(int i=0;i<5;i++)
  {
    string s = (char *)argv;
    cout << s << " pid=" << getpid() <<" "<<"tid="<<pthread_self()<< endl;
    sleep(1);
  }
  pthread_exit((void*)1314);
}
int main()
{
  pthread_t tid1;
  pthread_t tid2;
  pthread_t tid3;

  pthread_create(&tid1, nullptr, rountine, (void *)"thread1");
  pthread_create(&tid2, nullptr, rountine, (void *)"thread2");
  pthread_create(&tid3, nullptr, rountine2, (void *)"thread3");

  int k=0;
  while (true)
  {
    k++;
    cout<<"k="<<k<<endl;
    if(k==3)//主线程将线程1,2取消
    {
      pthread_cancel(tid1);
      pthread_cancel(tid2);
    }
    if(k==6)
      break;
    cout << "mainthread running"
         << " pid=" << getpid() << endl;
    cout<<"mainthread running"<<" "<<"tid1="<<tid1<<" ""tid2="<<tid2<<" "<<"tid3="<<tid3<<endl;
    sleep(1);
  }
  void* p1,* p2,* p3;
  p1=p2=p3=nullptr;
  pthread_join(tid1,&p1);
  pthread_join(tid2,&p2);
  pthread_join(tid3,&p3);
 cout<<"tid1="<<(long long)p1<<" "<<"tid2="<<(long long)p2<<" "<<"tid3="<<(long long)p3<<endl;

  return 0;
}

 3.4分离线程

  • 默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释放资源,从而造成系统泄漏。
  • 如果不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放线程资源。

补充:

线程被分离后,只是当其退出时不需要pthread_join操作,其未退出前依旧使用该进程的资源,甚至这个线程崩溃了也会影响其他线程。

可以是线程组内其他线程对目标线程进行分离,也可以是线程自己分离。

joinable和分离是冲突的,一个线程不能既是joinable又是分离的。

线程分离函数:

int pthread_detach(pthread_t thread);

线程分离成功返回0,失败返回错误码。

四.线程ID及进程地址空间布局

1.pthread_create函数会产生一个线程ID,该值与pthread_self()函数产生的结果是一样的,但与内核中的LWP不同。

2.内核中的LWP属于进程调度的范畴,因为线程是轻量级进程,是操作系统调度器的最小单位,所以需要一个数值来唯一表示该线程。

3.pthread_create函数第一个参数指向一个虚拟内存单元,该内存单元的地址即为新创建线程的线程ID,这个ID属于NPTL线程库的范畴,线程库的后续操作就是根据该线程ID来操作线程的。

前面以介绍了Linux没有实现真正的线程,只提供LWP,也就意味着操作系统只需要对内核执行流LWP进行管理,而供用户使用的线程接口等其他数据,应该由线程库自己来管理。可以再来看下线程库。其实该库是一个动态库。

如图:

 进程运行时动态库被加载到内存,然后通过页表映射到进程地址空间中的共享区,此时该进程内的所有线程都是能看到这个动态库的。每个线程都有自己私有的栈,其中主线程采用的栈是进程地址空间中原生的栈,而其余线程采用的栈就是在共享区中开辟的,线程的各种属性,还有自己的线程局部存储,当中包含了对应线程被切换时的上下文数据等就在该共享区的一块区域中,因此我们要找到一个用户级线程只需要找到该线程内存块的起始地址,然后就可以获取到该线程的各种信息。就可以认为该线程ID就是地址。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32305.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022亚太杯建模B题思路 : 高速列车的优化设计 小美赛数学建模 B题思路

1 B题&#xff1a;高速列车的优化设计 2022年4月12日&#xff0c;中国高铁复兴CR450多机组成功实现单列列车速度435 km/h&#xff0c;相对速度870 km/h&#xff0c;创造了高铁多机组列车穿越明线和隧道速度的世界纪录。新一代标准动车组“复兴”是中国自主研发的具有全知识产权…

外贸线上推广引流的技巧

外贸网站建成后&#xff0c;很多外贸企业通常会面临一个重要的问题。网站装修和产品布局都很漂亮&#xff0c;但是流量很小。由此可见&#xff0c;外贸网站的引流推广是非常重要的。接下来&#xff0c;米贸搜给大家分享一些外贸网站引流推广的技巧&#xff0c;让网站快速获得流…

浙里办微信小程序上架

一、概述 本指南旨在为“浙里办”单点登录组件提供接入指南&#xff0c;“浙里办”单点登陆组件&#xff0c;上架在IRS&#xff0c;为上架在IRS的应用&#xff0c;提供统一的单点登录解决方案&#xff0c;现阶段仅支持微信端的接入。 二、服务创建 IRS 应用管理员在 IRS 应用…

Kali系统MSF模块暴力破解MySQL弱口令漏洞

一、实验环境 1.攻击方&#xff1a; 攻击环境使用KALI系统&#xff08;使用虚拟机搭建&#xff09;的Metasploit模块&#xff0c;msfconsole是metasploit中的一个工具&#xff0c;它集成了很多漏洞的利用的脚本&#xff0c;并且使用起来很简单的网络安全工具。 这里要特别强…

代码随想录64——额外题目【哈希表、字符串】:205同构字符串、1002查找常用字符、925长键按入、844比较含退格的字符串

文章目录1.205同构字符串1.1.题目1.2.解答2.1002查找常用字符2.1.题目2.2.解答3.925长键按入3.1.题目3.2.解答4.844比较含退格的字符串4.1.题目4.2.解答4.2.1.使用栈4.2.2.从后往前双指针1.205同构字符串 参考&#xff1a;代码随想录&#xff0c;205同构字符串&#xff1b;力扣…

MySQL数据库的索引

文章目录一、索引是什么&#xff1f;索引的作用二、索引的使用查看索引创建索引删除索引三、索引的底层一、索引是什么&#xff1f; 索引是一种特殊的文件&#xff0c;包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引&#xff0c;并指定索引的类型&#…

[附源码]java毕业设计医疗预约系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

SQL注入原理、过程、防御方案、RASP概念

一、sql注入原理 SQL注入即是指web应用程序对用户输入数据的合法性没有判断或过滤不严,攻击者可以在web应用程序中事先定义好的语句上添加额外的SQL语句,在管理员不知情的情况下实现非法操作,以此来实现欺骗数据库服务器执行非授权的任意查询,从而进一步得到相应的数据信息…

第1关:Hive的安装与配置

为了完成本关任务&#xff0c;你需要掌握&#xff1a; 1.Hive的基本安装&#xff1b; 2.Mysql的安装与设置&#xff1b; 3.Hive 的配置。 注意&#xff1a;本关实训Hive的安装与配置建立在Hadoop已安装配置好的情况下。 Hive 的基本安装 从 官网 下载Hive二进制包&#xf…

优维科技CTO黎明访谈实录:“大场景+小算法”构建AiOps运维技术哲学

智能运维、自动化运维发展到现在&#xff0c;已经有将近7成的IT管理者学会利用大数据、人工智能产品及解决方案赋能团队&#xff0c;在生产效率、适应性和决策能力等层面实现了切实有效的正向转型。 今天的中国企业&#xff0c;已经在云端新基建、数字化转型的浪潮中实现降本增…

美食杰项目 -- 菜品信息(五)

目录前言&#xff1a;具体实现思路&#xff1a;步骤&#xff1a;1. 展示美食杰菜谱大全效果2. 引入element-ui3. 代码总结&#xff1a;前言&#xff1a; 本文给大家讲解&#xff0c;美食杰项目中 实现菜品信息页的效果&#xff0c;和具体代码。 具体实现思路&#xff1a; 跳转…

[附源码]java毕业设计疫情防控期间人员档案追寻系统设计与实现论文

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

bash shell 初体验-尚文网络xUP楠哥

~~全文共1139字&#xff0c;阅读需约5分钟。 进Q群11372462&#xff0c;领取专属报名福利&#xff0c;包含云计算学习路线图代表性实战训练大厂云计算面试题资料! # bash shell 简介 我们在操作Linux系统时&#xff0c;绝大部分情况是通过命令行的方式输入指令&#xff0c;Li…

小型企业建立人力资源团队的 5 个步骤

作为小企业主&#xff0c;设置人力资源运营可能不是您的首要任务。但是&#xff0c;随着您扩大运营规模和员工人数&#xff0c;您可能会遇到合规性和员工敬业度问题&#xff0c;从而阻碍您的业务增长。组建一个团队来照顾您的人力资源运营和员工可以让您专注于改进您的产品和满…

【JVM】字节码技术:手撕 多态执行原理

一、源文件 package org.example.classLoading;import java.io.IOException; /*** 演示多态原理&#xff0c;注意加上下面的 JVM 参数&#xff0c;禁用指针压缩* -XX:-UseCompressedOops -XX:-UseCompressedClassPointers*/ public class PolymorphicTest {public static void…

【序列召回推荐】(task2)序列召回GRU4Rec和faiss使用

学习总结&#xff1a; 一般的RNN模型我们的输入和输出是什么&#xff0c;我们对RNN输入一个序列 X[x1,x2,...,xn]X [x^1,x^2,...,x^n]X[x1,x2,...,xn] &#xff0c;注意我们序列中的每一个节点都是一个向量&#xff0c;那么我们的RNN会给我们的输出也是一个序列 Y[y1,y2,...,…

[附源码]SSM计算机毕业设计江苏策腾智能科技公司人事管理系统JAVA

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

.net----特性

特性特性的概念和使用特性&#xff08;Attribute&#xff09;特性形式特性类参数预定义通用特性类ConditionalAttribute类ObsoleteAttribute类AttributeUsageAttribute类全局特性自定义特性类使用反射访问特性特性的概念和使用 特性&#xff08;Attribute&#xff09; 特性类&…

http请求报头header

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 目录 前言 一.认识请求报头&#xff08;header&#xff09; 1.Host 2.content-length 3.content-type 常见的三种格式 小结 二.User-Agent(简称UA) 三.Referer 四.C…

进程创建进程终止进程等待

目录前言一、进程创建1.fork()函数&#xff08;1&#xff09;fork()函数的基本认识进程调用fork()函数之后&#xff0c;控制权转移到内核中的fork()代码之后&#xff0c;内核做了啥&#xff1f;&#xff08;2&#xff09;实验&#xff1a;使用fork()函数创建进程&#xff08;3&…