Linux——线程1

news2024/11/30 12:37:08

背景知识

堆区细粒堆划分

我们在申请堆空间时,我们只是设置了空间大小,并未设置空间从哪里结束。

堆区里面的详细信息,如某段空间从哪开始,从哪结束,由vm_area_struct负责记录,每申请一段空间就增加一个vm_area_struct,vm-area_struct是以双链表的形式进行连接,OS是可以做到让进程进行资源的细粒度划分。

磁盘到内存映射IO

可执行程序和物理内存都被化为4KB,即以4KB为单位。

当内存不足的时候,OS会把内存中不用的数据刷新到磁盘或刷新缓冲区,进行代码访问时,代码区的哪些数据经过映射可以访问到物理内存当中,如果某个区域未被映射,则需要从磁盘中加载数据到内存。

OS要管理物理内存的每个4KB,这种管理的数据结构叫struct_page,struct_page是内核级别的数据结构,该数据结构中有好多标记位,管理方式:先描述(通过标记位描述),再组织(通过数组的方式将所有的page管理起来,struct page mem[1-100w])。

通过page知道物理内存的使用情况和属性。磁盘当中以4KB为单位的代码或数据即内容叫做页帧。而物理内存4KB大小叫页框。

IO的时候基本单位是4KB,IO的时候其实是把页帧装进页框里。从外设加载到内存时,是以4KB为单位,即使加载了1个字节,也是以4KB为单位。

当我们的代码运行起来后,页表一头和虚拟地址空间中的代码去对应起来,另一头会和磁盘的定位置对应起来。页表中还有一些字段,此时页表会发现我们当前对应的数据并未在内存当中,此时会让OS先申请一个page,再根据页表找到磁盘当中可执行程序的内容,再把内容通过文件系统加载到内存当中,然后把物理内存4KB对应的地址覆盖到页表中的磁盘地址,因此页表和磁盘也就没有了联系。这一套过程被称为“缺页中断”。用户对页表中断0感知

页表的划分

假设页表每个条目(页表的一行,上图的页表一行格子)为9字节,页表总共有2^32个条目,即4GB,而页表是需要保存在物理内存当中的,若要存页表大小就在9*4GB物理内存,而此时页表太大了,根本无法这样直接保存。

OS在虚拟地址(32位),把这32个比特位化为3个区,按照10,10,12划分

页表可看作是<k,v> k代表左边映射关系,v代表右边映射关系

页表是多个结构,一级页表被称作页目录,一级页表只对虚拟地址的前10个比特位进行索引,一级页表共2^10(1024)个条目,即1024对映射关系,假设每个条目大小为10字节,总共大小为10kb。一级页表的k是10个比特位,v是二级页表所在条目地址。

二级页表跟一节页表规则一样,二级页表的k是10个比特位,v(右侧)代表物理内存某一个页的起始地址(虚拟地址要映射的那个页)

由于2^12刚好是4KB,最后12个比特位,存的是当前在这个页内的偏移量,二级页表是起始地址,3级页表是偏移量,这个偏移量叫页内偏移

通过页的起始地址+页内偏移就可获得我们的数据在物理内存的哪个地址处。

这样会使页表的体积变小。

Linux线程概念

什么是线程

若我们已经创建好一个进程,此时再创建进程,此时就会有俩套task_struct,mm_struct,页表

我们想在一个进程的基础上,在创建一个进程,而且这个新的进程只创建PCB(task_struct),这个PCB指向父进程对应的地址空间。

我们想以上面这种方式创建多个进程,而且通过一定的技术手段,将当前进程的“资源”,以一定的方式划分给不同的task_struct(如多个进程执行不同的代码)。而且对于CPU来说,这么多PCB不会影响到CPU。

只要创建出来了这种形式的PCB,如果需要资源,它们只需向自己的父进程要即可。

我们将这里的每一个task_struct可以称之为对应的线程。

线程在进程内部执行(线程在进程的地址空间内运行),是OS调度的基本单位(CPU不关心执行流是进程还是线程,只关心PCB)。

上面这种线程的实现方案,是Linux特有的方案。Linux中没有专门为线程设计的数据结构(线程的很多工作和进程是重复的)。进程有地址空间,线程共享的是进程的地址空间。

进程再认识

进程(图中红色部分)就是对应的内核数据(可以存在多个PCB)结构加所对应的代码和数据,这个结论是站在用户视角所看到的。

内核视角:进程是承担分配系统资源的基本实体。

如何理解曾经我们所写的代码?

以前我们的代码只有一个TASK_STRUCT,这种进程叫做内部只有一个执行流的进程,而上面的是内部具有多个执行流的进程。进程地址空间内有多个执行流的时候,叫做单进程,多线程程序。task_struct是进程内部的执行流。

在CPU视角:CPU在调度的时候不受任何影响,因为运行队列全是task_struct,CPU其实不怎么关心当前是进程还是线程这样的概念,只认task_struct。CPU调度的基本单位“线程”。

在Linux下,PCB<=其它操作系统内的PCB的。即,量级更轻。当整个进程内部只有一个执行流的时候此时是等于。Linux下的进程可统一称之为轻量级进程。

Linux没有真正意义上的线程结构,因为没有为线程设计专用的数据结构,但是Linux是用进程PCB模拟的线程。

Linux并不能直接给我们提供线程相关的接口,只能提供轻量级进程的接口。 Linux在用户层实现了一套用户层多线程方案,以库的方式提供给用户进行使用,这个库是pthread线程库,这是Linux系统自带的。pthread线程库又叫原生线程库。这个库对应的创建线程是pthread_create

pthread_create

第一个参数是线程ID,第二个是线程属性,这个我们不用管,默认就可以。第三个参数是函数指针,返回值为void*,参数为void*,第四个参数是传递给函数指针的参数,当创建成功时,这个参数会被传递给前面的函数指针从而完成回调。

由于线程是用户层线程库,属于第三方(第一方语言,第二方OS接口),这个库不属于C/C++,属于OS,当我们编译代码直接使用该库就行,因为gcc,g++会帮我们找到相应的C/C++库,但由于这个库属于系统,我们在编译链接的时候要引入相应的选项来链接这个库。

若创建线程成功,返回0,否则返回错误码。

运行程序后,我们发现这里会报错,而且是链接时报错。

在makefile里加上-lpthread即可

我们可以看到我们是用了这个库的

稍微修改一下代码,然后运行

我们可以看到主线程和其它5个线程pid一样,因此说明了线程在进程内部运行

当程序运行的时候,我们进行执行流查看,我们发现只有一个进程。

我们用ps -aL查看到了六个执行流,而且这六个执行流PID都一样,LWP是轻量级进程对应的PID

第一个PID和LWP数字一样,说明第一个是主线程,当进行执行流调度的时候OS是根据LWP进行进行调度的,因为一个PID对应好多个执行流。

当我们杀掉这一个进程后,我们可以看到六个执行流全部退出

此时我们再查看执行流,我们发现已经没有执行流了

由于所有线程用的资源都来自进程,进程被干掉之后,进程的资源被回收,线程跟着退出。

线程如何看待进程的资源

进程的多个线程共享 同一地址空间,因此Text Segment、Data Segment都是共享的,如果定义一个函数,在各线程

中都可以调用,如果定义一个全局变量,在各线程中都可以访问到,除此之外,各线程还共享以下进程资源和环境:

  1. 文件描述符表(一个线程打开一个文件分配的文件描述符是3,另一个线程打开文件分配的文件描述符是4)

  1. 每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)

  1. 当前工作目录

  1. 用户id和组id

  1. 代码区也共享,堆区一般也是共享的,但是一般在使用的时候,每个线程申请的堆区认为是该线程私有的,因为只有一个线程能拿到该空间的地址,共享区也是共享的,栈区是私有的,但也可以设置为其它线程可见。

线程共享进程数据,但也拥有自己的一部分数据(b和c必须记住):

  1. 线程ID

  1. 一组寄存器

  1. errno信号屏蔽字

  1. 调度优先级

进程和进程切换,进程和线程进行切换,线程切换的成本更低。

  1. 地址空间不需要切换

  1. 页表不需要切换

  1. 因为CPU内部有硬件级别的缓存,L1~L3 cache,对内存的代码和数据,根据局部性原理(一条指令附近的代码有被使用的概率)预读到CPU内部。

如果进程切换由于进程具有独立性,CPU中对应的cache就立即失效,新进程需要重新缓存。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/523312.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

优于FCOS:在One-Stage和Anchor-Free目标检测中以最小的成本实现最小的错位(代码待开源)...

关注并星标 从此不迷路 计算机视觉研究院 公众号ID&#xff5c;ComputerVisionGzq 学习群&#xff5c;扫码在主页获取加入方式 计算机视觉研究院专栏 作者&#xff1a;Edison_G 与基线FCOS&#xff08;一种单阶段和无锚目标象检测模型&#xff09;相比&#xff0c;新提出的模型…

STL-map容器

作为关联式容器的一种&#xff0c;map 容器存储的都是 pair 对象&#xff0c;也就是用 pair 类模板创建的键值对。其中&#xff0c;各个键值对的键和值可以是任意数据类型&#xff0c;包括 C基本数据类型&#xff08;int、double 等&#xff09;、使用结构体或类自定义的类型。…

IDEA中java文件出现黄色的J文件同时maven项目导入了依赖但是idea依赖加不进去的问题记录

IDEA导入项目后依赖jar包没有显示 报错提示尝试的解决方法检查对应的sdkmodule等配置信息开始尝试是不是版本问题&#xff0c;因为对上述maven报错进行查询&#xff0c;好像是因为版本太高导致的&#xff0c;开始下一个低版本进行尝试切换版本即可解决 总结后续出现的BUG 此次环…

Linux基本指令(三)

Linux基本指令 一.data指令1.基本使用2.时间戳 二.cal指令三.find指令四.grep指令五.zip/unzip指令六.tar指令&#xff08;打包/解包&#xff0c;不打开直接看内容&#xff09;七.bc指令八.uname指令九.几个重要热键十.关机 一.data指令 1.基本使用 下面不需要记住&#xff0c…

nodejs+Vue+elementui农家乐管理系统系统-住宿-美食-活动报名系统vue

语言 node.js 框架&#xff1a;Express 前端:Vue.js 数据库&#xff1a;mysql 数据库工具&#xff1a;Navicat 开发软件&#xff1a;VScode 目 录 管理员在还可以进行首页、个人中心、农家乐管理、美食信息管理、住宿信息管理、活动信息管理、用户管理、活动报名管理、客房预…

English Learning - L3 作业打卡 Lesson1 Day5 2023.5.9 周二

English Learning - L3 作业打卡 Lesson1 Day5 2023.5.9 周二 引言&#x1f349;句1: Fast loud music is popular with many people .成分划分爆破语调 &#x1f349;句2: They may say the music is red hot, especially the kind called Dixieland jazz.成分划分爆破语调 &a…

Ae 入门系列之十二:三维合成

在 Ae 中&#xff0c;可以将图层设置为 3D 图层并添加动态的摄像机和灯光&#xff0c;从而制作基于三维空间的动画。 ◆ ◆ ◆ 二维与三维 二维 2D 在一个平面上的内容就是二维。只有上下、左右两个方向&#xff0c;没有前后。即&#xff0c;只有面积&#xff0c;没有体积。 …

FX DocuCentre S2520~~富士施乐 DocuCentre S2520和2022打印机驱动安装

先确定打印机IP 1. 12楼打印机IP 13楼 2楼 192.168.20.251 192.168.20.252 192.168.10.252 2. 下载安装驱动 2520富士施乐 DocuCentre S2520 驱动下载 - 驱动天空 (drvsky.com) 2022富士施乐 DocuCentre SC2022 驱动下载 - 驱动天空 (drvsky.com) 3. 添加驱动配置 安装驱动配…

解决问题,是管理者最了不起的才华

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID&#xff1a;jishulingdaoli) 小C和小Y是K哥下面的两个主管&#xff0c;都管着10多人的团队&#xff0c;但他们带队伍的风格完全不同。小C名校毕业&#xff0c;理论基础扎实&#xff0c;彼得德鲁克、约翰科特的管理思想&#xff0c…

如何解决过度拟合

数量技术宅团队在CSDN学院推出了量化投资系列课程 欢迎有兴趣系统学习量化投资的同学&#xff0c;点击下方链接报名&#xff1a; 量化投资速成营&#xff08;入门课程&#xff09; Python股票量化投资 Python期货量化投资 Python数字货币量化投资 C语言CTP期货交易系统开…

Ae:合成查看器 - 3D 视图选项

当启用 3D 图层后&#xff0c;合成查看器右下方将出现与 3D 视图相关的按钮与菜单。 草图 3D Draft 3D 启用后&#xff0c;Ae 将使用 GPU 加速来实时显示对 3D 设计所做的更改或更新。这种体验无缝流畅且速度更快&#xff0c;因此可避免在预览时发生延迟&#xff0c;使用任意摄…

Java原型模式详解:克隆人案例【深浅克隆】

前言 在许多情况下&#xff0c;我们需要创建对象的副本&#xff0c;比如在初始化操作比较复杂或者需要大量资源的情况下。在这些情况下&#xff0c;我们可以使用原型模式来避免重复创建对象&#xff0c;提高程序的性能。本文将介绍Java中的原型模式以及如何在实际应用中使用它。…

js中new的含义

&#x1f449;js中new操作符_js new_焦会理人的博客-CSDN博客 目录 1.什么是new? 2.new经历了什么过程&#xff1f; 3.new的过程分析 1.什么是new? 在JS中&#xff0c;new的作用是通过构造函数来创建一个实例对象&#xff08;和普通函数不一样&#xff0c;当函数用作构造函…

漏洞扫描与渗透测试的区别

在网络安全领域中&#xff0c;漏洞扫描和渗透测试是两个非常重要的概念。渗透测试和漏洞挖掘的区别在于测试的目的和方法。渗透测试主要是为了发现已知漏洞&#xff0c;而漏洞挖掘主要是为了发现未知漏洞。虽然它们都与漏洞有关&#xff0c;但它们之间还是有一定的区别。那么渗…

机器学习:基于Kmeans聚类算法对银行客户进行分类

机器学习&#xff1a;基于Kmeans聚类算法对银行客户进行分类 作者&#xff1a;i阿极 作者简介&#xff1a;Python领域新星作者、多项比赛获奖者&#xff1a;博主个人首页 &#x1f60a;&#x1f60a;&#x1f60a;如果觉得文章不错或能帮助到你学习&#xff0c;可以点赞&#x…

浅析自主、意图与感性

2023年5月3日&#xff0c;在麻省理工技术评论&#xff08;MIT Technology Review&#xff09;一场接近一小时的半公开分享会上&#xff0c;Hinton终于有机会比较完整的讲述了他对AI的所有恐惧和担忧&#xff1a;一旦AI在人类灌输的目的中生成了自我动机&#xff0c;那以它的成长…

超级独角兽 Databricks 的崛起之路

在数据扩张以及 AI 兴起的时代&#xff0c;数据存储和分析平台拥有巨大价值和能量。 随着互联网数据的爆炸性增长&#xff0c;数据已经成为企业的新型资源&#xff0c;犹如石油般重要。越来越多的企业希望利用各种结构化和非结构化数据来发挥自己的优势。 然而&#xff0c;他…

Python虚拟环境的安装和使用

在进行Python项目开发时可能会遇到各种各样的库和模块依赖问题。为了解决这些问题&#xff0c;我们可以使用虚拟环境来隔离项目的依赖。本次将介绍Python原生虚拟环境和Anaconda虚拟环境的安装与使用&#xff0c;并举例说明如何进行虚拟环境配置。 文章目录 Python原生虚拟环境…

华为OD机试真题 Java 实现【不爱施肥的小布】【2023Q2 100分】

一、题目描述 某农村主管理了一大片果园&#xff0c;fields[i]表示不同国林的面积&#xff0c;单位m2&#xff0c;现在要为所有的果林施肥且必须在n天之内完成&#xff0c;否则影响收成。小布是国林的工作人员&#xff0c;他每次选择一片果林进行施肥&#xff0c;且一片国林施…

Python机器学习:Scikit-learn和TensorFlow的应用和模型设计

一、引言 Python在机器学习领域中已经成为非常受欢迎的编程语言。Scikit-learn和TensorFlow是Python中应用最广泛的两个机器学习库&#xff0c;它们提供了丰富的机器学习算法和工具&#xff0c;帮助开发人员轻松地构建和训练机器学习模型。本文将详细介绍Scikit-learn和Tensor…