【Linux】线程基础

news2025/3/27 10:33:22

Alt

🔥个人主页Quitecoder

🔥专栏linux笔记仓

Alt

目录

    • 01.背景知识
    • 02.线程概念
      • 简单使用线程
      • 线程调度成本更低

01.背景知识

在这里插入图片描述
OS进行内存管理,不是以字节为单位的,而是以内存块为单位的,默认大小为4kb,我们也学过,系统和磁盘文件进行IO的基本单位是4kb–8个扇区

可执行文件要加载到内存中,我们前面知道,文件系统中文件是以块为单位进行存储的,加载到内存中,也以块的方式加载访问,所以才有了IO的基本单位是4kb

内存块是操作系统进行内存管理的基本单位,称为页(page),操作系统为文件分配内存空间,以页为单位

操作系统现在对内存的管理及转为对一个个页的管理,先描述,再组织

struct page
{
	int flag;//是否被占用,是否是脏页,是否被锁定
	int mode;
	....
}
struct page memory[1048576];

每一个页帧用数组管理

页表我们学过,是虚拟地址到物理地址的映射,详细讲解
在这里插入图片描述

虚拟地址就是二进制构建的32个比特位的数据

虚拟地址被拆分为3部分,10位10位12位,页表也不是只有一张,页表开始以前十个bit位,表示的范围是2的十次方

页目录索引(Page Directory Index):高 10 位,用于定位 页目录表(Page Directory) 中的条目。
页表索引(Page Table Index):中间 10 位,用于定位 页表(Page Table) 中的条目。
页内偏移(Page Offset):低 12 位,用于定位页内的具体字节。

页表中放的是指向页框的起始地址

虚拟地址最低十二位,范围【0,4095】,页内偏移,刚好就是一个页的大小,用于定位页内具体字节的部分,例如一个整数,我就连续读取四个字节

还有一部分page不通过页表映射,通过struct file,缓冲区

在这里插入图片描述
每行代码都有地址,函数是连续的代码地址构成代码块,一个函数对应一批连续的虚拟地址

虚拟地址到物理地址的转换过程
以下是通过二级页表将虚拟地址转换为物理地址的过程:

虚拟地址分解
假设虚拟地址为 0x00401234,其二进制表示为:

0000 0000 0100 0000 0001 0010 0011 0100

分解为:
• 页目录索引:0000 0000 01(高 10 位,值为 1
• 页表索引:00 0000 0001(中间 10 位,值为 1
• 页内偏移:0010 0011 0100(低 12 位,值为 0x234

  1. CR3 寄存器获取页目录表的基地址
  2. 使用页目录索引(1)找到页目录表中的条目,获取页表的基地址。
  3. 使用页表索引(1)找到页表中的条目,获取物理页帧的基地址。
  4. 将物理页帧基地址与页内偏移(0x234)相加,得到物理地址。

页表项(PTE)的结构
每个页表项(PTE)的大小为 4 字节(32 位),包含以下字段:
物理页帧地址(Physical Page Frame Address):20 位(实际使用 20 位,支持 4GB 物理内存)。
标志位(Flags):12 位,包括:
有效位(Present Bit):指示页是否在内存中。
可写位(Writeable Bit):指示页是否可写。
用户位(User Bit):指示用户程序是否可以访问该页。
脏位(Dirty Bit):指示页是否被修改过。
访问位(Accessed Bit):指示页是否被访问过。


页表的大小
页目录表:1024 个条目,每个条目 4 字节,总大小为 4KB。
页表:1024 个条目,每个条目 4 字节,总大小为 4KB。
总大小:页目录表和所有页表的总大小取决于进程的虚拟地址空间使用情况。在最坏情况下,需要 1024 个页表,总大小为:
4 KB + 1024 × 4 KB = 4 MB + 4 KB ≈ 4 MB 4\text{KB} + 1024 \times 4\text{KB} = 4\text{MB} + 4\text{KB} \approx 4\text{MB} 4KB+1024×4KB=4MB+4KB4MB

02.线程概念

线程:在进程内部运行,是CPU调度的基本单位
以前我们知道,每次创建一个进程,都要创建一个地址空间和页表

现在不想给“进程”重新创建地址空间加载数据,直接让你新的pcb和父进程指向同一个地址空间,正文部分拆成多份由不同task_struct执行,这一部分task_struct就叫做Linux中的线程
在这里插入图片描述
上面一个整体为一个进程,进程=内核数据结构+进程代码和数据

线程实现基于 ​轻量级进程(LWP)​

  • 在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列”
  • 一切进程至少都有一个执行线程
  • 线程在进程内部运行,本质是在进程地址空间内运行
  • 在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化
  • 透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程执行流

cpu对task_struct是进程还是线程不做区分,cpu看到的执行流为进程,Linux中的执行流:轻量级进程

Linux是用进程模拟的线程

OS要单独设计线程,先描述再组织,现在给线程专门设计结构TCB,可以复用PCB,用PCB统一表示执行流,这样的话,我们就不需要为线程单独设计数据结构和调度算法了

简单使用线程

int pthread_create(pthread_t *restrict thread,
        const pthread_attr_t *restrict attr,
        void *(*start_routine)(void *),
        void *restrict arg);

参数分别为:

  • 线程标识符tid
  • 用于设置线程的属性,传入NULL使用默认属性
  • 指定线程启动后执行的函数
  • 传递给 start_routine 函数的参数
#include<iostream>
#include<pthread.h>
#include<unistd.h>

using namespace std;
//新线程
void *threadStart(void *args)
{
    while(true)
    {
        sleep(1);
        cout<<"new thread run..."<<endl;
    }
}
int main()
{
    pthread_t tid;
    pthread_create(&tid,NULL,threadStart,(void*)"thread-new");

   //主线程
    while(true)
    {
        sleep(1);
        cout<<"main thread run.."<<endl;
    }
    return 0;
}

在这里插入图片描述
注意这里的makefile里编译那一步必须链接thread库

testthread:testthread.cc
	g++ -o $@ $^ -std=c++11 -lpthread
.PHONY:clean
clean:
	rm -f testthread

在这里插入图片描述
这里系统只有一个进程,我们还可以让线程输出它的pid

在这里插入图片描述
在这里插入图片描述
LWP:light weight process 轻量级进程,lwp就是轻量级进程的id

我们发现,有一个lwp与pid相同,为主线程。OS调度的时候,用的是LWP

进程创建成本非常高,创建线程,只需要创建pcb,然后把进程的资源全部给线程即可

与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多,页表,地址空间都不需要切换,线程的调度成本低

删除一个线程成本也低

但线程也有劣势,一个线程出错可能会影响整个进程。这是因为线程是进程内的执行单元,它们共享进程的资源(如内存地址空间、文件描述符等)。如果某个线程出现错误(如非法内存访问、未捕获的异常等),可能会导致整个进程崩溃或进入不可预期的状态

线程调度成本更低

进程上下文切换:

  • 进程拥有独立的虚拟地址空间,切换时需要切换页表,切换页表需要刷新 CPU 的 ​TLB(Translation Lookaside Buffer)​,这是一个耗时的操作
  • 进程上下文需要保存和恢复CPU寄存器状态
  • 还需要处理其他资源(文件fd,信号处理函数等)

线程共享进程的虚拟地址空间和资源,切换时不需要切换页表,也不需要分配和释放fd,内存等的资源,硬件只需要关注线程的私有数据,线程上下文切换也需要保存和恢复CPU寄存器状态

CPU 缓存的影响:线程共享进程的内存地址空间,因此线程切换时 ​CPU 缓存(Cache)的命中率较高。缓存中的数据可以继续被新线程使用,减少了内存访问的延迟
进程拥有独立的内存地址空间,因此进程切换时 ​CPU 缓存的命中率较低

线程私有的部分:一组寄存器:硬件上下文数据–线程可以动态运行
栈:线程在运行的时候,会形成各种临时变量,临时变量会被每个线程保存在自己的栈区

某一个线程将来也会被页表映射到物理内存,以4kb为单位的代码块

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2321345.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

「宇树科技」13家核心零部件供应商梳理!

2025年2月6日&#xff0c;摩根士丹利&#xff08;Morgan Stanley&#xff09;发布最新人形机器人研报&#xff1a;Humanoid 100: Mapping the Humanoid Robot Value Chain&#xff08;人形机器人100&#xff1a;全球人形机器人产业链梳理&#xff09;。 2025年2月20日&#xf…

Spring Boot 项目打包运行

打包成jar包&#xff0c;执行 java -jar 包名&#xff1b; 保证打出的jar包是独立可运行的包&#xff0c;需要xml中添加插件配置 <!-- SpringBoot应用打包插件--> <build><plugins><plugin><groupId>org.springframework.boot</groupId&…

数据结构八股

线性数据结构 数组:数组的内存空间是连续的&#xff0c;随机访问的时间复杂度是01&#xff0c;适用于需要按索引访问元素的场景&#xff0c;但是插入和删除元素较慢&#xff0c;时间复杂度是On链表:链表是由节点组成&#xff0c;节点之间是分散存储的&#xff0c;内存不连续&a…

7.2 控件和组件

版权声明&#xff1a;本文为博主原创文章&#xff0c;转载请在显著位置标明本文出处以及作者网名&#xff0c;未经作者允许不得用于商业目的 C#工具箱位于编辑窗口的左侧&#xff0c;它默认内置了大量的控件和组件。控件一般派生于System.Windows.Forms.Control类&#xff0c;显…

transform

http://zhihu.com/question/445556653/answer/3254012065 西科技的文章 视频讲解 小白也能听懂的 transformer模型原理详解 self- attention 多头注意力机制 encoder decoder 机器翻译_哔哩哔哩_bilibili

思库拉水厂开业庆典千人大会回顾

近日,思库拉离子水厂在广州隆重举办了开业盛典,现场汇聚了逾千名嘉宾。此次盛会不仅是对思库拉离子水厂正式投产的庆祝,更是对思库拉品牌未来蓝图的一次展示。 现场氛围热烈,洋溢着浓厚的喜庆气息。参与者来自五湖四海,既有思库拉的忠实拥趸,也有对思库拉产品充满兴趣的潜在消费…

JAVA学习*Object类

Object类 Object类是所有类的父类 类中有一些方法&#xff08;都需要掌握&#xff09; toString()方法 在学习类的对象的时候有介绍过了&#xff0c;当我们重新给此方法就会打印类与对象的信息 equals()方法 在Java中的比较&#xff0c; 如果左右两侧是基本类型变量&#…

基于python脚本实现的打砖块小游戏

目录 1. 打砖块游戏 2. 初始化 Pygame 和设置屏幕 3. 定义游戏对象 3.1 定义玩家操作的paddle 3.2 定义球&#xff08;Ball&#xff09; 3.3 砖块&#xff08;Bricks&#xff09; 4. 游戏主循环 4.1 事件处理 4.2 板子移动 4.3 球移动和碰撞检测 4.4 绘制游戏对象 …

地理信息系统(GIS)在智慧城市中的40个应用场景案例

在智慧城市发展进程中&#xff0c;地理信息系统&#xff08;GIS&#xff09;作为关键技术之一&#xff0c;正扮演着不可或缺的角色&#xff0c;堪称智慧城市的神经中枢。通过空间数据分析优化城市管理&#xff0c;GIS技术为智慧城市的构建提供了强大的支持。 本文分享了GIS在智…

XSS Game(DOM型) 靶场 通关

目录 靶场网址 Ma Spaghet! 分析 解题 Jefff 分析 解题 方法一 方法二 Ugandan Knuckles 分析 解题 Ricardo Milos 分析 解题 Ah Thats Hawt 分析 解题 方法一 方法二 Ligma 分析 解题 ​ Mafia 分析 解题 方法一&#xff1a;构造函数 方法二&#xf…

【大模型基础_毛玉仁】3.5 Prompt相关应用

目录 3.5 相关应用3.5.1 基于大语言模型的Agent3.5.2 数据合成3.5.3 Text-to-SQL3.5.4 GPTs 3.5 相关应用 Prompt工程应用广泛&#xff0c;能提升大语言模型处理基础及复杂任务的能力&#xff0c;在构建Agent、数据合成、Text-to-SQL转换和设计个性化GPTs等方面不可或缺。 . …

deepseek搭建本地私有知识库dify安装介绍docker compose图文教程

按照官方介绍&#xff0c;打开教程安装。下载源码&#xff0c; # 假设当前最新版本为 0.15.3 git clone https://github.com/langgenius/dify.git --branch 0.15.3 进入docker目录&#xff0c; cd dify/docker 网络科学的直接执行命令就可以了。 docker compose up -d 镜…

右击没有Word、PPT、Excel功能

右击没有Word、PPT、Excel功能 导航 文章目录 右击没有Word、PPT、Excel功能导航一、问题描述二、事情经过三、解决方案其他思路分享 一、问题描述 ​ 在安装并激活了office之后&#xff0c;业务反馈右击没有出现新建Word功能&#xff0c;仅有Word文档 二、事情经过 ​ 按道…

DeepSeek R1 本地部署指南 (6) - Windows 本地部署使用 GPU 运行

DeepSeek R1 本地部署指南 (1) - Windows 本地部署 上一篇&#xff0c;安装好 Windows 本地步骤后&#xff0c;如果发现在任务管理器中 GPU 显示 0%。 1.在命令行中输入&#xff1a; ollama ps 显示&#xff1a; PROCESSOR CPU 2.安装 CUDA Toolkit CUDA Toolkit Downloads htt…

婚姻的解构与重构 | 一场关于选择与责任的探索

注&#xff1a;本文为 “婚姻的解构与重构” 相关文章合辑。 未整理。 明明渴望爱情 为何反感催婚&#xff1f; 原创 常 晋 人民日报评论 2024 年 04 月 22 日 12:29 北京 没有催促指责&#xff0c;也毫无批评之意。面对单身、失业的 30 岁女儿&#xff0c;只是鼓励孩子&…

jangow靶机攻略

配置网卡 VMware需要配置&#xff0c;不配置扫不到ip,VirtualBox正常打开ip会直接显示出来 网卡配置都改成NAT 打开虚拟机&#xff0c;第一个框选第二行&#xff0c;回车 选第二个&#xff0c;按e键 进入下一个框后&#xff0c;将ro 后面的修改为 rw signin init/bin/bash 按…

自动化测试框架维护成本高怎么办

自动化测试框架维护成本高&#xff0c;可以通过优化测试用例设计、引入持续集成&#xff08;CI&#xff09;策略、强化代码规范和审查机制、建立明确的维护计划、定期进行技术债务清理等方式来降低成本。 其中&#xff0c;优化测试用例设计尤其关键&#xff0c;它不仅能提高测试…

日事清在敏捷开发中的实战应用:SCRUM框架下可视化项目管理+高效沟通机制驱动灵活迭代

一、行业背景 在快速发展的互联网行业中&#xff0c;软件开发模式经历了显著的演变。传统的瀑布式开发模式&#xff0c;以其线性和阶段性的特点&#xff0c;曾长期占据主导地位。然而&#xff0c;随着市场对软件迭代速度和灵活性的要求日益提高&#xff0c;敏捷开发模式应运而…

Buildroot 增加系统启动项并解决后台无法获取输入(串口)

Buildroot 增加自启动项 概述增加模块源码结构编写测试程序编译测试增加系统自启动一个问题解决方案&#xff1a;显式指定输入设备 其他/etc/init.d 目录下的 SXXxxx 文件作用解析‌ 概述 Buildroot 是一款轻量级、高度可定制的开源工具集&#xff0c;专为嵌入式系统打造。它通…

数据库取证分析

目录 一.多表关联 1.一对多联结 2.子查询 二.数据库示例分析 1.多表关联 三.选择SQL分析的原因 四.数据库概述 五.SQL语言 一.多表关联 1.一对多联结 2.子查询 二.数据库示例分析 1.多表关联 三.选择SQL分析的原因 四.数据库概述 五.SQL语言 1.select 字段