Linux环境变量进程地址空间

news2024/9/19 23:06:49

目录

一、初步认识环境变量

1.1常见的环境变量

1.2环境变量的基本概念

二、命令行参数

2.1通过命令行参数获取环境变量

2.2本地变量和内建命令

2.3环境变量的获取

三、进程地址空间

3.1进程(虚拟)地址空间的引入 

3.2进程地址空间的布局和理解

​3.3什么是地址空间?

3.4地址空间如何进行区域划分?

3.5进一步理解进程和进程地址空间

3.6页表的理解

四、Linux内核进程调度队列

4.1优先级

4.2活动队列

4.3过期队列

4.4active指针和expired指针

4.5总结


一、初步认识环境变量

1.1常见的环境变量

  • PATH:Linux系统下的指令命令的默认搜索路径

  • HOME:用户登录shell的默认主工作目录

  • SHELL:当前Shell,它的值通常是/bin/bash

为什么我们运行自己的可执行程序需要加./,而一些指令可以直接执行,这是因为存在环境变量PATH,它是Linux下指令的默认搜索路径,当运行一个指令时,操作系统会到PATH中去查找该指令的所在路径 ,当我们把我们可执行程序的路径添加到PATH中,也可像指令一样直接执行,不需要添加./

  • 和环境变量相关的指令
  • 1. echo: 显示某个环境变量值
  • 2. export: 设置一个新的环境变量
  • 3. env: 显示所有环境变量
  • 4. unset: 清除环境变量
  • 5. set: 显示本地定义的shell变量和环境变

1.2环境变量的基本概念

  • 环境变量是系统引入的一套name=value形式的变量,不同的环境变量具有不同的用途,环境变量具有全局属性

  • 环境变量一般是指在操作系统中用来指定操作系统运行环境的一些参数 

  • 有了全局属性这个概念,以下要引入命令行参数来解释这个概念 

二、命令行参数

2.1通过命令行参数获取环境变量

  • main函数有三个参数,int  agrc ,char*argv[ ] ,char*evn[ ]

  • 当我们在输入各种指令,运行各种程序时,本质上输入的都是一个一个的字符串,bash会根据空格将这些字符串一一划分,argc就是用来记录划分字符串的个数的,argv是一张叫作命令行参数的表(本质上是一个指针数组),里面存储的是被bash分割形成的一个个字符串的地址

  • 为什么需要命令行参数表呢?因为这样可以为我们的指令、软件、软件等提供命令行选项支持!

  • 命令行参数表是以NULL为结束的

  • 实例:通过argv查看命令行参数

  • 实例:通过命令行参数argc和agrv来进行选项的设置

  • main函数中还有一个参数evn,它对应是一张环境变量表,可以通过打印该表来查看系统的所以环境变量

  • 通过比较可以发现,子进程的环境变量和env展示出来的环境变量一模一样!这就可以解释为什么环境变量具有全局属性了!
  • 我们所运行的进程都是子进程,bash本身在启动时会从操作系统的配置文件中读取环境变量, 形成一张环境变量表,这个表会被子进程的main函数参数接收,也就是说,子进程会继承父进程交给它的环境变量,所有建立在父进程上的子进程都会有相同的一份环境变量

2.2本地变量和内建命令

  • 本地变量:只会在本bash内部有效,不会被子进程继承 

 

set可以查看所以变量(环境变量&&本地变量)

 

export可以把本地变量设置成成环境变量

 子进程中也可以查找到一份

 通过unset可清除设置的环境变量

  • 我们知道任何程序和指令在运行时都是bash的子进程,本地变量只对本bash内部有效,那么这里就有一个问题了:为什么使用echo可以显示出MY_VALUE的内容呢?
  • 这里就要再引入一个新的概念:内建命令
  1. 常规命令:通过创建子进程完成的
  2. 内建命令:bash不创建子进程,由bash自己执行,类似bash通过调用自己内部实现的函数或者系统提供的函数,比如echo、cd都属于内建命令,比如我们在cd时改变的是bash下的工作目录,并不会去改变子进程所在的目录
  3. 模拟实现一个具有cd功能的指令--chdir()系统提供的一个改变当前工作目录的函数

2.3环境变量的获取

  • 第一种就是上面演示的通过命令行的第三个参数获取
  • 第二种是通过第三方变量environ获取

  • 第三种是通过调用系统函数获取或者设置环境变量--getenv()和putenv()

三、进程地址空间

3.1进程(虚拟)地址空间的引入 

观察下面代码的运行结果:可以看到子进程对全局变量g_val1进行修改,父进程和子进程输出变量的值不一样,但是地址是一样的,说明该变量所在的地址一定不是物理地址!父子进程输出的变量在物理地址上看来也不是同一个变量!我们在用C/C++语言看到的也是虚拟地址,真正的物理地址用户是看不见到,由操作系统统一管理

  • 操作系统必须负责物理地址和虚拟地址之间的映射,那操作系统具体是如何做到的呢? 

3.2进程地址空间的布局和理解

  • 结合fork() 初步理解地址进程空间

  • 前面已经谈到,fork()创建子进程成功,会有两个返回值,给父进程返回子进程的pid,给子进程返回0。fork()之后创建的子进程,在内存中除了有一个以父进程为模板(拷贝)的pcb数据结构,还有一个从父进程拷贝下来的mm数据结构(进程地址空间)和一个页表,页表中存着变量虚拟地址和物理地址的映射关系、权限字段、判断数据在内存还是磁盘的字段,通过映射关系,可以找到虚拟地址对应的物理地址

  • 子进程刚创建的时候,在mm中数据的虚拟地址和父进程是一样的,我们打印看到的都是这个虚拟地址,子进程刚拷贝父进程的数据结构内容的时候,代码和数据都是共用的,并且数据在页表中的权限会被设置为只读

  • 由于代码是共享的,那么在fork()return前子进程被创建好了,return就会被父子进程各执行一次,又由于return的实质就是在对变量进行写入,这时候就相当于要对数据进行修改

  • 当子进程和父进程有一方要对数据进行修改,就会触发对数据的非法操作,从而发生缺页中断,此时操作系统就会重新在内存中开辟一块空间,将要修改的数据拷贝一份作修改,再重新建立映射关系,这个过程也叫写时拷贝,这样父子进程就做到了各自私有一份数据

  • 我们上面代码所展示的结果,地址一样变量值不一样,这是因为打印出来的地址是虚拟地址,子进程拷贝了父进程的数据结构内容,所以他们的虚拟地址就是一样的;变量值不一样是因为,写时拷贝后虚拟地址在页表中映射的物理地址不一样,找到的数据当然也就并不一样了。这两个原因结合就说明了我们所看到的现象

3.3什么是地址空间?

  • 地址总线排列组合形成的地址范围[0,2^32) 32根地址总线

3.4地址空间如何进行区域划分?

  • 进程地址空间本质上是描绘进程可视范围大小,在内核上他是一个数据结构对象(mm_struct),也要被操作系统管理,地址空间通过各个区域的star和end对区域进行线性(区域)划分,在一个区域的范围内,连续空间中,每一个最小单元都有地址,都可以被使用
  • 区域空间的调整,本质上就是通过调整每个区域的star和end

3.5进一步理解进程和进程地址空间

  • 目前为止,我们所说的进程,就是:进程=内核数据结构对象(pcb,mm,页表)+程序的代码和数据(可执行文件) 

  • 为什么需要进程地址空间?

  1. 让进程以统一的视角来看待内存:如果进程直接和物理地址进行交互,那么进程的pcb数据结构中就势必要存在各个数据的物理地址。一个进程的各个数据部分,在物理内存中实际是乱序的,但是有了地址空间(mm_struct)之后:代码就在代码段,数据就在数据段该在堆区的在堆区,该在栈区的在栈区同时,这些连续的虚拟地址再经过的页表映射到物理内存,这样,让进程数据地址从无序变有序,让进程以统一的视角看待物理内存以及各个运行区域,每个进程都会以为自己占有了整个系统的内存资源

  2. 拦截对内存的非法操作和异常访问:进程地址空间让我们在访问内存的时候有一个转化的过程,在这个过程中,如果我们对内存进行了非法操作和访问,那么就会被拦截,物理内存不会收到影响,进而保护了物理内存

  3. 有了进程地址空间和页表,就可以做到将进程管理模块和内存管理模块进行解耦合:进程在运行的时候不会关心操作系统是如何申请内存的,对进程的管理和对内存的申请都是由操作系统来完成,他们互不干扰!操作系统不做任何浪费时间和空间的事情,当一个进程申请了内存,但是它又不立即使这块内存的时候,就相当于占用了内存资源,这时候操作系统会采用惰性加载的方式:给该进程一个虚拟地址,但在页表中并没有实际映射的物理地址,也就是说进程看到的是已经开辟好的虚拟地址,但在物理内存上并没有真的申请到空间;当进程需要内存的时候,找不到映射的物理地址触发缺页中断,此时操作系统就会给它开辟空间,建立映射关系。从而说明了,pcb数据结构对象的创建先于可执行程序的加载

3.6页表的理解

  • 页表不仅仅有虚拟地址和物理地址的映射,还有对应的权限,当一个进程要对一个数据修改时,本质是通过虚拟地址找到对应物理内存的数据再修改,当要修改某一个数据,但是该数据在页表的所记录的权限只有rx,仅仅允许只读,那么就会修改动作就会被拦截,直接报错,程序崩溃,修改这个动作就不会被允许

  • 这也就是为什么,一个程序崩溃时,并不会影响其他进程,因为崩溃的程序在虚拟内存页表层就已经被拦截,操作系统会直接杀掉进程,进而也就不会影响其他进程的运行

  • 总结:页表存在CPU的cr3寄存器(物理地址),进程在被CPU调度和离开CPU的时候,都要带走寄存器里的数据 ,CPU在运行程序时,为了获取数据,就会通过cr3寄存器里的页表地址找到该进程的页表,页表中的虚拟地址通过映射得到物理地址,进而可以访问到物理内存,同时会根据虚拟地址和物理地址的映射权限(rwx)来决定是否能对该物理内存进行操作,如果非法操作,该请求会被拦截,操作系统会将此进程杀掉

  • 三个实例体现页表的作用

  1. 进程的挂起是如何实现的?前面说到,页表中还存在一个用来判断数据是在内存还是在磁盘中的字段,进程的挂起就是将该进程所对应的数据和代码换出到外设分区中,那么这时候操作系统只需要通过修该字段就可以知道进程是否处于挂起状态

  2. 进程的独立性:进程的独立性表现在,每个进程都有自己私有的一份数据,以及每个进程都有自己的一份mm_struct进程地址空间,这就保证了每个进程只能访问自己的进程地址空间,相互之间不得访问!也就是说,如果进程直接和物理内存打交道,那么就可能访问到其他进程的数据,但是由于进程地址空间的存在,非法访问在页表层面就会被拦截,确保了更个进程之间不会非法访问和篡改对方的数据

  3. 代码和字符常量区的数据为什么是只读的?如果这写数据本身是只读的,那么它就不可能从磁盘加载到内存中!这边的只读是在页表层面上的只读!它在页表中的权限被设置成只读,当一个进程试图修改该部分的数据,一样会被拦截

四、Linux内核进程调度队列

  • 一个CPU拥有一个runqueue 

4.1优先级

  • 普通优先级:100~139(我们都是普通的优先级,想想nice值的取值范围,可与之对应!)
  • 实时优先级:0~99(不关心)

4.2活动队列

  • 所有时间片还没结束的进程都被放在活动队列
  • 本质上是一个指针数组,数组的下标就表示优先级,从100开始
  • 调度过程
  1. 从[0,140)开始遍历,找到第一个优先级最高且非空的队列
  2. 从该队列的第一个进程开始调度运行
  3. 但由于逐一遍历数组的效率太低下了,为了提高查找非空队列的效率,可以采用位图的思想,用5*32个比特位来队列是否为空

4.3过期队列

  • 过期队列的结构和活动队列一样
  • 过期队列上放的都是时间片过期的队列
  • 当活动队列的进程都调度结束了,那么swap交换两个队列的指针,就可以对过期队列的进程进行时间片的重新计算,等待调度运行

4.4active指针和expired指针

  • active指针指向活动队列
  • expired指针指向过期队列
  • 当活动队列的进程全都调度完毕,swap交换两个指针,就相当于有了新的活动队列

4.5总结

  • 在系统当中查找一个最合适调度的进程的时间复杂度是一个常数,不随着进程增多而导致时间成本增 加,我们称之为进程调度O(1)算法

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2147234.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

简易CPU设计入门:本CPU项目的指令格式

在这一节里面,主要是理论知识,基本上不讲代码。不过,本项目的代码包,大家还是需要下载的。 本项目的代码包的下载方法,参考下面的链接所指示的文章。 下载本项目代码 本节,其实是要讲本项目CPU的指令集。…

大模型蒸馏技术

一篇题为《The Mamba in the Llama: Distilling and Accelerating Hybrid Models》的论文证明:通过重用注意力层的权重,大型 transformer 可以被蒸馏成大型混合线性 RNN,只需最少的额外计算,同时可保留其大部分生成质量。 先来说…

Python学习——【2.1】if语句相关语法

文章目录 【2.1】if语句相关一、布尔类型和比较运算符(一)布尔类型(二)比较运算符 二、if语句的基本格式※、练习 三、if-else组合判断语句※、练习 四、if-elif-else多条件判断语句※、练习 五、判断语句的嵌套※、实战案例 【2.…

AlexNet项目图片分类通用模型代码

目录 一:建立AlexNet模型(在model文件中写) 1.构造5层卷积层 2.构造3层神经网络层 3.forward函数 4.模型最终代码 二:训练数据(在train中写) 1.读出数据 2.训练 3. 测试模型更新参数 4.完整的训练…

Datawhile 组队学习Tiny-universe Task01

Task01:LLama3模型讲解 仓库链接:GitHub - datawhalechina/tiny-universe: 《大模型白盒子构建指南》:一个全手搓的Tiny-Universe 参考博客:LLaMA的解读与其微调(含LLaMA 2):Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子…

新的突破,如何让AI与人类对话变得“顺滑”:Moshi背后的黑科技

你有没有想过,当我们跟智能音箱、客服机器人或者语音助手对话时,它们是怎么“听懂”我们说的话,又是怎么迅速给出回应的?就好像你对着Siri、Alexa说一句:“给我订个披萨”,它立刻明白你想要干嘛,然后帮你下单。背后的技术其实比我们想象的要复杂得多,但现在,有了Moshi…

Qt_布局管理器

目录 1、QVBoxLayout垂直布局 1.1 QVBoxLayout的使用 1.2 多个布局管理器 2、QHBoxLayout水平布局 2.1 QHBoxLayout的使用 2.2 嵌套的Layout 3、QGridLayout网格布局 3.1 QGridLayout的使用 3.2 设置控件大小比例 4、QFormLayout 4.1 QFormLayout的使用 5、…

【2024】前端学习笔记8-内外边距-边框-背景

学习笔记 外边距:Margin内边距:Padding边框:Border背景:Background 外边距:Margin 用于控制元素周围的空间,它在元素边框之外创建空白区域,可用于调整元素与相邻元素(包括父元素和兄…

AI预测福彩3D采取888=3策略+和值012路或胆码测试9月19日新模型预测第92弹

经过90多期的测试,当然有很多彩友也一直在观察我每天发的预测结果,得到了一个非常有价值的信息,那就是9码定位的命中率非常高,90多期一共只错了10次,这给喜欢打私房菜的朋友提供了极高价值的预测结果~当然了&#xff0…

教育政策与智能技术:构建新时代教师队伍

据最新统计,我国目前拥有各级各类教师共计1891.8万人,这一庞大的教师群体不仅支撑起了全球规模最大的教育体系,更成为了推动教育创新与变革的主力军。面对教育数字化的不断发展,育人内容、目标要求、方式方法的全面升级&#xff0…

【测向定位】差频MUSIC算法DOA估计【附MATLAB代码】

​微信公众号:EW Frontier QQ交流群:554073254 摘要 利用多频处理方法,在不产生空间混叠的情况下,估计出高频区域平面波的波达方向。该方法利用了差频(DF),即两个高频之间的差。这使得能够在可…

鹏鼎控股社招校招入职SHL综合能力测评:高分攻略及真题题库解析答疑

鹏鼎控股(深圳)股份有限公司,成立于1999年4月29日,是一家专注于印制电路板(PCB)的设计、研发、制造与销售的高新技术企业。公司总部位于中国广东省深圳市,并在全球多个地区设有生产基地和服务中…

【软考】数据字典(DD)

目录 1. 说明2. 数据字典的内容2.1 说明2.2 数据流条目2.3 数据存储条目2.4 数据项条目2.5 基本加工条目 3. 数据词典管理4. 加工逻辑的描述4.1 说明4.2 结构化语言4.3 判定表4.3 判定树 5. 例题5.1 例题1 1. 说明 1.数据流图描述了系统的分解,但没有对图中各成分进…

软件自动定时启动器-添加可执行文件软件,设置启动的时间,也可以设置关闭的时间-供大家学习研究参考

点击添加软件,可以添加可执行文件软件,设置启动的时间,也可以设置关闭的时间 注意,时间为00:00:00 等于没设置,这个时间不在设置范围,其他任何时间都可以。 下载地址: h…

【C++ Primer Plus习题】16.9

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: #include <iostream> #include <ctime> #include <v…

驱动---动态模块编译

动态模块编译 ctags 用法 创建文件 ------- ctags -R 一定要在顶层目录下 1&#xff0e; ctags –R * 2. vi –t tag (请把tag替换为您欲查找的变量或函数名) 3&#xff0e; Ctrl ] (跳转到要找的目标) 4&#xff0e; Ctrl T (回跳) 5&#xff0e; set tag/p…

解决使用nvm管理node版本时提示npm下载失败的问题

目录 一、引言 二、解决步骤 1. 访问该网站下载对应版本的npm Release v6.14.18 npm/cli GitHubthe package manager for JavaScript. Contribute to npm/cli development by creating an account on GitHub.https://github.com/npm/cli/releases/tag/v6.14.18 2. 解压到n…

mac使用技巧

mac使用技巧 快捷键 Command-X&#xff1a;剪切所选项并拷贝到剪贴板。Command-C&#xff1a;将所选项拷贝到剪贴板。这同样适用于“访达”中的文件。Command-V&#xff1a;将剪贴板的内容粘贴到当前文稿或应用中。这同样适用于“访达”中的文件。Command-Z&#xff1a;撤销上…

高级算法设计与分析 学习笔记6 B树

B树定义 一个块里面存了1000个数和1001个指针&#xff0c;指针指向的那个块里面的数据大小介于指针旁边的两个数之间 标准定义&#xff1a; B树上的操作 查找B树 创建B树 分割节点 都是选择正中间的那个&#xff0c;以免一直分裂。 插入数字 在插入的路上就会检查节点需不需要…

Ansible——Playbook基本功能???

文章目录 一、Ansible Playbook介绍1、Playbook的简单组成1&#xff09;“play”2&#xff09;“task”3&#xff09;“playbook” 2、Playbook与ad-hoc简单对比区别联系 3、YAML文件语法&#xff1a;---以及多个---&#xff1f;&#xff1f;使用 include 指令 1. 基本结构2. 数…