Linux环境变量与程序地址空间

news2025/1/16 19:02:49

Linux环境变量与程序地址空间

文章目录

  • Linux环境变量与程序地址空间
    • 1.环境变量
      • 1.1 环境变量概念与深入理解
      • 1.2 代码获取环境变量的方法
      • 1.3 系统调用获取和设置环境变量的方法
    • 2.程序地址空间
      • 2.1 程序地址空间图(准确来说是进程地址空间图)
      • 2.2 程序地址空间的验证
      • 2.3 进程地址空间概念
      • 2.4 引入虚拟内存空间原因
      • 2.5 关于进程地址空间技术的一些疑难问题解答
    • 3.Linux内核的进程调度队列
      • 3.1 Linux内核调度系统简图
      • 3.2 对于Linux内核调度队列的理解


1.环境变量

1.1 环境变量概念与深入理解

  1. 环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数

  2. 比如:我们在编写C/C++代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找

  3. 环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性

  4. Linux下的环境变量和Windows下的环境变量意思差不多,只是Windows使用了GUI,如下图:

请添加图片描述

常见环境变量:

PATH : 指定命令的搜索路径

HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)

SHELL : 当前Shell,它的值通常是/bin/bash

查看环境变量方法:

  1. 方法一:echo $PATH
  2. 方法二:env|grep PATH

注:每个分割一个环境路径

请添加图片描述

请添加图片描述

和环境变量相关的命令:

  1. echo: 显示某个环境变量值
  2. export: 设置一个新的环境变量
  3. env: 显示所有环境变量
  4. unset: 清除环境变量
  5. set: 显示本地定义的shell变量和环境变量

环境变量的组织方式:每个程序都会收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以’\0’结尾的环境字符串==
请添加图片描述


1.2 代码获取环境变量的方法

方法一:打印命令行第三个参数

#include <stdio.h>
int main(int argc, char *argv[], char *env[])
{
    //我们给main函数传递的argc、argv[]参数,其实是传递的命令行中输入的程序名和选项!
    //char *env[]存储的是环境变量的地址
     int i = 0;
     for(; env[i]; i++)
     {
     	printf("%s\n", env[i]);
 	}
 	return 0;
}
//注:char *env[]就是下图的environ

请添加图片描述

方法二:通过第三方变量environ获取

#include<stdio.h>
#include<unistd.h>
#include<string.h>
int main()
{
    //libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时 要用extern声明
    extern char** environ;
    for(int i=0;environ[i];i++)
    {
        printf("%s\n",environ[i]);
    }
    return 0;
}

请添加图片描述


1.3 系统调用获取和设置环境变量的方法

putenv:获取环境变量

setenv:设置环境变量

#include <stdio.h>
#include <stdlib.h>
int main()
{
     printf("%s\n", getenv("PATH"));
     return 0;
}

请添加图片描述


2.程序地址空间

2.1 程序地址空间图(准确来说是进程地址空间图)

这里主要提一下:"程序的地址空间"是不准确的,准确的应该说成进程地址空间。在进程地址空间概念小节会详细说明!

请添加图片描述


2.2 程序地址空间的验证

参考现象代码:

#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<stdlib.h>
#include<malloc.h>

int g_val=100;
int g_unval;

int main(int argc,char* argv[],char* envp[])
{
    printf("code addr:%p\n",main);
    char* str = "hello world";
    printf("read only addr:%p\n",str);
    printf("init addr:%p\n",&g_val);
    printf("uninit addr:%p\n",&g_unval);
    
    int* p = malloc(10);
    printf("heap addr:%p\n",p);
    
    printf("stack addr:%p\n",&str);
    printf("stack addr:%p\n",&p);
    
    for(int i=0;i<argc;i++)
    {
        printf("args addr:%p\n",argv[i]);
    }
    int i=0;
    while(envp[i])
    {
        printf("env addr:%p\n",envp[i]);
        i++;
    }
    return 0;   
}

请添加图片描述

大家可以观察一下,按照打印的顺序,地址都是由低到高依次打印的,这也就证实了上面那个图

我们将代码稍加改动下:

#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<stdlib.h>
#include<malloc.h>
#include<sys/types.h>
int g_val = 100;
int main()
{
  pid_t id = fork();
  if(id == 0)
  {
     printf("child: pid: %d, ppid: %d, g_val: %d, &g_val: %p\n",getpid(),getppid(),g_val,&g_val);
  }
  else
  {
     printf("father: pid: %d, ppid: %d, g_val: %d, &g_val: %p\n",getpid(),getppid(),g_val,&g_val);
  }
  sleep(1);
  return 0;
}

请添加图片描述

值是一样的,地址也是一样也很正常,没有什么问题

我们在修改以下代码:

#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<stdlib.h>
#include<malloc.h>
#include<sys/types.h>
int g_val = 100;

int main()
{
	pid_t id = fork();
	if(id == 0)
	{
 		g_val = 200;
		printf("child: pid: %d, ppid: %d, g_val: %d, &g_val: %p\n",getpid(),getppid(),g_val,&g_val);
	}
	else
    {
 		 printf("father: pid: %d, ppid: %d, g_val: %d, &g_val: %p\n",getpid(),getppid(),g_val,&g_val);
    }
    sleep(1);
    return 0;
}

请添加图片描述

从这里开始我们就发现问题了,明明子进程全局变量改成了200,父子进程的地址是一样的,为什么父进程没有受到影响呢?

我们可能认为是父进程先执行的,子进程后执行的,所以子进程改了没有影响父进程,那么好,接下来我就让子进程先结束

请添加图片描述

从上图,我们发现让子进程先结束也并没有改变结果呀!说明并不是父子程序执行顺序引起的问题!

那究竟是为什么呢?

首先让我们分析一下问题:

  • 进程已经将全局变量改成200,为什么父进程没有受影响?
  • 为什么子进程已经改了,父进程才来读数据,读到100已经够奇怪了,为什么它们的地址还是一样的?

推理分析过程:

请添加图片描述

经过上图的分析,我们总结一下:

  1. 变量内容不一样,所以父子进程输出的变量绝对不是同一个变量
  2. 但地址值是一样的,说明:该地址绝对不是物理地址!
  3. 在Linux地址下,这种地址叫做虚拟地址
  4. 我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理
  5. 其实所谓的虚拟地址就是上面程序地址空间的那个图,它们经过一定的方式转换成物理地址,进行物理级别的访问

2.3 进程地址空间概念

所谓的进程地址空间:其实就是OS通过软件的方式,给进程提供一个软件视角,认为自己会独占系统的所有资源(内存)

请添加图片描述

  1. 这里就是通过父进程的进程地址空间通过页表映射,映射到物理内存中,当我们创建子进程的时候,本质上是系统内部多了一个进程,而且每一次申请一个新进程的时候,操作系统会为当前新进程创建一个属于该进程的地址空间,所以子进程也有一个属于自己的页表,因为在创建的时候是以父进程为模板,也就意味着父子进程使用的代码和数据都是一样的
  2. 所以我们的子进程对变量进行写入,应不应该影响父进程呢?
    • 页表里取的变量都不一样,很明显是不影响!(这也就回答了上面的为什么修改不会互相影响)
  3. 所以在更改的时候,在物理内存空开辟一个4个字节的空间,将新的值200写进去,更改映射关系,不再指向父进程数据,而是指向新开辟的空间,所以它们的虚拟地址是一样的,但是打印出来的值是不一样的,这种写入时再发生内存重新申请的技术叫做写时拷贝
  4. 这样也就实现了在数据上实现了分离!

2.4 引入虚拟内存空间原因

请添加图片描述

  1. 通过上图对于虚拟内存空间的总结,我们可以知道引入虚拟内存空间的最主要原因是:保护物理内存
  2. 虚拟内存空间技术相当于一种保护模式,保证进程不使用物理地址,而是使用虚拟地址,最后由操作系统将虚拟地址映射到物理内存地址上
  3. 进程直接访问内存是不安全的,在访问内存添加了一层软硬件层,可以对转化过程进行审核,非法的操作直接拦截,通过地址空间,进行功能模块的解耦

举个例子:

  • 假如我们写代码出现了野指针问题,那么这个野指针就会在虚拟地址空间到处乱指,但是无论它怎么乱指也影响不到物理内存,所以随便你乱串,操作系统都不怕,野指针影响的只是你的程序,对操作系统没一点影响!所以这就是起到了保护作用!

最终我们得出引入虚拟内存空间的原因:

  1. 保护内存
  2. 管理进程
  3. 让进程或者程序以一种统一的视角看待内存(简化进程本身的设计与实现)

2.5 关于进程地址空间技术的一些疑难问题解答

  1. 为什么数据要进行写时拷贝?
    • 进程具有独立性。多进程运行,需要独享各种资源,多进程运行期间互不干扰,不能让子进程的修改影响到父进程
  2. 为什么不在创建子进程的时候就进行数据的拷贝?
    • 子进程不一定会使用父进程的所有数据,并且在子进程不对数据进行写入的情况下,没有必要对数据进行拷贝,我们应该按需分配,在需要修改数据的时候再分配(延时分配),这样可以高效的使用内存空间
  3. 代码会不会进行写时拷贝?
    • 90%的情况下是不会的,但这并不代表代码不能进行写时拷贝,例如在进行进程替换的时候,则需要进行代码的写时拷贝
  4. 为什么要有进程地址空间?
    • 有了进程地址空间后,就不会有任何系统级别的越界问题存在了。例如进程1不会错误的访问到进程2的物理地址空间,因为你对某一地址空间进行操作之前需要先通过页表映射到物理内存,而页表只会映射属于你的物理内存。总的来说,虚拟地址和页表的配合使用,本质功能就是保护内存
    • 有了进程地址空间后,每个进程都认为看得到都是相同的空间范围,包括进程地址空间的构成和内部区域的划分顺序等都是相同的,这样一来我们在编写程序的时候就只需关注虚拟地址,而无需关注数据在物理内存当中实际的存储位置
    • 有了进程地址空间后,每个进程都认为自己在独占内存,这样能更好的完成进程的独立性以及合理使用内存空间(当实际需要使用内存空间的时候再在内存进行开辟),并能将进程调度与内存管理进行解耦或分离
  5. 对于创建进程的现阶段理解:
    • 一个进程的创建实际上伴随着其进程控制块(task_struct)、进程地址空间(mm_struct)以及页表的创建

3.Linux内核的进程调度队列

3.1 Linux内核调度系统简图

Linux内核调度系统:

请添加图片描述

Linux内核调度队列:

  • 扩展:一个CPU只有一个runqueue(运行队列),如果有多个CPU就要考虑进程个数的负载均衡问题

请添加图片描述


3.2 对于Linux内核调度队列的理解

活动队列(如上图):

  • 时间片还没有结束的所有进程都按照优先级放在该队列
  • nr_active: 总共有多少个运行状态的进程
  • queue[140]: 一个元素就是一个进程队列,相同优先级的进程按照FIFO规则进行排队调度,所以,数组下标就是优先级!
  • bitmap[5]:一共140个优先级,一共140个进程队列,为了提高查找非空队列的效率,就可以用5*32个比特位表示队列是否为空,这样,便可以大大提高查找效率
  • 从该结构中,选择一个最合适的进程,过程是怎么的呢?
    1. 从0下表开始遍历queue[140]
    2. 找到第一个非空队列,该队列必定为优先级最高的队列
    3. 拿到选中队列的第一个进程,开始运行,调度完成!
    4. 遍历queue[140]时间复杂度是常数!但还是太低效了!

过期队列(如上图):

  • 过期队列和活动队列结构一模一样
  • 过期队列上放置的进程,都是时间片耗尽的进程
  • 当活动队列上的进程都被处理完毕之后,对过期队列的进程进行时间片重新计算

active指针与expired指针(如上图):

  • active指针永远指向活动队列
  • expired指针永远指向过期队列
  • 可是活动队列上的进程会越来越少,过期队列上的进程会越来越多,因为进程时间片到期时一直都存在的
  • 没关系,在合适的时候,只要能够交换active指针和expired指针的内容,就相当于有具有了一批新的活动进程!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/27157.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

概率论中的几个重要悖论问题

1. 蒙提霍尔问题&#xff08;三门问题&#xff09; 三门问题&#xff08;Monty Hall problem&#xff09;亦称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论&#xff0c;大致出自美国的电视游戏节目Lets Make a Deal。问题名字来自该节目的主持人蒙提霍尔&#xff08;Monty Hall&…

【笑小枫的SpringBoot系列】【十八】SpringBoot中的Properties配置

本文简介&#x1f3a8; 随着我们的演示功能越来越多&#xff0c;里面的配置也越来越多&#xff0c;我们怎么更好的来管理这些配置呢&#xff1f; 实际项目中&#xff0c;我们肯定会有开发环境、测试环境、生产环境&#xff0c;我们又该怎么便捷的配置这些环境呢&#xff1f; …

CANopen之SDO,PDO

一、简述 CAN 总线是一种串行通信协议&#xff0c;具有较高的通信速率的和较强的抗干扰能力&#xff0c;可以作为现场总线应用于电磁噪声较大的场合。由于 CAN 总线本身只定义ISO/OSI 模型中的第一层&#xff08;物理层&#xff09;和第二层&#xff08;数据链路层&#xff09…

nodejs+mysql网上书店图书销售购物商城系统vue

系统功能 此系统的功能分为用户模块和管理员模块&#xff1a; 1、用户后台功能模块包括&#xff1a;首页、个人中心、订单评价管理、我的收藏管理、订单管理模块。 2、前台首页功能模块包括&#xff1a;首页、图书信息、图书资讯、个人中心、后台管理、购物车、在线聊天模块。 …

SAP MDG —— 更好地理解你的数据变更

概念 在SAP MDG on SAP S/4HANA 2021中&#xff0c;SAP发布了一种全新的数据分析框架&#xff1a;变更请求中的主数据变更分析。依赖该框架&#xff0c;你可以为你的最终用户提供强大的数据分析功能&#xff0c;以深度洞悉变更请求中到底变化了哪些数据。 使用这些分析功能&a…

Thinkphp6 分布式事务异常处理 1440 XAER_DUPID: The XID already exists

Mysql分布式事务&#xff0c;前提条件 MySQL中只有当隔离级别设置为Serializable的时候才能使用分布式事务。 执行两个命令确认环境 show variables like innodb_support_xa;show variables like %tx_iso%;异常信息 根据官方分布式示例 public function test(){Db::transa…

input空格回车输入标签

分析 我们自己封装input输入标签需要注意一下几点: 样式实现&#xff0c;span实现标签效果、input隐藏边框(Element-UI可以直接使用tag)。事件监听&#xff0c;确定生成标签的操作&#xff0c;可以是回车,并且需要监听离开焦点的情况。标签限制,最多几个,以及输入验证 html:&…

使用CDC模式改造遗留系统

项目改造背景及挑战 在我们经历的各种遗留系统改造之旅中&#xff0c;使用**绞杀者模式**来改造一个巨大的单体服务&#xff0c;是一种被广泛采用且验证行之有效的手段&#xff0c;在应用传统的绞杀者模式时&#xff0c;通常采用逐步替换的方式&#xff0c;将遗留系统中某一独…

b站pink老师JavaScript的ES6面向对象课程中:正则表达式案例代码——表单验证

目标效果&#xff1a; 1.当输入的手机号&#xff0c;QQ号&#xff0c;昵称&#xff0c;短信验证码&#xff0c;登录密码&#xff0c;确认密码&#xff1a;如果符合标准&#xff0c;就提示正确的文字;如不符合标准&#xff0c;则提示不正确。 2.判断确认密码是否与登录密码相等…

落实交通强国,鄂州临空区联手蘑菇车联打造新时代内陆开放高地

临空经济与智能网联、自动驾驶能擦出什么样的火花&#xff1f;今年7月&#xff0c;鄂州花湖机场投运&#xff0c;标志着这个湖北省“一号工程”正式蝶变为亚洲规模最大、自动化程度行业领先的航空货运枢纽。鄂州花湖机场项目也是湖北加快建设交通强国示范区、打造新时代“祖国立…

Spring Boot配置多个日志文件记录不同类日志示例

了解如何使用多个文件追加器在Spring 引导应用程序中创建多个日志文件。了解如何使用翻转策略、归档等配置所有文件追加器&#xff0c;wiihlog4j2和日志配置。 1. 带登录的多个日志文件 以下文件包含 5 个记录器。我们可以根据需要创建更多的记录器。logback.xml console– …

NeRF源码运行与学习(pytorch)

神经辐射场&#xff08;NeRF&#xff09;是一个简单的全连接网络&#xff08;权重约为5MB&#xff09;&#xff0c;经过训练&#xff0c;可以使用渲染损失再现单个场景的输入视图。网络直接从空间位置和观看方向&#xff08;5D输入&#xff09;映射到颜色和不透明度&#xff08…

翻译文本的软件有哪些?这几个翻译工具你可以试试看

文本翻译&#xff0c;是我们在生活中或工作中比较常见的一个需求。例如有时收到一份英文资料&#xff0c;没时间逐字翻译成中文&#xff0c;那就需要借助翻译工具来帮忙了&#xff1b;或者是有时需要将一些内容翻译成英文&#xff0c;而碰巧遇到句子不知道如何翻译&#xff0c;…

DDPM(Denoising Diffusion Probabilistic Models)扩散模型简述

引言 扩散模型最早是在2015年的Deep Unsupervised Learning using Nonequilibrium Thermodynamics文章中提出的&#xff0c;但当时扩散模型并不work&#xff0c;所以并没有被广泛应用。在2020年&#xff0c;Denoising Diffusion Probabilistic Models(简称为DDPM)的出现&#…

[附源码]java毕业设计校园闲置物品交易

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

MCE | 动物实验溶剂大讨论

在动物实验中&#xff0c;药物通常会以溶液 (Solution) 或混悬液 (Suspension) 的形式给药。我们需选择合适的溶剂&#xff0c;可以辅助超声加热措施&#xff0c;得到澄清的溶液或适合给药的混悬液。■ 人见人爱的生理盐水/PBS 对于水溶性很好的产品&#xff0c;用生理盐水 (Sa…

中学数学课程标准(教学大纲)的传承与变迁

目 录 摘 要 I Abstract II 第一章 绪论 1 1.1研究背景及意义 1 1.2研究现状 1 1.3研究内容 3 第二章 1990以来我国中学数学课程标准&#xff08;教学大纲&#xff09;改革回顾 4 2.1改革回顾 4 2.1.1 1990年数学教学改革的内容 4 2.1.2 2001年数学教学改革的内容 5 2.1.3 2011…

XSS(Cross-site Script,跨站脚本)漏洞笔记

起源 最早的 XSS 漏洞可追溯到 1999 年末&#xff0c;微软安全工程师发现一些网站遭到攻击&#xff0c;网站被插入了一些恶意脚本和图像标签。随后&#xff0c;微软对此类漏洞进行研究分析&#xff0c;并在 2000 年 1 月&#xff0c;正式使用“cross-site scripting”这个名称…

C语言-指针初阶(6)

目录 思维导图&#xff1a; 1. 指针是什么&#xff1f; 2. 指针和指针类型 2.1 指针-整数 2.2 指针的解引用 3. 野指针 3.1 野指针成因 3.2 如何规避野指针 4. 指针运算 4.1 指针-整数 4.2 指针-指针 4.3 指针的关系运算 5. 指针和数组 6. 二级指针 7. 指针数组…

50行Python代码实现自动下载小说,并打包exe直接

前言 室友喊着没有小说看&#xff0c;让我给他推荐几本&#xff0c;这能难倒我&#xff1f; 分分钟就用python给他把整个网站的小说都给下载下来了&#xff0c;不愧是我啊&#xff01; 话不多说&#xff0c;我们直接开整&#xff01; &#xff08;文末送读者福利&#xff09…