Linux——进程地址空间,写时拷贝,进程独立性

news2024/11/18 11:24:54

Linux进程内存分布

验证地址空间排布


结论:堆区向地址增大的方向增长,栈区向地址减少的方向增长。局部变量通常保存在栈上,先定义的先入栈,地址是比较高的,后定义的则地址小。

static变量

作用域不变,生命周期改变,如何改变?
编译器会把静态变量放到全局区。静态变量和全局变量的存在同一块空间的,但是只有在函数内才可见。

进程地址空间

每一个进程被运行的时候,操作系统都会为其创建进程地址空间,也会建立各自的页表。虚拟地址空间是物理地址的映射。
如何管理地址空间?
先描述再组织。进程地址空间实际上也是内核中的一个数据结构,mm_struct。
虚拟地址和物理地址之间会有一个页表用于建立映射关系。

mm_struct和vm_area_struct

mm_struct是虚拟地址空间,vm_area_struct是用于划分区域的。
task_struct里有一个mm_struct指针指向虚拟地址空间结构体。
mm_struct里有一个vm_area_struct指针指向mmap,维护了虚拟地址空间的各个区域,来划分每一个区域(栈、堆、代码区)的起点与终点。

unsigned long total_vm, locked_vm, shared_vm, exec_vm;

unsigned long stack_vm, reserved_vm, def_flags, nr_ptes;

unsigned long start_code, end_code, start_data, end_data;

unsigned long start_brk, brk, start_stack;

unsigned long arg_start, arg_end, env_start, env_end;

标识每个区域的起始和终止地址范围。
这里的地址作为页表的K值来与物理地址建立映射。
页表是进程加载到程序的时候自动建立的。通过页表的K值找到实际物理内存里的数据。

程序是如何被加载变成进程的?

程序被编译后,还没被加载,此时程序内部有地址和区域吗?
有!链接就是把程序内部函数的地址和库中函数的地址关联起来。
编译后区域已经划分好了,变量放在对应的区域。除了堆区和栈区是加载到内存之后才有的。

进程本身中的代码也会有地址,但是这个地址是虚拟地址,在页表中作为K值,经过映射,加上偏移量,就能找到实际占用操作系统资源的地址。

比如程序中函数的代码的地址在程序中已经确定,为0x100,加载到内存后,这个地址加上了偏移量10000,放在了内存上的代码区。进程开始后,运行到这里,就要到物理内存中的0x10100中去找。编译后代码的位置已经确定,放到内存中又是一回事,因此要加上偏移量放到物理内存上。

fork的返回值


修改子进程val后父进程的val不变,同一地址的变量会有两个值?

很显然,在C/C++中的地址并不是内存物理上的地址,而是操作系统提供的虚拟地址,操作系统不允许直接读取物理内存。虚拟地址是一样的,但是物理地址是不一样的。

val是父进程的栈空间中的变量,fork函数return会被执行两次,return的本质就是通过寄存器赋值。当父子各自执行return,会发生写时拷贝。

写时拷贝

进程具有独立性,为了保证进程间数据独立,进程间不相互干扰,会有数据的写时拷贝,得到一张新的页表。在上面的程序中,变量的物理地址实际就不同了,因此数据也是不同的。

为什么要写时拷贝?

为什么不创建子进程的时候就写时拷贝?
在数据被修改的时候再深拷贝,而不是一开始就全部拷贝下来,因为可能数据都是只读的,可以节省空间。
最理想的是:只拷贝父进程中会被修改的数据,但是这是无法预测的,因此只能采用写时拷贝这种方式妥协。

代码会不会有写时拷贝?
如果涉及程序替换的时候就会。

为什么要有进程地址空间?

保证进程的独立性

有了自己的虚拟空间之后,就不会有任何系统级别的越界问题存在了。对某一地址空间进行操作之前需要先通过页表映射到物理内存,而页表只会映射属于各个进程自己的物理内存。

解耦了虚拟地址和物理地址

每个进程都认为拥有相同的空间范围,认为自己在独占内存,包括进程地址空间的构成和内部区域的划分顺序等都是相同的,编写程序的时候就只需关注虚拟地址,而无需关注数据在物理内存当中实际的存储位置。

进一步完善进程的独立性以及合理分配内存空间(当实际需要使用内存空间的时候再在内存进行开辟),并能将进程调度与内存管理进行解耦或分离。

比如Linux下向系统malloc申请空间时,系统不会立即真实分配,而只是修改vm_area中的起点和终点,因为怕用户占着不用浪费资源,而是在用户调用到的时候再立刻申请,建立页表映射关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/681876.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【go】Excelize处理excel表 带数据校验的文件导出

文章目录 1 Excelize介绍2 相关需求与实现2.1 数据的excel文件导出2.2 带数据校验的excel文件导出 1 Excelize介绍 Excelize 是 Go 语言编写的用于操作 Office Excel 文档基础库。官方文档:https://xuri.me/excelize/zh-hans/ 引入方法 go get "github.com/…

Linux——进程控制:创建、终止、等待、替换

进程创建 fork #include <unistd.h> pid_t fork(void);操作系统做了什么&#xff1f; 调用fork之后&#xff0c;内核的工作&#xff1a; 分配新的内存块和内核数据结构给子进程将父进程部分数据结构内容拷贝至子进程添加子进程到系统进程列表当中fork返回&#xff0c…

一个简单案例理解为什么在多线程的应用中要使用锁

需求:使用10个线程,同时对一个值count进行加一操作,每个线程对count加100000次,最终使得count1000000 第一版代码:不加锁 ​​​lock.c #include<stdio.h> #include<pthread.h>#define THREAD_COUNT 10void *thread_callback(void *arg){int *pcount(int*)arg;in…

计算机网络--网络传输基本概念

什么是IP地址&#xff1f; 在计算机出厂的时候&#xff0c;有一个唯一标识的物理地址。但是因为厂商不同等各种原因&#xff0c;用来标识一台计算机在网络中是比较麻烦的&#xff0c;于是出现了IP地址&#xff0c;IP地址是互联网协议地址的意思&#xff0c;是“Internet Protoc…

【Matlab】数字图像的 SVD 分解

奇异值分解 (SVD, Singular Value Decomposition) 是线性代数中一种重要的矩阵变换方法&#xff0c;对矩阵进行 SVD 分解&#xff0c;可以把复杂的矩阵简化&#xff0c;从而提取出重要的信息。数字图像的 SVD 分解是对数字图像建模的一种方法与工具&#xff0c;可以应用于图像压…

操作系统01-导论

一、概述 操作系统&#xff1a;英文是operating system&#xff0c;OS 它的作用运行用户程序&#xff08;核心目标&#xff09;高效使用计算机&#xff08;面向系统&#xff09;方便使用计算机&#xff08;面向用户&#xff09; 二、内容 2.1 现代计算机系统 一个或多个CPU和…

机器学习:self supervised learning

340M 参数 BERT 自监督学习的目标跟目标越接近越好。 一个任务&#xff1a;预测句子中被mask的词&#xff1a; BERT通过Masking Input来获得训练数据 mask有两种做法&#xff1a; 将某个字token换成一个特殊符号&#xff08;代表盖住&#xff09; 随机把某个字换成另外一个…

chatgpt赋能python:Python程序怎么打包

Python程序怎么打包 Python作为一种功能强大的编程语言&#xff0c;它的很多应用都需要打包成可执行文件或者可以方便部署的代码。本篇文章将介绍Python程序打包的方法及步骤。 为什么需要打包&#xff1f; 分享代码或程序&#xff1a;当你编写了一个Python程序并且想要分享给…

【⑥MySQL多表查询】:让你的数据检索更高效

前言 ✨欢迎来到小K的MySQL专栏&#xff0c;本节将为大家带来MySQL中多表查询相关知识的讲解 目录 前言一、多表关系二、多表查询1、交叉连接2、内连接3、外连接 三、集合运算四、七种JOINS实现五、多表查询练习六、总结 一、多表关系 ✨项目开发中&#xff0c;在进行数据库表结…

MySQL生产环境高可用架构详解

一、MySQL高可用集群介绍 1、数据库主从架构与分库分表 随着现在互联网的应用越来越大&#xff0c;数据库会频繁的成为整个应用的性能瓶颈。而 我们经常使用的MySQL数据库&#xff0c;也会不断面临数据量太大、数据访问太频繁、数据 读写速度太快等一系列的问题。所以&#xf…

记录分享在10年老的商务本Dell E6230上安装Debian 12的过程,遇到的问题和解决方法

原先在笔记本上安装的是Debian 9&#xff0c;最近发现无法更新了&#xff0c;查一下发现&#xff0c;所有的“源”只支持deb10&#xff0c;11 和 12&#xff0c;所以特意订了一块新的硬盘来安装新系统&#xff0c;前后倒腾了两天多。 在此记录这个过程中遇到的问题和解决的方法…

Mysql主从复制和读写分离(期望日子清静,抬头皆是温柔)

文章目录 一、读写分离1.什么是读写分离?2.为什么要读写分离呢?3.什么时候要读写分离?4.读写分离原理5.读写分离方式&#xff08;1&#xff09;基于程序代码内部实现&#xff08;2&#xff09;基于中间代理层实现 二、主从复制1.主从复制与读写分离的关系2.mysql支持的复制类…

langchain源码阅读系列(一)之LLM输入输出管理

原文首发于博客文章OpenAI 文档解读 LangChain 主体分为 6 个模块&#xff0c;分别是对&#xff08;大语言&#xff09;模型输入输出的管理、外部数据接入、链的概念、&#xff08;上下文记忆&#xff09;存储管理、智能代理以及回调系统&#xff0c;通过文档的组织结构&#x…

如何编写一个最简单的 udp 版本的 echo server 和 echo client(小白也懂!)

目录 目的 第一步 编写Server(服务器) 第二步 创建Server的各类参数 第三步 实现具体的Server内容 第四步 编写Client(客户端) 实现具体的Client内容 总流程 总代码 源码下载 目的 我们编写一个udp 版本的 echo server 和 echo client 实现在自己电脑上通过客户端…

open【部署、使用教程】

目录 【1】创建证书 【2】安装openVPN-Server端并配置 【3】将证书移动到相对路径 【4】开启内核转发功能&#xff0c;否则会无法启动openVPN 【5】启动服务&#xff0c;加入开机自启 【6】启动后服务端会生成一个tun0的虚拟网卡&#xff0c;用于不同网段之间相互通信 【…

VUE2.0集成 Markdown 编辑器

Markdown编辑器的使用 这是一款基于Vue的markdown编辑器。既可以用来编辑Markdown语法&#xff0c;又可以用来解析 效果图,mavonEditor实现了Markdown集成 Markdown是一种标记语言&#xff0c;相较于word文档更加清晰方便&#xff0c;适合进行笔记等。将Markdown集成进入自己项…

Matlab使用S函数

什么是S函数&#xff1f; S-函数是系统函数&#xff08;System Function&#xff09;的简称&#xff0c;在 Simulink 中用非图形化的方式来描述一个模块。一个完整的S-函数结构体系包含了描述一个动态系统所需要的全部能力。使用S-函数用户可以向 Simulink 模型中添加自己的模块…

【PCB专题】Allegro中设置泪滴

PCB绘制完成后有时按需要对PCB进行添加泪滴的操作是非常必要的。 添加泪滴的作用主要是: 信号传输时平滑阻抗,减少阻抗的急剧跳变,避免高频信号传输时由于线宽突然变小而造成反射。 焊接时可以保护焊盘,避免多次焊接时焊盘的脱落,生产时可以避免蚀刻不均,以及过孔偏位出…

一键安装和导出当前Python项目的依赖包总结

创建python环境&#xff0c;配置一个python运行项目。在项目可以运行的环境下&#xff0c;导出该项目所依赖包到一个requirements.txt文档中。在另一个纯净环境中&#xff0c;快速批量安装项目所依赖的包&#xff0c;便于快速进行项目迁移 一、导出当前Python项目的依赖包1、方…

【数据结构与算法】3、虚拟头节点、动态数组的缩容、动态数组和单链表的复杂度、数组的随机访问

目录 一、虚拟头节点二、数组的随机访问三、动态数组、链表复杂度分析四、动态数组 add(E element) 复杂度分析五、动态数组的缩容 一、虚拟头节点 &#x1f33c; 为了让代码更加精简&#xff0c;统一所有节点的处理逻辑&#xff0c;可以在最前面增加一个虚拟的头节点&#xf…