【UCB CS61C】Lecture 4 - C Memory Management Usage

news2024/9/24 17:15:55

目录

  • C 的内存布局(Memory Layout)
    • 栈(Stack)
    • 静态数据(Static Data)
    • 代码(Code)
  • 寻址(Addressing)
    • 地址(Address)
    • 字节序(Endianness)
  • 动态内存分配
    • `sizeof()`
    • 内存分配的实现
      • `malloc(n)`
      • `free(p)`
      • `calloc()`
      • `realloc()`
    • 简单示例
  • 内存有关的错误
  • 常见内存问题
    • C 字符串标准库的修订
  • 创建一个简单的 C 链表

本文章系计算机体系结构课程 UCB CS61C: Great Ideas in Computer Architecture 的学习笔记。

C 的内存布局(Memory Layout)

在这里插入图片描述

  • 程序的地址空间address space)包括 4 个区域:
    • 栈(stack):向低地址扩展,包含局部变量和函数帧function frame,存储函数调用相关信息)
    • 堆(heap):向高地址扩展,可以动态调整空间大小,通过 malloc() 等函数申请内存,通过 free() 等函数释放,通过指针的方式访问
    • 静态数据(static data):主要存放全局变量和静态变量,内存在整个程序运行生命周期中保持恒定
    • 代码(code):程序载入和启动的区域,程序运行期间不会改变
  • 操作系统利用虚拟内存技术1阻止堆、栈之间的访问,确保数据不被破坏。
  • 在函数外部声明的变量将会存储至静态数据区,而在函数内部声明的变量将会存储至中。
    • 当程序运行时,main() 函数会在调用栈callback stack)中创建一个函数帧。
    • main() 函数返回(return)时会释放所有栈中数据,使得栈的空间布局复原。
  • 动态分配的内存位于中。

栈(Stack)

在这里插入图片描述

  • 栈由栈帧stack frame)组成,每一个栈帧包含了一个函数或过程(procedure)的所有局部变量,是一个连续的内存块
  • 一个栈帧包含:
    • 调用函数的位置
    • 函数参数
    • 局部变量的空间
  • 栈指针stack pointer,SP)指向最低与当前地址的栈内位置。
  • 随着函数不断被调用,栈帧进栈,栈指针从上往下移动;当函数停止调用时,栈指针会从下往上移动,直到栈指针指向栈底,复原到函数帧创建前的布局,类似于栈帧出栈。在这个过程中,只是栈指针在移动,栈帧里面的数据并没有被清空
  • 栈遵循后进先出(LIFO,last in first out)的原则,递归地弹出每一个栈帧。
  • ⚠️ 不要从函数返回局部变量的指针,它可能会指向任意数据。编译器会以 warnings 警告,请不要忽略!

静态数据(Static Data)

  • 静态数据是存放静态变量的区域:
    • 存储的数据不会受到函数调用的影响。
    • 字符串字面量(string literals)属于静态数据,通过类似 char * str = "hi"; 来声明,而 char str[] = "hi"; 这样的声明会存放到栈中。
  • 技术上来说,静态数据可以分为两个部分:只读段和读写段,以便实际上修改某些值。

代码(Code)

  • 实质上是程序代码的副本,无法更改且一般只读。

寻址(Addressing)

地址(Address)

  • 一个地址的大小(指针的大小)以字节为单位,取决于架构。例如,对于 32 位操作系统,共有 232 个可能的地址。
  • 按字节寻址byte-addressed):每个地址指向一个唯一的字节。
  • 按字寻址word-addressed):每个地址指向一个唯一的单词。

字节序(Endianness)

Big-endian

  • 大端序Big Endian)存储按升序内存地址排列的降序数值显著性2numerical significance,数值结果的精确性和可靠性),即数据的字节由高到低排序,对应着存放的内存地址由低到高排序。

Little-endian

  • 小端序Little Endian)存储按降序内存地址排列的升序数值显著性,即数据的字节由低到高排序,对应着存放的内存地址由高到低排序。
  • 字节序是指数据在内存中的存放顺序而不是数字表示,仅适用于占用多个字节的值。
  • 寄存器(register)本身并没有字节序的概念,它是CPU内部的高速存储单元,用于暂时存放指令、数据和地址。它们通常是固定大小的、以整个数据单元(32 位或 64 位),而不是以字节为单位,也不关心数据的字节序。
  • 一个单字节的数据(例如任意一个字符)、数组和指针既有大端序又有小端序。

动态内存分配

  • 我们有时候需要在编译时间内持久稳定、同时未知大小的内存用来存放输入文件、用户交互等数据,但是由于栈帧不具有持久性存储,函数返回时会清除内存,从而数据被弃用或者覆盖,因此栈并不能解决这一问题
  • 动态内存分配通过heap)来实现,比栈更持久,它将数据保留在函数调用之外。
  • 堆和栈分别从内存的两端开始分配,逐渐向中间扩展;堆通常从低地址向高地址增长

sizeof()

  • 返回一个以字符大小为单位的变量或类型所占内存大小的整数。
  • sizeof(char) 的结果始终为 1!
  • 一般情况下,字符所占用内存的大小为 1 字节,实际上 sizeof 返回变量或类型大小的字节数
  • 无法通过直接对整个数组使用 sizeof() 运算符来获取该数组的长度,
  • 对于一个数组 a ,若满足在同一函数中定义且在栈上分配sizeof(a) 将返回填充数组所需的字节数,那么我们可以通过 sizeof(a) / sizeof(array_typename) 来求出数组的长度;否则,将返回对应类型的指针大小。

内存分配的实现

  • 申请内存的3 个函数:malloc()calloc()realloc()

malloc(n)

  • 接受一个所需连续内存块字节大小的参数 n 并分配(内存块不一定相邻),这一内存实际上尚未初始化,包含内存垃圾,无法保证实际存储在其中的内容。
  • 返回一个指向被分配内存块首端的指针,分配失败时返回 NULL ,因此使用时需要随时检查内存分配是否成功。
  • 通常用于数组或结构体,同时使用 sizeof() 以及强制转换是一个好的实践,sizeof() 可以使得代码适用于多个架构,而 malloc() 返回 void * 类型,强制转换将会确保指针类型的正确性。例如,我们需要为一个含有 n 个元素的 int 数组分配内存:
int *p = (int *) malloc(n * sizeof(int));

free(p)

  • 接受一个指向被分配内存块首端的指针的参数 p,释放整个内存块。
  • p 必须是 malloc() 等内存申请函数的返回值,否则会抛出系统异常(System Exception)。
  • 不能对已释放的内存块使用 free() ,会造成重复释放错误double free error),导致系统安全漏洞;对于非堆的内存使用也是不被允许的未定义行为;建议使用独立的指针,避免使用指针运算,以确保原始地址不丢失。

calloc()

void *calloc(size_t nmemb, size_t size)

  • 接受两个参数,nmemb 是成员或元素的数量,size 是每个成员或元素的大小。
  • 类似于 malloc() ,但是 calloc() 将数组的每个元素初始化为 0。
int *p = (int *) calloc(5, sizeof(int));

realloc()

void *realloc(void *ptr, size_t size)

  • 接受一个已经存在的数据的指针的参数,重新分配该内存块的大小,会根据实际需求调整内存大小。
  • 返回可能指向新位置的指针,若重新分配失败,则返回原地址。

简单示例

#include <stdlib.h>

typedef struct {
	int x;
	int y;
} point;

point *rect;

if (!(rect = (point *) malloc(2 * sizeof(point)) {  //检查是否返回 NULL
	printf("Out of memory!\n");
	exit(1);
}

free(rect);

内存有关的错误

  • 段错误(segmentation fault:正在运行的 Unix 程序试图访问未分配给它的内存,并因此终止,通常还会生成核心转储core dump,提供了程序崩溃时的完整状态)。
  • 总线错误(bus error:在执行机器语言指令时发生的一个致命失败,由处理器在其总线上检测到异常情况引起。
    • 无效的地址对齐(在奇数地址访问多字节数)、访问一个不对应任何设备的物理地址,或其他特定于设备的硬件错误。

常见内存问题

  • 使用未初始化的值
void foo(int *p) {
	int j;
	*p = j;   // j 未初始化(垃圾),被拷贝至 *p
}

void bar() {
	int i = 10;
	foo(&i);
	printf("i = %d\n", i);   //使用包含垃圾的 i
}
  • 使用未拥有的内存:
    • 使用 NULL 或垃圾数据作为指针
typedef struct node {
	struct node* next;
	int val;
} Node;

int findLastNodeValue(Node* head) {
	while (head->next != NULL)  //如果 head 为空,则会弹出段错误而不给出任何部分的提示
		head = head->next;
	
	return head->val;
}
    • 试图访问已经被释放的栈或堆分配的变量
char *append(const char* s1, const char *s2) {
	const int MAXSIZE = 128;
	char result[MAXSIZE];   //函数内部定义、在栈上分配的局部数组
	int i = 0, j = 0;

	for (; i < MAXSIZE - 1 && j < strlen(s1); i++, j++)
		result[i] = s1[j];
	for (; i < MAXSIZE - 1 && j < strlen(s2); i++, j++)
		result[i] = s2[j];

	return result;   //函数返回后,指向栈的指针不再有效
}

返回指向数组 result 的指针是不安全的,指向的内存不再有效,会导致未定义行为。要解决这个问题,可以使用动态内存分配来确保返回的指针指向的是有效的内存:

char *result = malloc(MAXSIZE);
if (result == NULL)
     return NULL;     //检查内存分配失败的情况
    • 对于栈或堆的数组超出范围的引用
void StringManipulate() {
	const char *name = "Safety Critical";
	char *str = malloc(sizeof(char) * 10);
	strncpy(str, name, 10);
	str[10] = '\0';   //写入超出数组边界的部分
	printf("%s\n", str);  //读取超出数组边界的部分
}
  • 释放无效的内存
typedef struct {
	char *name;
	int age;
} Profile;

Profile *person = (Profile *) malloc(sizeof(Profile));
char *name = getName();
person->name = malloc(sizeof(char) * strlen(name));  //没有为空终止符分配空间,应为 (strlen(name) + 1)
strcpy(person->name, name);
//一系列没有 bug 的操作
free(person);
free(person->name);  //访问已经被释放的内存地址,这一步应当与上一步调换顺序
void FreeMemX () {
	int fnh = 0;
	free(&fnh);   //试图释放一个栈变量,这是不正确的,我们应该释放 malloc() 动态分配的内存
}

void FreeMemY() {
	int *fum = malloc(4 * sizeof(int));
	free(fum + 1);   //释放内存块中间的部分而不是首端,这是不正确的
	free(fum);
	free(fum);       //重复释放内存
}
  • 内存泄漏
int *pi;
void foo () {
	pi = (int *) malloc(8 * sizeof(int));    //已经将旧指针覆盖了,无法再释放原来声明 int 指针的 4 * sizeof(int) 字节的内存
	free(pi);
}

void main() {
	pi = (int *) malloc(4 * sizeof(int));
	foo();   // foo() 造成内存泄漏
}
    • 经验法则(Rule of Thumb):malloc() 多于 free() 意味着内存泄漏。
    • 更改指针时,应确保提前复制一个副本进行操作,以便后续进行内存管理。例如,直接对动态分配的指针 plk 操作 plk++ 会丧失对原有内存的访问权,从而导致内存泄漏。
    • 我们可以使用调试工具 V a l g r i n d Valgrind Valgrind 来实时查找内存错误; V a l g r i n d Valgrind Valgrind 跟踪每个取消引用和内存分配的行为,会降低程序的运行速度。请注意,这并不能保证找到所有的内存错误,因此我们必须规范自身的代码写作习惯。
  • 缓冲区溢出(buffer overflow:程序试图将更多的数据写入缓冲区(如数组或内存块)时,超出其实际分配的内存大小,会导致巨大的安全漏洞,常被利用于越狱 iPhone 等黑客手段。
char buffer[1024];  //预留了 1 kb 字符的空间

int foo (char *str) {
	strcpy(buffer, str);  //如果我们输入超过 1 kb 的字符,将会出现缓冲区溢出的问题
}

C 字符串标准库的修订

对此,C 对 #include <string.h> 的库函数进行修订来解决一些安全问题:

  • int strnlen(char *string, size_t n); - 类似于 strlen() 函数,但接受一个参数 n ,用于限制计算的最大字符数,会在达到指定的最大长度时停止计数,从而避免读取未定义的内存区域。
  • int strncmp(char *str1, char *str2, size_t n); - 类似于 strcmp() 函数,用于比较部分字符串,适用于需要限制比较长度或不确定字符串长度的情况,常用于处理字符串输入或避免某些类型的错误。
  • int strncpy(char *dst, char *src, size_t n); - 将字符串 src 的前 n 个字节的数据复制到 dst 的内存中。

因此,我们可以使用一种更安全的方式复制数组,从而避免缓冲区溢出等重大安全漏洞:

#define ARR_LEN 1024;
char buffer[ARR_LEN];

int foo (char *str) {
	strncpy(buffer, str, ARR_LEN);
}

创建一个简单的 C 链表

创建链表中节点的结构体:

struct Node {
	char *value;
	struct Node *next;
} node;

为链表编写 addNode() 节点添加函数(从首端添加):

node *addNode (char *s, node *list) {
	node *new = (node *) malloc(sizeof(NodeStruct));
	new->value = (char *) malloc(strlen(s) + 1);    //注意空终止符
	strcpy(new->value, s);
	new->next = list;
	return new;
}

删除、释放第一个节点的函数 deleteNode()

node  *deleteNode (node *list) {
	node *temp = list->next;
	free(list);
	return temp;
}

神尾观铃


  1. 该技术使得应用程序认为其拥有连续的可用的内存(通常是一个连续完整的地址空间)——而实际上——通常是被分隔成多个物理内存碎片,还有部分暂时存储在外部磁盘存储器上,在需要时进行数据交换。 ↩︎

  2. 在计算机科学和数值计算领域,数值显著性指的是数值结果的精确性和可靠性。它涉及到如何处理和表示数字,以确保计算结果在数值上是稳定和准确的。数值显著性通常与精度Precision,数值表示中有效数字的位数)、舍入误差Rounding Error,由于有限精度产生的实际数值和计算机表示的数值之间可能存在的差异)、截断误差Truncation Error,由于近似或截断某些数值或计算过程而引入的误差)、数值稳定性Numerical Stability,算法在输入数据的微小变化下,输出结果的变化程度)和条件数Condition Number,衡量函数对输入误差的敏感度的指标,一个函数的条件数越大,输入数据的微小变化可能导致输出结果的较大变化,表明该函数在数值上是不稳定的)这些方面有关。 ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2090127.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电脑缺少dll文件怎么解决?Dll文件修复工具使用教程(方法合集)

众所周知&#xff0c;dll文件是计算器中的一类文件。占据了Windows操作系统的重要地位&#xff0c;主要作用就是可以让多个程序在运行时加以使用。dll文件包含了数字、文本、界面的等内容。 电脑缺少dll文件怎么解决&#xff1f;如果你启动某个程序时&#xff0c;发现电脑提示缺…

如何共享EC2 AMI给其他AWS账户

在本篇文章中&#xff0c;我们将详细介绍如何通过Amazon Web Services (AWS) 的Elastic Compute Cloud (EC2) 平台&#xff0c;将自定义AMI&#xff08;Amazon Machine Image&#xff09;共享给其他AWS账户。接下来&#xff0c;我们九河云将一步步引导您完成整个过程&#xff0…

数据驱动,智领办公!陀螺匠·企业助手 v1.7公测版发布

在数字化转型浪潮中&#xff0c;企业对办公自动化系统的需求愈加强烈&#xff0c;追求高效、灵活、智能的办公管理解决方案成为行业共识&#xff0c;我们深知&#xff0c;只有不断创新和完善&#xff0c;才能满足企业日益增长的需求。此次&#xff0c;我们带来陀螺匠企业助手 v…

【GeoScenePro】知识图谱

视频教程: ArcGIS/GeoScene知识图谱入门篇_哔哩哔哩_bilibili 所需软件: GeoScene Pro桌面端产品 Geoscene Enterprise四大组件(GeoScene_Server、GeoScene_DataStore、GeoScene_Portal、GeoScene_Web_Adaptor) 安装 【GeoScenePortal】安装和部署-CSDN博客

2024年下半年软考备考前的注意细节点

一、备考教材信息——选择官方正版&#xff08;电子、纸质都可以&#xff09; 中项 书名&#xff1a;《系统集成项目管理工程师教程》&#xff08;第三版&#xff09; 出版社&#xff1a;清华大学出版社 书籍类型&#xff1a;全国计算机技术与软件专业技术资格&#xff08;…

centos安装docker并配置加速器

docker安装与卸载&#xff1a; 1、检查当前是否安装docker yum list installed | grep docker2、卸载docker 根据yum list installed | grep docker查询出来的内容&#xff0c;逐个进行删除 yum remove docker.x86 64 -y3、启动与关闭docker 4、删除/etc/docker文件夹 如果…

少走弯路,ESP32 读取Micro SD(TF)播放mp3的坑路历程。

这个坑采的非常冤枉和巨大&#xff0c;非常大的冤枉路&#xff0c;只能一声叹息 说一下我是如何踩坑的&#xff0c;原本是打算用esp32 读取SD卡播放mp3,在esp32 读取自己打的SD卡已经踩了无数坑了&#xff0c;详情见&#xff1a; 少走弯路&#xff0c;ESP32 使用Micro SD(TF)…

Java学习第五天

数组 数组适合做一批同类型数据的存储。 静态初始化数组&#xff1a; 注意&#xff1a;数组变量名中存储的是数组在内存中的地址&#xff0c;数组是引用类型。 数组的访问 动态初始化数组&#xff1a; 数组的遍历&#xff1a; 注意左边和右边的区别&#xff0c;一个是改变数组…

日元升值,日股遇冷:出口商的烦恼

最近&#xff0c;日元汇率的走强让不少日本企业感到头疼。日元升值就像一把双刃剑&#xff0c;既能带来好处&#xff0c;也能带来坏处。 为什么日元升值会让日本企业头疼&#xff1f; 出口受阻&#xff1a; 当日元升值时&#xff0c;日本商品在国际市场上的价格就会变得相对较…

Access OpenAI (json) API from R

题意&#xff1a;“从 R 访问 OpenAI (JSON) API” 问题背景&#xff1a; I want to access the OpenAI API with the following curl command from R: “我想从 R 中使用以下 curl 命令访问 OpenAI API&#xff1a;” curl https://api.openai.com/v1/engines/davinci/comp…

centos换源安装升级gcc

使用devtools升级安装的时候&#xff0c;由于此库已经停止更新 了&#xff0c;因此需要切换阿里源 SCLDevtoolset 安装与使用笔记-腾讯云开发者社区-腾讯云 (tencent.com)https://cloud.tencent.com/developer/article/1889181 1 yum 安装 yum install centos-release-scl c…

一文说清JMeter如何用于用于性能测试(超长请耐心看完)

JMeter是纯Java语言开发。开源、免费是其重要的特点。 起初就是用于性能测试&#xff0c;主要Web端的性能。 后来扩展到接口测试、回归测试等功能测试领域。 拥有界面&#xff0c;支持多语种。界面还比较完善&#xff0c;适合初学者掌握和使用。 JMeter无需安装&#xff0c;…

Django中的第一个自动化测试编写

跟着Django官网中的投票应用学习&#xff0c;其中有官方说明的一个bug:如果 Question 是在一天之内发布的&#xff0c;那么这个Question 应该显示“published_recently”&#xff0c;返回值为True &#xff0c;然而现在如果问题发布时间为30天之后(未来时间)&#xff0c;也会返…

Prometheus+Grafana监控数据可视化

上一篇文章讲了prometheus的简单使用&#xff0c;这一篇就先跳过中间略显枯燥的内容&#xff0c;来到监控数据可视化。 一方面&#xff0c;可视化的界面看着更带劲&#xff0c;另一方面&#xff0c;也更方便我们直观的查看监控数据&#xff0c;方便后面的学习。 Grafana安装与…

如何使用 TortoiseGit(小乌龟)进行项目源代码的检出、添加与提交、代码推送与拉取

&#x1f600;前言 本文详细介绍如何使用 TortoiseGit&#xff08;小乌龟&#xff09;进行项目源代码的检出、文件的添加与提交、代码的推送与拉取&#xff0c; &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#…

准备并执行库存盘点

库存盘点 企业需要定期盘点其库存的原因有很多。 许多国家的法律要求公司对其物料库存进行库存盘点。库存盘点会检查公司财务报表中所显示的流动资产的物料库存。 由于内部原因&#xff0c;建立正确可用的库存数量是非常重要的。这也是“物料需求计划”的目标&#xff0c;例…

单位普通职工去世了,该单位工会领导参加她的追悼会是这样致辞的?

单位普通职工去世了&#xff0c;该单位工会领导参加她的追悼会是这样致辞的&#xff1f; 这是一篇单位工会领导参加本单位一位普通职工追悼会的致词 &#xff08;范文点评&#xff09; 各位来宾、各位亲朋好友&#xff1a; 今天&#xff0c;我们怀着十分沉痛的心情悼念襄阳农…

【高校科研前沿】加州理工学院Brendan Byrne等人在Nature 正刊发文:2023年加拿大野火的碳排放

论文名称&#xff1a;Carbon emissions from the 2023 Canadian wildfires&#xff08;2023年加拿大野火的碳排放&#xff09; 第一作者及单位&#xff1a;Brendan Byrne&#xff08;碳循环科学家|加州理工学院&#xff09; 通讯作者及单位&#xff1a;Brendan Byrne&#xf…

【C++ Primer Plus习题】7.4

问题: 解答: #include <iostream> using namespace std;long double probability(double num1, double num2, double picks) {long double result 1.0;for (int i num1;picks>0; i--,picks--){result result * (picks / i);}result * 1 / num2;return result; }in…

Shader笔记:光照与阴影1

引&#xff1a;旋转动画&#xff08;三角函数&#xff09; float3 rotationY(float3 vertex){float c cos(_Time.y*_Speed);float s sin(_Time.y*_Speed);float3x3 m {c,0,s,0,1,0,-s,0,c};return mul(m,vertex); } v2f vert (a2v v) {v2f o;o.pos UnityObjectToClipPos(r…