CPU字长
字长的概念指的是处理器在一条指令中的数据处理能力,当然这个能力还需要搭配操作系统的设定,比如常见的32位系统、64位系统,指的是在此系统环境下,处理器一次存储处理的数据可以达32位或64位。
地址对齐
当计算机系统的CPU字长确定后,就意味着每次CPU从内存中读取或写入数据时都会以固定的边界进行操作。以32位系统为例,这意味着CPU每次操作都会以4字节(32位)为单位。
如果所需数据恰好在这个4字节的边界上,我们称其为地址对齐的。这样的数据读取或写入会更高效,因为CPU可以直接按照这个边界进行操作。
而如果数据跨越了这个边界,使用了超过所需单元的字节,我们称其为地址未对齐的。这会导致额外的处理工作,可能会降低效率,并且在某些系统上可能会导致错误或异常。
地址对齐是一种优化技术,有助于提高系统的性能和稳定性。
地址未对齐的情形 地址已对齐的情形
从图中可以明显看出,数据本身占据了8个字节,在地址未对齐的情况下,CPU需要分3次才能完整地存取完这个数据,但是在地址对齐的情况下,CPU可以分2次就能完整地存取这个数据。
总结:
如果一个数据满足以最小单元数存放在内存中,则称它地址是对齐的,否则是未对齐的。地址对齐的含义用大白话说就是1个单元能塞得下的就不用2个;2个单元能塞得下的就不用3个。
如果发生数据地址未对齐的情况,有些系统会直接罢工,有些系统则降低性能。
普通变量的m值
以32位系统为例,由于CPU存取数据总是以4字节为单元,因此对于一个尺寸固定的数据而言,当它的地址满足某个数的整数倍时,就可以保证地址对齐。这个数就被称为变量的m值。
根据具体系统的字长,和数据本身的尺寸,m值是可以很简单计算出来的。
- 举例 ( 注意,变量的m值跟变量本身的尺寸有关,但它们是两个不同的概念)
char c; // 由于c占1个字节,因此c不管放哪里地址都是对齐的,因此m=1
short s; // 由于s占2个字节,因此s地址只要是偶数就是对齐的,因此m=2
int i; // 由于i占4个字节,因此只要i地址满足4的倍数就是对齐的,因此m=4
double f; // 由于f占8个字节,因此只要f地址满足4的倍数就是对齐的,因此m=4
printf("%p\n", &c); // &c = 1*N,即:c的地址一定满足1的整数倍
printf("%p\n", &s); // &s = 2*N,即:s的地址一定满足2的整数倍
printf("%p\n", &i); // &i = 4*N,即:i的地址一定满足4的整数倍
printf("%p\n", &f); // &f = 4*N,即:f的地址一定满足4的整数倍
- 手工干预变量的m值:
char c __attribute__((aligned(32))); // 将变量 c 的m值设置为32
- 语法:
- attribute 机制是GNU特定语法,属于C语言标准语法的扩展。
- attribute 前后都是双下划线,aligned两边是双圆括号。
- attribute 语句,出现在变量定义语句中的分号前面,变量标识符后面。
- attribute 机制支持多种属性设置,其中 aligned 用来设置变量的 m 值属性。
- 一个变量的 m 值只能提升,不能降低,且只能为正的2的n次幂。
结构体的M值
- 概念:
- 结构体的M值,取决于其成员的m值的最大值。即:M = max{m1, m2, m3, …};
- 结构体的和地址和尺寸,都必须等于M值的整数倍。
- 示例:
struct node
{
short a; // 尺寸=2,m值=2
double b; // 尺寸=8,m值=4
char c; // 尺寸=1,m值=1
};
struct node n; // M值 = max{2, 4, 1} = 4;
- 以上结构体成员存储分析:
- 结构体的M值是4,这意味着结构体的地址和尺寸都必须是4的倍数。
- 成员a的M值是2,但由于它是结构体的首元素,必须满足结构体的M值约束,所以a的地址必须是4的倍数。
- 成员b的M值是4,所以在a和b之间需要填充2个字节的无效数据(通常是0),以保证b的地址是4的倍数。
- 成员c的M值是1,它直接紧挨在b的后面,占据一个字节的空间。
- 为了让结构体的尺寸满足4的倍数,c后面还需要填充3个字节的无效数据。
- 以上结构体成员图解分析:
结构体成员布局
可移植性
可移植指的是相同的一段数据或者代码,在不同的平台中都可以成功运行。
- 对于数据来说,有两方面可能会导致不可移植:
- 数据尺寸发生变化
- 数据位置发生变化
- 第一个问题,是基本的数据类型在不同的系统所占据的字节数不同造成的,解决办法如下
使用可移植性数据类型来解决基本数据类型在不同系统中占据的字节数不同的问题。可移植性数据类型是指具有固定大小的数据类型,无论在何种平台上都具有相同的大小。在C语言中,可以使用<stdint.h>
头文件中定义的标准整数类型来实现可移植性。这些类型包括int8_t
、int16_t
、int32_t
、int64_t
等,它们分别表示有符号整数类型,且确保在任何平台上都有固定的字节数。
示例:
#include <stdint.h>
int8_t // 有符号8位整数
int16_t // 有符号16位整数
int32_t // 有符号32位整数
int64_t // 有符号64位整数
- 第二个问题,即数据位置的可移植性,可以通过使用特定的编译指令或者技术来解决
解决这个问题的两种方法如下:
- 第一种方法是通过使用编译器提供的特性,固定每个成员的对齐方式,从而固定成员之间的间隔,确保结构体在不同平台上的布局一致。在这个例子中,通过使用`__attribute__((aligned(n)))`,指定每个成员的对齐方式,其中`n`为对齐值。这样,每个成员之间的间隔就是固定的。
struct node { int8_t a __attribute__((aligned(1))); // 将 m 值固定为1 int64_t b __attribute__((aligned(8))); // 将 m 值固定为8 int16_t c __attribute__((aligned(2))); // 将 m 值固定为2 };
- 第二种方法是使用`__attribute__((packed))`属性,这会告诉编译器不要在结构体成员之间插入任何填充字节,从而让结构体的布局更加紧凑。这种方法会减少内存的浪费,但可能会降低访问效率,因为访问未对齐的数据可能会导致性能损失。
struct node
{
int8_t a;
int64_t b;
int16_t c;
} __attribute__((packed));
无论使用哪种方法,都可以确保结构体在不同平台上的布局一致,从而提高了数据的可移植性。