0 前言
在进行嵌入式开发的过程中,我们经常会见到对齐操作。这些对齐操作有些是为了便于实现指针操作,有些是为了加速对内存的访问。因此,学习如何使用对齐关键字是对于嵌入式开发是很有必要的。
1 对齐规则
1.0 什么叫做对齐
众所周知,内存的最小单位是字节。理论上,CPU可以访问内存上任意地址的数据,但实际上数据在内存中的分布并不是随意的,它们往往会遵循一定的对齐规则,使CPU访问这些数据的速度提升。
对齐实际上就是将变量存储的首地址按照1、2、4、8字节对齐,如果按照2字节对齐则变量在内存中的首地址必须是2的倍数,其它字节对齐方式也是如此。
1.1 默认的对齐方式
根据使用处理器、编译器的不同,变量在内存中的地址对齐方式不同。例如常见的STM32默认4字节对齐,本文使用的x64+vscode环境默认8字节对齐。
1.2 关键字#pragma pack(n)介绍
#pragma pack(n)
#pragma pack()
(1)#pragma pack(n):按照n字节对齐
(2)#pragma pack():取消自定义对齐方式,恢复默认对齐方式
1.3 结构体/联合体数据成员对齐规则
结构体/联合体数据的第1个成员后面的成员按照#pragma pack指定的对齐方式和成员占用字节大小进行处理,分为以下3种情况:
(1)成员占用字节大小比#pragma pack指定的字节对齐大小要小,按照成员字节占用大小对齐(去找到上一个成员占用内存区域之后首个满足要求的地址)
(2)成员占用字节大小比#pragma pack指定的字节对齐大小要大,按照#pragma pack指定的字节对齐大小对齐(去找到上一个成员占用内存区域之后首个满足要求的地址)
(3)成员占用字节大小和#pragma pack指定的字节对齐大小一致,按照#pragma pack指定的字节对齐大小对齐(去找到上一个成员占用内存区域之后首个满足要求的地址)
1.4 结构体/联合体自身对齐规则
前面我们了解到了结构体/联合体数据成员对齐规则,为了保证结构体所有成员在内存上的分布都是符合对齐原则的,我们必须也要设置结构体/联合体的首地址到合适的值。规则如下:
(1)最大的成员占用字节大小比#pragma pack指定的字节对齐大小要小,按照最大的成员占用字节大小对齐
(2)最大的成员占用字节大小比#pragma pack指定的字节对齐大小要大,按照#pragma pack占指定的字节大小对齐
(3)最大的成员占用字节大小和#pragma pack指定的字节对齐大小一致,按照#pragma pack占指定的字节大小对齐
按照上述方法操作后,结合1.3的数据成员对齐规则,我们很容易实现每个成员在内存中按照指定的对齐方式实现对齐。
2 实例测试
2.1 结构体成员默认的对齐方式
测试说明:
这里使用的是64位电脑,经过vscode后默认的对齐方式为按8字节对齐。
示例程序:
#include "stdio.h"
typedef struct
{
unsigned char a;
unsigned short int b;
unsigned int c;
double d;
} test_t;
test_t test;
int main(void)
{
printf("a addr : 0x%x\r\n", &test.a);
printf("b addr : 0x%x\r\n", &test.b);
printf("c addr : 0x%x\r\n", &test.c);
printf("d addr : 0x%x\r\n", &test.d);
return 0;
}
我们这里定义了1个名为test_t的结构体,成员a、b、c、d的大小分别为1、2、4、8字节。在不做任何对齐操作下,打印a、b、c、d在内存上的地址:
可以看到,成员在结构体的分布对齐方式分别是1、2、4、8字节,同时结构体首地址也就是成员a的地址是按照8字节对齐的。它们在内存中的分布可以用如下示意图表示:
2.2 设置结构体成员按照1字节对齐
测试说明:
这里使用的是64位电脑,经过vscode后默认的对齐方式为按8字节对齐。
示例程序:
#include "stdio.h"
#pragma pack(1)
typedef struct
{
unsigned char a;
unsigned short int b;
unsigned int c;
double d;
} test_t;
test_t test;
#pragma pack()
int main(void)
{
printf("a addr : 0x%x\r\n", &test.a);
printf("b addr : 0x%x\r\n", &test.b);
printf("c addr : 0x%x\r\n", &test.c);
printf("d addr : 0x%x\r\n", &test.d);
return 0;
}
我们这里定义了1个名为test_t的结构体,成员a、b、c、d的大小分别为1、2、4、8字节。在按照1字节对齐之后,打印a、b、c、d在内存上的地址:
可以看到,成员在结构体的分布对齐方式是1字节,同时结构体首地址也就是成员a的地址是按照1字节对齐的。可以用如下的示意图表示使用#pragma pack()前后结构体成员在内存中的分布: