目录
一.结构体基础知识
1. 结构体的特殊声明
2. 结构的自引用
3.结构体变量的定义和初始化
二.结构体内存对齐
1.关键概念:
2.计算示例
3.嵌套结构体的内存计算
4.结构体内存对齐的意义
5.定义结构体时的注意事项
6.修改默认对齐数
附:关于结构体传参:
三.结构体实现位段
1.位段的介绍
2.位段成员的内存分布:
3.位段的跨平台问题
一.结构体基础知识
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
结构体,联合体,枚举以及数组都是自定义类型;
struct tag { member-list; 成员定义; }variable-list; 变量定义;(定义类型的同时创建变量(全局变量))
1. 结构体的特殊声明
匿名结构体类型 struct { int a; char b; float c; }x; struct { int a; char b; float c; }a[20], *p;
上述结构体声明方式中省略了结构体的标识名,这种方式定义的结构体类型无法在后续的变量创建中使用,此种类型结构体的变量实例只能在该类型声明的同时创建。
同时注意:
在上面代码的基础上语句p = &x;是不合法的,编译器会认为代码段中两个结构体类型是不同的。
2. 结构的自引用
struct Node { int data; struct Node* next; };
在结构体内部定义指向本结构体类型的指针变量叫做结构的自引用。
用typedef定义的结构体类型:
typedef struct Node { int data; struct Node* next; }Node; 这里的Node不是创建的变量,而是重定义的类型名;
此时的struct Node类型名被typedef关键字声明为Node。
后续引用该类型时就只需用Node作为类型名即可,书写上方便了许多。
3.结构体变量的定义和初始化
struct Point { int x; int y; }p1; //声明类型的同时定义变量p1 struct Point p2; //定义结构体变量p2 struct Node { int data; struct Point p; struct Node* next; }n1 = {10, {4,5}, NULL}; 结构体嵌套初始化(定义类型的同时创建变量) struct Node n2 = {20, {5, 6}, NULL}; 结构体嵌套初始化(引用类型创建变量)
二.结构体内存对齐
一个结构体所占的内存大小的计算并不是简单地将其成员变量的大小直接相加,结构体内部成员在内存上的分布遵循内存对齐规则。
1.关键概念:
(1)结构体内部地址的偏移量:结构体内部某个地址的偏移量指的是结构体内存空间中某个字节的地址与结构体首地址的差值(以字节为单位)(结构体的内存中存储结构是从低地址向高地址排列的,与数组相同)。
(2)对齐数:结构体的每个成员都有自己的对齐数。
结构成员对齐数 = 编译器默认的一个对齐数 与 该成员大小(单位为字节)的较小值。
注意确认成员对齐数时,数组成员要视为多个内置类型成员来看待,不能将数组成员看做一个整体。比如char a[3]作为某个类型的结构体的成员,那么确认成员对齐数时要将其看成3个char类型的变量而不能将其看成一个整体。
(VS中默认的对齐数的值为8)
(注意Linux gcc环境下没有默认对齐数,结构成员对齐数就是成员自身所占的字节数)
结构体成员的内存对齐规则:
1.结构体第一个成员的地址的偏移量为0。(即第一个成员存储在结构体首地址处)
2.其他成员变量的地址的偏移量必须为该成员的对齐数的整数倍。
3.结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍基于以上规则,就可以计算一个结构体所占内存大小。
2.计算示例
结构体所占内存大小的计算示例:
计算该类型结构体所占内存大小 struct A { int a; short b; int c; char d; };
3.嵌套结构体的内存计算
如果有嵌套结构体的情况,那么作为另外一个结构体的成员的结构体,其对齐数为自身内部成员的对齐数中的最大对齐数。
结构体的整体大小就是所有成员的对齐数中的最大对齐数(含嵌套结构体的对齐数)的整数倍。
计算结构体S4所占内存的大小 struct S3 { double d; char c; int i; }; struct S4 { char c1; struct S3 s3; double d; };
4.结构体内存对齐的意义
1. 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处(比如在偏移量为某对齐数的整数倍的地址处)取某些特定类型的数据,否则抛出硬件异常。2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
比如如下情形:总体来说:
结构体的内存对齐是拿空间来换取时间的做法。是C语言的一种用于提高程序性能的内存管理机制。
5.定义结构体时的注意事项
基于结构体内存对齐规则:
定义结构体时,为了尽可能地节省空间,定义成员变量时应注意定义顺序:将相同类型的变量书写在一起。
比如 :
struct S1 { char c1; int i; char c2; }; struct S2 { char c1; char c2; int i; };
S1和S2类型的成员一模一样,但是S1类型结构体所占内存空间大小为12个字节,S2类型结构体所占内存空间为8个字节。显然S2的成员变量书写顺序更节省空间。
6.修改默认对齐数
编译器的默认对齐数是可以修改的:
利用指令:#pragma pack(填入对齐数的值)
就可以完成对齐数的修改。
比如:
#include <stdio.h> #pragma pack(8) 设置默认对齐数为8 struct S1 { char c1; int i; char c2; }; #pragma pack() 取消设置的默认对齐数,还原为默认值 (此时struct S1类型已经按照默认对齐数为8定义好了) #pragma pack(1) 设置默认对齐数为1 struct S2 { char c1; int i; char c2; }; #pragma pack() 取消设置的默认对齐数,还原为默认 (此时struct S1类型已经按照默认对齐数为8定义好了) 修改对齐数后 S1和S2的大小会有所差异 int main() { printf("%d\n", sizeof(struct S1)); printf("%d\n", sizeof(struct S2)); return 0; }
输出结果:
默认对齐数一般设置为2的N次方,不然内存对齐就没什么意义了(计算机读取数据的地址值的偏移量一般为2的整数倍数)。
附:关于结构体传参:
函数传参的时候,参数是需要压栈的,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结构体传参的时候,要传结构体的地址。
三.结构体实现位段
1.位段的介绍
1.位段的成员必须是 int、unsigned int 或signed int (或者其他整形家族的数据)。
2.位段的成员名后边有一个冒号和一个数字。比如:
struct A { int _a:2; int _b:5; int _c:10; int _d:30; };
位段成员后面的冒号后的数字表示该位段成员在内存中所占的二进制位数(bits)。
其存在意义是可以根据实际需要定义成员变量的bit位数,可以节省系统的空间开销。
2.位段成员的内存分布:
为位段成员开辟内存空间时,是根据成员的类型一段一段空间去开辟的,比如上面的struct A, _a成员为int类型,该位段开辟内存时会先向系统申请4个字节(32bit)的空间,将_a,_b,_c都存入这四个字节的空间中,由于这4个字节无法再存下_d,所以需要再申请4个字节来存放30bit的成员 _d.
位段成员内存分布示例:
struct S { char a:3; char b:4; char c:5; char d:4; }; int main () { struct S s = {0}; s.a = 10; s.b = 12; s.c = 3; s.d = 4; return 0; }
完成结构体位段s的成员赋值后,其内存分布:
也就是说在单个字节内部,位段成员的二进制序列是按照低位向高位的顺序存储的(单字节内,位段成员在内存中的二进制序列和位段成员数值的二进制序列看起来是一致的)。
注意对于多字节的位段成员,其字节序遵循系统大小端排列原则。
(图中为windows vs2022环境,字节序为小端存储)
3.位段的跨平台问题
不同的操作系统中,位段的实现会有差异:
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题.)
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的.所以跨平台程序一般不使用位段。