hello,hello,各位小伙伴,本篇文章跟大家一起学习结构体,并跟大家一边做题一边进行学习和理解。感谢大家对我上一篇的支持,如有什么问题,还请多多指教!
如果本篇文章对你有帮助,还请各位点点赞!!!
话不多说,正题开始
关于结构体的地定义和初始化在操作符详解有详细讲解
所以本文章将会从继后面继续深入讲解,如果小伙伴忘记了可以先去回顾一下
1.匿名结构体
所谓匿名就是不显示名字,但这里的匿名有点不一样,是完全没有名字,看个例子:
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
但是匿名结构体只能使用一次,并且并且在创建变量时只能够像上述例子一样创建(毕竟没有名字):
匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用一次。
匿名结构体都没有名字(类型),那是不是所有匿名结构体的类型都一样啊?
按照上述例子,请看如下代码:
p = &x;
这样写合法吗?答案是:不!
编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。
2.结构体自引用
相比在学习结构体时会有小伙伴想,如果在结构体成员列表里引用结构体本身会怎样?
这就是结构体自引用,如:
struct Node
{
int data;
struct Node next;
};
但是再仔细想一下,这样写真的可以吗?这样写似乎在不断的创建结构体,永无止境了
没错,这样写是不行的,如果想引用结构体本身,并不一定要在结构体里创建结构体,我们学过的指针可以帮助我们访问结构体自身,正确写法应该是这样:
struct Node
{
int data;
struct Node* next;
};
再来看看如下代码:
typedef struct
{
int data;
Node* next;
}Node;
在结构体自引用时对匿名结构体重命名,这样写可行吗?
答案是否定的,正如上述例子,Node是匿名结构体重命名后的名字,但是上述代码在重命名之前就已经使用了Node,那么编译器就不认识这个Node,就会报错,解决这个问题的方案就是:定义结构体不要使用匿名结构体了
typedef struct Node
{
int data;
struct Node* next;
}Node;
关于结构体的基本使用就结束了,接下来就是如何计算结构体的大小了
3. 结构体的大小
int的大小为4个字节,short为2个字节....那么结构体呢?这就有点复杂了,我们一步一步来
3.1 对齐规则
首先我们要明白对齐规则:
1. 结构体的第⼀个成员对齐到和结构体变量起始位置偏移量为0的地址处
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的⼀个对齐数与该成员变量大小的较小值。
- VS 中默认的值为 8
- Linux中 gcc 没有默认对齐数,对齐数就是成员自身的大小
3. 结构体总大小为最大对齐数(结构体中每个成员变量都有⼀个对齐数,所有对齐数中最大的)的 整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最⼤对⻬数的整数倍处,结构 体的整体⼤大小就是所有最大对齐数(含嵌套结构体中成员的对⻬数)的整数倍。
干说难懂,上代码:
注意:这了所用的编译器为VS2022
struct S1
{
char c1;
int i;
char c2;
};
该结构体大小为多少呢?看图解:
好,我们再来看如下练习:
struct S2
{
char c1;
char c2;
int i;
};
该结构体大小为多少呢?看图解:
struct S3
{
double d;
char c;
int i;
};
该结构体大小为多少呢?看图解:
再来看如下练习:打印结果是什么呢?
struct S4
{
char c1;
struct S3 s3;
double d;
};
printf("%d\n", sizeof(struct S4));
答案是:32
3.2 为什么存在内存对齐?
⼤部分的参考资料都是这样说的:
1. 平台原因 (移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定 类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要 作两次内存访问;而对齐的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地 址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以 用⼀个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两 个8字节内存块中。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
3.2.1 如何节省空间?
我们来看看如下代码:
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
通过计算,这两个结构体虽然成员列表的内容相同,但是二者的大小并不一样,struct S2 比 struct S1更小,所以节省空间方法:
让占用空间小的成员尽量集中在⼀起
4. 修改默认对齐数
当结构体在对齐方式不合理时,我们可以自己更改默认对齐数
#pragma 这个预处理指令,可以改变编译器的默认对齐数
#include <stdio.h>
#pragma pack(1)//设置默认对⻬数为1
struct S
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的对⻬数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S));
return 0;
}
输出结果是:6
根据选取对齐数规则:对齐数 = 编译器默认的⼀个对齐数与该成员变量大小的较小值。
因为我们默认对齐数被修改成1,而1是最小的正整数,所以我们会一直以1作为对齐数
5. 结构体传参
传参我们有学过传值传参和传址传参两种方式,同样,结构体传参也有这两种方式,那么这两种有什么区别呢?哪种有会更好呢?看如下代码:
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
打印结果都一样,但是是否二者都一样呢?答案是否定的
上面的 print1 和 print2 函数哪个好些? 答案是:首选print2函数。
我们知道,传值传参中的形参,是实参的一份临时拷贝,而传址传参是直接访问该结构体地址,不需要再创建临时变量,所以速度上会比传值传参更快
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递⼀个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论: 结构体传参的时候,要传结构体的地址。
6. 结构体实现位段
注意:以下测试全部在VS2022环境下实现
6.1 什么是位段
位段的声明和结构是类似的,有两个不同:
1. 位段的成员必须是 int、unsigned int 或signed int ,在C99中位段成员的类型也可以 选择其他类型。
2. 位段的成员名后边有⼀个冒号和⼀个数字。
struct A
{
int a:2;
int b:5;
int c:10;
int d:30;
};
A就是⼀个位段类型。 那位段A所占内存的⼤⼩是多少?答案是:8字节
其实位段就是为了节省空间的,冒号后面的数字就是对应变量占多少个比特位
2+5+10+30 = 47,这么看来是不是非常节省空间,那是否就可以一无止境的节省?
那肯定不是,从答案是8字节就可以看出,并非是无止境的节省空间,47个比特位用6个字节即可,答案却是8字节,这和位段的内存分配有关
6.2 位段的内存分配
1. 位段的成员可以是 int unsigned int signed int 或者是 char 等类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的⽅式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使⽤位段。
第2点的意思就是:比如int 类型不够存储时,内存会以4个字节(int 类型占4个字节)来开辟新内存,当char 类型不够存储时,内存会以1个字节(char 类型占1个字节)开辟新空间,干说难懂,上代码:
就如上一题
struct A
{
int a:2;
int b:5;
int c:10;
int d:30;
};
好,我们来看一下练习:
struct A
{
char a:2;
char b:5;
char c:7;
char d:4;
};
那我们加点料:
struct S
{
char a:2;
char b:5;
char c:7;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
空间是如何开辟的?我们先分析一下:(VS2022环境下测试)
答案正确
6.3 位段的跨平台问题
1. int 位段被当成有符号数还是⽆符号数是不确定的。
2. 位段中最⼤位的数⽬不能确定。(16位机器最⼤16,32位机器最⼤32,写成27,在16位机器出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。(取决于编译器)
4. 当⼀个结构包含两个位段,第⼆个位段成员⽐较⼤,⽆法容纳于第⼀个位段剩余的位时,是舍弃剩余的位还是利⽤,这是不确定的。(取决于编译器)
总结: 跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在
6.4 位段的应用
下图是⽹络协议中,IP数据报的格式,我们可以看到其中很多的属性只需要⼏个bit位就能描述,这⾥ 使⽤位段,能够实现想要的效果,也节省了空间,这样⽹络传输的数据报⼤⼩也会较⼩⼀些,对⽹络 的畅通是有帮助的。
6.5 位段使用的注意事项
位段的⼏个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位 置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的。 所以不能对位段的成员使⽤&操作符,这样就不能使⽤scanf直接给位段的成员输⼊值,只能是先输⼊ 放在⼀个变量中,然后赋值给位段的成员。
举个例子:
#include<stdio.h>
struct S
{
char a:2;
char b:5;
char c:7;
char d:4;
}s;
int main()
{
scanf("%d",&s.c);//是错误的
//这才是正确写法
s.c = 10;
return 0;
}
好啦,本章对于结构体的学习就先到这里,如果有什么问题,还请指教指教,希望本篇文章能够对你有所帮助,我们下一篇见!!!
如你喜欢,点点赞就是对我的支持,感谢感谢!!!