专栏:C语言
个人主页:HaiFan.
专栏简介:本专栏主要更新一些C语言的基础知识,也会实现一些小游戏和通讯录,学时管理系统之类的,有兴趣的朋友可以关注一下。
结构体
- 前言
- 一、结构体
- 1.结构体类型的声明
- 2.结构体的自引用
- 3.结构体变量的定义和初始化
- 4.结构体内存对齐
- 3.1修改默认对齐数
- 5.结构体传参
- 二、位段
- 1.什么是位段
- 2.位段的内存分配
- 3.位段的跨平台问题
- 三、枚举
- 1.枚举类型的定义
- 2.枚举的优点
- 四、联合(共用体)
- 1.联合类型的定义
- 2.联合的特点
- 3.联合体大小的计算
前言
一、结构体
1.结构体类型的声明
结构体是什么?结构体就是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量。
struct tag//结构体的名字
{
member-list;//这是结构体的成员
}variable-list;//这就是结构体的声明
如描述运动和人数
struct sport
{
int run;//跑步
int soccer;//足球
int badminton;//羽毛球
char name[100];//姓名
};//分号不能丢
这里的run,soccer,badminton,name,都是成员变量
。
结构体中,有一个特殊的声明,就是在声明结构的时候,可以不完全声明。
如:
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
上面的结构体在声明的时候,省略了结构体的标签(tag),这种结构体被称为匿名结构体。
2.结构体的自引用
在一个结构体中包含一个类型为该结构本身的成员是否可以呢?
struct Node
{
int data;
struct Node next;
};
这样做,可行吗?
很显然不可行。那么正确的用法是是什么呢?
struct Node
{
int data;
struct Node* next;
};
在自引用中,若使用结构本身的成员,每次在调用结构体的时候,会发生嵌套,所以应该使用指针类型。指针就是地址,不会发生嵌套。
typedef struct
{
int data;
Node* next;
}Node;
typedef struct Node
{
int data;
struct Node* next;
}Node;
这两个代码,哪一个是合法的呢?答案是第二个,因为第一个结构体成员是Node* next;
在调用该next成员的时候,typedef还没有起到作用。
3.结构体变量的定义和初始化
有了结构体的成员,该如何定义变量?其实很简单。
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
这是定义结构体的两种方式。
结构体的初始化
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
这就是结构体的初始化。
struct Stu s;
scanf("%s %d",s.name, &s.age);
也可以通过自己输入,进行初始化。
4.结构体内存对齐
前面已经介绍了结构体的基本使用,那么如何计算结构体的大小呢?我们知道int4字节,char1字节,double8字节
,
struct Stu
{
char name[10];
int age;
double len;
float w;
long a;
long long c;
};
我们知道不同的数据类型占多少字节,那么这个结构体的大小是10+4+8+4+4+8=38吗?
很奇怪,结果并不是所有成员所占的字节数相加。下面为大家介绍:结构体的内存对齐,这是一个特别热门的考点。
结构体大小如何计算?
首先得掌握结构体的对齐规则:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。 VS中默认的值为8
- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整 体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
char占1个字节,int占4个字节,根据规则1,要先从偏移量为0的地址处开始。再根据规则2,找到int的倍数的位置开始对齐,然后在找最后一个c2的位置,除了0,其他数都是1的倍数,所以c2对齐到8的位置即可,现在结构体的大小为9,再根据规则3,结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍,所以要继续扩大,直到找到所有成员中最大对齐数的整数倍为止,也就是12.
struct S2
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S2));
这个结构体的大小是多少?
首先,double占8个字节,从0的位置开始对齐,后面的char占1个字节,对齐到double后面的位置即可,然后就是int占4个字节,先找到4的倍数的位置,开始对齐,然后看此时的大小是不是结构体成员中对齐数最大的数的倍数,如果是,则此时的大小就是结构体的大小,若不是,则继续对齐,直到找到结构体成员中对齐数最大的数的倍数为止。
此时算出来的大小为16,16是double 8的倍数,所以16就是该结构体的大小。
struct S2
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S2));//16
struct S3
{
char c1;
struct S2 s2;
double d;
};
printf("%d\n", sizeof(struct S3));
那么嵌套的结构体的大小是多少呢?
还是老规矩,先把c1对齐到0的位置处,然后根据规则4,先找到s2结构体里的最大对齐数,在找到该数的倍数处,开始对齐,注:这里就不是在对齐8个,而是对齐s2结构体的大小16个
,之后在对齐最后一个double d。
此时结构体的大小是31,但是并不满足规则3,继续对齐,最后结构体的大小就是32.
为什么存在内存对齐?
大部分的参考资料都是如是说的:
1.平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常。
2.性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。性能原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访 问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起。
3.1修改默认对齐数
之前我们见过#pragma
这个预处理命令,这里我们再次使用就可以改变我们的默认对其数。
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
}
结论: 结构在对齐方式不合适的时候,我么可以自己更改默认对齐数。
5.结构体传参
直接看代码:
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
上面的print1和print2哪一个更好?
答案是:print2.
原因:
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论: 结构体传参的时候,要传结构体的地址。
二、位段
1.什么是位段
位段的声明和结构是类似的,但有两个不同。
1.位段的成员必须是int,unsigned in,或者signed int。
2.位段成员名后边跟一个冒号和一个数字。
struct stu
{
int _people : 2;
int _run : 5;
int _go : 10;
};
stu就是一个位段类型。
那么位段stu的大小是多少呢?
printf("%d", sizeof(struct stu));
答案是4,为什么会是4呢?
int占4字节,32个bit位,而位段里面的2,5,10,表示的是占多少bit位,成员一占2个bit位,成员而占5个bit位,成员3占10个bit位,总共占17个bit位,没有超过int的大小,所以是四个字节。
struct stu
{
int _people : 2;
int _run : 5;
int _go : 10;
int _a : 30;
};
那么这个printf("%d", sizeof(struct stu));
是多少呢?
按照前面的分析方法,前三个成员总共占17个bit位,第四个成员占30个bit位,一个int是不够存放的,所以要在开辟一个空间,存放第四个成员,所以得到的结果是8.
2.位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
那么这些数值是如何在位段中进行内存分配的呢?
一共是8个字节。
先把10的补码写出来,00001010,因为a只要3个bit位,所以就发生了神奇的现象——截断,所谓截断,就是只把前三个bit位拿出,后面的全部不要。就得到了
在把12的补码写出来,00001100,在发生截断,只要前4个bit位,
在把3的补码写出,00000011,截断,只要前5个bit位,因为一个char已经无法满足继续存c截断之后的补码了,所以要开辟一个新空间来存放c。
同样,再按照相同的规则存放d,即可。int类型也是这样。
3.位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机
器会出问题。 - 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是
舍弃剩余的位还是利用,这是不确定的。
总结: 跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
三、枚举
什么是枚举,枚举就是遍历 ,比如一到十 一 一 列举出来。
只要是可以 一 一 列举出来的,都可以使用枚举。
1.枚举类型的定义
enum Sex
{
man,
woman
};
这就是枚举类型,{}中的内容是枚举的可能取值,也叫做枚举常量。
注:用逗号隔开,最后一个枚举常量后面没有符号
当然,这些取值都是有值的。
默认从0开始,每次都会递增1,当然在定义的时候也可以赋值。
enum Sex
{
man = 1,
woman = 4
};
2.枚举的优点
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
- 增加代码的可读性和可维护性
- 和#define定义的标识符比较枚举有类型检查,更加严谨。
- 防止了命名污染(封装)
- 便于调试
- 使用方便,一次可以定义多个常量
后面我会用枚举和动态内存来优化通讯录。
四、联合(共用体)
1.联合类型的定义
联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间。
union u
{
int a;
char b;
};
int main()
{
union u de;
printf("%d", sizeof(de));
return 0;
}
由此可见,a和b共用同一块空间。空间是数据类型最大的那一个。
2.联合的特点
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
3.联合体大小的计算
- 联合的大小至少是最大成员的大小。
- 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un1
{
char c[5];
int i;
};
int main()
{
printf("%d\n", sizeof(union Un1));
return 0;
}
最大成员的大小是c,占5个字节,这里面的最大对齐数是4字节,因为5不是4的倍数,所以要进行对齐,直到找到最大对齐数的整数倍的位置即可,也就是8.