聚合数据类型(aggregate data type)能够同时存储一个以上的单独数据。C提供了两种类型的聚合数据类型:数组和结构。
数组是相同类型的元素的集合,它的每个元素是通过下标引用或指针间接访问来选择的。
结构也是一些值的集合,这些值称为它的成员(member),但一个结构的各个成员可能具有不同的类型。结构和Pascal或Modula中的记录(record)非常相似。
数组元素可以通过下标访问,这只是因为数组的元素长度相同。但是,在结构中情况并非如此。由于一个结构的成员可能长度不同,因此不能使用下标来访问它们。相反,每个结构成员都有自己的名字,它们是通过名字访问的。
这个区别非常重要。结构并不是一个它自身成员的数组。和数组名不同,当一个结构变量在表达式中使用时,它并不被替换成一个指针。结构变量也无法使用下标来选择特定的成员。
结构变量属于标量类型,所以可以像对待其他标量类型那样执行相同类型的操作。结构也可以作为传递给函数的参数,它们也可以作为返回值从函数返回;相同类型的结构变量相互之间可以赋值。可以声明指向结构的指针,取一个结构变量的地址,也可以声明结构数组。但是,在讨论这些话题之前,我们必须知道一些更为基础的东西。
结构声明
在声明结构时,必须列出它包含的所有成员。这个列表包括每个成员的类型和名字。
struct tag { member-list } variable-list ;
这里有几个例子。
这个声明创建了一个名叫x的变量,它包含3个成员:一个整数、一个字符和一个浮点数。
这个声明创建了y和z。y是一个数组,它包含了20个结构。z是一个指针,它指向这个类型的结构。
这两个声明被编译器当作两种截然不同的类型,即使它们的成员列表完全相同。因此,变量y和z的类型与x的类型不同,所以下面这条语句是非法的。
z = &x;
这是不是意味着某种特定类型的所有结构都必须使用一个单独的声明来创建呢?
幸运的是,事实并非如此。标签(tag)字段允许为成员列表提供一个名字,这样它就可以在后续的声明中使用。标签允许多个声明使用同一个成员列表,并且创建同一种类型的结构。这里有个例子:
这个声明把标签SIMPLE和这个成员列表联系在一起。该声明并没有提供变量列表,所以它并未创建任何变量。
这个声明类似于制造一个甜饼切割器。甜饼切割器决定了做出来的甜饼的形状,但其本身却不是甜饼。标签标识了一种模式,用于声明未来的变量,但无论是标签还是模式,其本身都不是变量。
struct SIMPLE x; struct SIMPLE y[20], *z;
这些声明使用标签来创建变量。它们创建和最初两个例子一样的变量,但存在一个重要的区别——现在x、y和z都是同一种类型的结构变量。
声明结构时可以使用的另一种良好技巧是用typedef创建一种新的类型,如下面的例子所示:
这个技巧和声明一个结构标签的效果几乎相同。区别在于Simple现在是个类型名而不是个结构标签,所以后续的声明可能像下面这个样子:
Simple x; Simple y[20], *z;
如果想在多个源文件中使用同一种类型的结构,就应该把标签声明或typedef形式的声明放在一个头文件中。如果源文件需要这个声明,可以使用#include指令把那个头文件包含进来。
批注:比上课讲的会更好理解些吧。
结构成员
到目前为止的例子里,只使用了简单类型的结构成员,但可以在一个结构外部声明的任何变量都可以作为结构的成员。尤其是,结构成员可以是标量、数组、指针甚至是其他结构。
这里有一个更为复杂的例子:
一个结构的成员的名字可以和其他结构的成员的名字相同,所以这个结构的成员a并不会与struct SIMPLE s的成员a冲突。正如接下去看到的那样,成员的访问方式允许指定任何一个成员而不至于产生歧义。
结构成员的直接访问
结构变量的成员是通过点操作符(.)访问的。点操作符接受两个操作数:左操作数就是结构变量的名字;右操作数就是需要访问的成员的名字。这个表达式的结果就是指定的成员。例如,考虑下面这个声明:
struct COMPLEX comp;
名字为a的成员是一个数组,所以表达式comp.a就选择了这个成员。这个表达式的结果是个数组名,所以可以把它用在任何可以使用数组名的地方。类似地,成员s是个结构,所以表达式comp.s的结果是个结构名,它可以用于任何可以使用普通结构变量的地方。尤其是,我们可以把这个表达式用作另一个点操作符的左操作符,如(comp.s).a,用来选择结构comp的成员s(也是一个结构)的成员a。点操作符的结合性是从左向右,所以可以省略括号,表达式comp.s.a表示同样的意思。
这里有一个更为复杂的例子。成员sa是一个结构数组,所以comp.sa是一个数组名,它的值是一个指针常量。对这个表达式使用下标引用操作,如(comp.sa)[4]将选择一个数组元素。但这个元素本身是一个结构,所以可以使用另一个点操作符取得它的成员之一。下面就是一个这样的表达式:
( (comp.sa)[4] ).c
下标引用和点操作符具有相同的优先级,它们的结合性都是从左向右,所以可以省略所有的括号。下面的表达式和前面那个表达式是等效的。
comp.sa[4].c
结构成员的间接访问
如果你拥有一个指向结构的指针,该如何访问这个结构的成员呢?首先就是对指针执行间接访问操作,从而获得这个结构。然后再使用点操作符来访问它的成员。但是,点操作符的优先级高于间接访问操作符,所以必须在表达式中使用括号,确保间接访问首先执行。举个例子,假定一个函数的参数是个指向结构的指针,如下面的原型所示:
void func( struct COMPLEX *cp );
函数可以使用下面这个表达式来访问这个变量所指向的结构的成员f:
(*cp).f
对指针执行间接访问将访问结构,然后点操作符访问一个成员。
由于这个概念有点惹人厌,因此C语言提供了一个更为方便的操作符来完成这项工作——->操作符(也称箭头操作符)。和点操作符一样,箭头操作符接受两个操作数,但左操作数必须是一个指向结构的指针。箭头操作符对左操作数执行间接访问取得指针所指向的结构,然后和点操作符一样,根据右操作数选择一个指定的结构成员。但是,间接访问操作内建于箭头操作符中,所以不需要显式地执行间接访问或使用括号。这里有一些例子,它们像前面一样使用同一个指针。
cp->f cp->a cp->s
第1个表达式访问结构的浮点数成员,第2个表达式访问一个数组名,第3个表达式则访问一个结构。后文将给出为数众多的例子,可以帮助大家弄清如何访问结构成员。
结构的自引用
在一个结构内部包含一个类型为该结构本身的成员是否合法呢?这里有一个例子,可以说明这个想法:
这种类型的自引用是非法的,因为成员b是另一个完整的结构,其内部还将包含它自己的成员b。这第二个成员又是另一个完整的结构,它还将包括它自己的成员b。这样重复下去永无止境。这有点像永远不会终止的递归程序。但下面这个声明却是合法的,你能看出其中的区别吗?
这个声明和前面那个声明的区别在于b现在是一个指针而不是结构。编译器在结构的长度确定之前就已经知道指针的长度,所以这种类型的自引用是合法的。
如果你觉得一个结构内部包含一个指向该结构本身的指针有些奇怪,请记住它事实上所指向的是同一种类型的不同结构。更加高级的数据结构,如链表和树,都是用这种技巧实现的。每个结构指向链表的下一个元素或树的下一个分枝。
结构的初始化
结构的初始化方式和数组的初始化很相似。一个位于一对花括号内部、由逗号分隔的初始值列表可用于结构中各个成员的初始化。这些值根据结构成员列表的顺序写出。如果初始列表的值不够,剩余的结构成员将使用缺省值进行初始化。
结构中如果包含数组或结构成员,其初始化方式类似于多维数组的初始化。一个完整的聚合类型成员的初始值列表可以嵌套于结构的初始值列表内部。这里有一个例子: