基本概念和术语
数据是对客观信息的一种描述,它是由能被计算机识别与处理的数值、字符等符号构成的集合。
数据元素是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。
关键码值的是数据元素中能起标识作用的数据项。
关系指的是集合中元素之间的某种相关性。在集合中的元素之间可能存在一种或多种关系。
数据结构
若在特性相同的数据元素之间存在一种或多种特定的关系,则称该数据元素的集合为“数据结构”。换句话说,数据结构是带“结构”的数据元素的集合。在此,“结构”指的就是数据元素之间存在的关系。
数据结构包括(数据)逻辑结构和(数据)物理结构两个层次。数据的逻辑结构是对数据元素之间存在的逻辑关系的一种抽象描述,它可以用一个数据元素的集合和定义在此集合上的若干关系来表示;数据的物理结构则为其逻辑结构在计算机中的表示或实现,故又可称为存储结构。
按照数据元素之间存在的逻辑关系的不同数学特性,通常有下列4类数据结构:
⑴纯集合结构。该结构的数据元素间的关系是“属于同一个集合”,除此之外别无其他关系。
⑵线性结构。该结构的数据元素之间存在着一对一的关系。
⑶树型结构。该结构的数据元素之间存在着一对多的关系。
⑷图状或网状结构。该结构的数据元素之间存在着多对多的关系。
与逻辑结构相对应,存储结构包括数据元素的表示和关系的表示两个方面。其中,表示关系有两种不同方法,相应得到两类存储结构:
一种是利用数据元素在存储器中相对位置之间的某种特定关系来表示数据元素之间的逻辑关系,称为顺序存储结构;另一种是用附加的“指针”表示数据元素之间的逻辑关系,称为链式存储结构。
数据类型和抽象数据类型
抽象数据类型(Abstract Data Type ,简称ADT):一个数据结构加上定义在这个数据结构上的一组操作。例如,“整数”是一个抽象数据类型,其数学特性和具体的计算机或语言无关。“抽象”的意义在于强调数据类型的数学特性。
数据类型:是一个值的集合和定义在此集合上的一组操作的总称。例如, C语言中的整型变量,其值为某个区间上的整数(依赖于机器),定义在其上的操作为加、减、乘、除和取模等算术运算。
抽象数据类型和数据类型实质上是一个概念, 只是抽象数据类型的范围更广, 除了已有的数据类型外,抽象数据类型还包括用户在设计软件系统时自己定义的数据类型。
ADT的定义取决于它的一组逻辑特性,与其在计算机内的表示和实现无关。因此,不论 ADT的内部结构如何变化,只要其数学特性不变,都不影响其外部的使用。
抽象数据类型的最重要的特点是抽象和信息隐蔽。抽象的本质是抽取反映问题本质的东西,忽略非本质的细节,从而使所设计的数据结构更具有一般性,可以解决一类问题。信息隐蔽就是对用户隐蔽数据存储和操作实现的细节,使用者仅需了解抽象操作,或界面服务,通过界面中的服务来访问这些数据。
一个含抽象数据类型的软件模块通常应包含定义、表示和实现三部分。