目录
1. 关联式容器
2. 键值对
3. 树形结构的关联式容器
3.1 set
3.2 map
3.3 multiset
3.4 multimap
4.底层结构
4.3红黑树与AVL树的比较
1. 关联式容器
前面我们已经接触过
STL
中的部分容器,比如:
vector
、
list
、
deque、
forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?
关联式容器
也是用来存储数据的,与序列式容器不同的是,其
里面存储的是
<key, value>
结构的
键值对,在数据检索时比序列式容器效率更高
。
2. 键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量
key
和
value
,
key
代
表键值,
value
表示与
key
对应的信息
。比如:现在要建立一个英汉互译的字典,那该字典中必然
有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应
该单词,在词典中就可以找到与其对应的中文含义。
3. 树形结构的关联式容器
根据应用场景的不桶,
STL
总共实现了两种不同结构的管理式容器:树型结构与哈希结构。
树型结
构的关联式容器主要有四种:
map
、
set
、
multimap
、
multiset
。这四种容器的共同点是:使
用平衡搜索树
(
即红黑树
)
作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一
个容器。
3.1 set
set - C++ Reference
3.1.1 set
的介绍
1. set
是按照一定次序存储元素的容器
2.
在
set
中,元素的
value
也标识它
(value
就是
key
,类型为
T)
,并且每个
value
必须是唯一的。
set
中的元素不能在容器中修改
(
元素总是
const)
,但是可以从容器中插入或删除它们。
3.
在内部,
set
中的元素总是按照其内部比较对象
(
类型比较
)
所指示的特定严格弱排序准则进行
排序。
4. set
容器通过
key
访问单个元素的速度通常比
unordered_set
容器慢,但它们允许根据顺序对
子集进行直接迭代。
5. set
在底层是用二叉搜索树
(
红黑树
)
实现的。
注意:
1.
与
map/multimap
不同,
map/multimap
中存储的是真正的键值对
<key, value>
,
set
中只放
value
,但在底层实际存放的是由
<value, value>
构成的键值对。
2. set
中插入元素时,只需要插入
value
即可,不需要构造键值对。
3. set
中的元素不可以重复
(
因此可以使用
set
进行去重
)
。
4.
使用
set
的迭代器遍历
set
中的元素,可以得到有序序列
5. set
中的元素默认按照小于来比较
6. set
中查找某个元素,时间复杂度为:
$log_2 n$
3.2 map
3.2.1 map
的介绍
map - C++ Reference
1. map
是关联容器,它按照特定的次序
(
按照
key
来比较
)
存储由键值
key
和值
value
组合而成的元
素。
2.
在
map
中,键值
key
通常用于排序和惟一地标识元素,而值
value
中存储与此键值
key
关联的
内容。键值
key
和值
value
的类型可能不同,并且在
map
的内部,
key
与
value
通过成员类型
value_type
绑定在一起,为其取别名称为
pair:
typedef pair<const key, T> value_type;
3.
在内部,
map
中的元素总是按照键值
key
进行比较排序的。
4. map
中通过键值访问单个元素的速度通常比
unordered_map
容器慢,但
map
允许根据顺序
对元素进行直接迭代
(
即对
map
中的元素进行迭代时,可以得到一个有序的序列
)
。
5. map
支持下标访问符,即在
[]
中放入
key
,就可以找到与
key
对应的
value
。
6. map
通常被实现为二叉搜索树
(
更准确的说:平衡二叉搜索树
(
红黑树
))
。
3.3 multiset
3.3.1 multiset
的介绍
multiset - C++ Reference
1. multiset
是按照特定顺序存储元素的容器,其中元素是可以重复的。
2.
在
multiset
中,元素的
value
也会识别它
(
因为
multiset
中本身存储的就是
<value, value>
组成
的键值对,因此
value
本身就是
key
,
key
就是
value
,类型为
T). multiset
元素的值不能在容器
中进行修改
(
因为元素总是
const
的
)
,但可以从容器中插入或删除。
3.
在内部,
multiset
中的元素总是按照其内部比较规则
(
类型比较
)
所指示的特定严格弱排序准则
进行排序。
4. multiset
容器通过
key
访问单个元素的速度通常比
unordered_multiset
容器慢,但当使用迭
代器遍历时会得到一个有序序列。
5. multiset
底层结构为二叉搜索树
(
红黑树
)
。
注意:
1. multiset
中再底层中存储的是
<value, value>
的键值对
2. mtltiset
的插入接口中只需要插入即可
3.
与
set
的区别是,
multiset
中的元素可以重复,
set
是中
value
是唯一的
4.
使用迭代器对
multiset
中的元素进行遍历,可以得到有序的序列
5. multiset
中的元素不能修改
6.
在
multiset
中找某个元素,时间复杂度为
$O(log_2 N)$
7. multiset
的作用:可以对元素进行排序
3.4 multimap
3.4.1 multimap
的介绍
multimap - C++ Reference
1. Multimaps
是关联式容器,它按照特定的顺序,存储由
key
和
value
映射成的键值对
<key,
value>
,其中多个键值对之间的
key
是可以重复的。
2.
在
multimap
中,通常按照
key
排序和惟一地标识元素,而映射的
value
存储与
key
关联的内
容。
key
和
value
的类型可能不同,通过
multimap
内部的成员类型
value_type
组合在一起,
value_type
是组合
key
和
value
的键值对
:
typedef pair<const Key, T> value_type
;
3.
在内部,
multimap
中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对
key
进行排序的。
4. multimap
通过
key
访问单个元素的速度通常比
unordered_multimap
容器慢,但是使用迭代
器直接遍历
multimap
中的元素可以得到关于
key
有序的序列。
5. multimap
在底层用二叉搜索树
(
红黑树
)
来实现。
注意:
multimap
和
map
的唯一不同就是:
map
中的
key
是唯一的,而
multimap
中
key
是可以
重复的
。
4.底层结构
前面对
map/multimap/set/multiset
进行了简单的介绍,在其文档介绍中发现,这几个容器有个
共同点是:
其底层都是按照二叉搜索树来实现的
,但是二叉搜索树有其自身的缺陷,假如往树中
插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成
O(N)
,因此
map
、
set
等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。
4.1 AVL
树
4.1.1 AVL
树的概念
二叉搜索树虽可以缩短查找的效率,但
如果数据有序或接近有序二叉搜索树将退化为单支树,查
找元素相当于在顺序表中搜索元素,效率低下
。因此,两位俄罗斯的数学家
G.M.Adelson-Velskii
和
E.M.Landis
在
1962
年
发明了一种解决上述问题的方法:
当向二叉搜索树中插入新结点后,如果能保证每个结点的左右
子树高度之差的绝对值不超过
1(
需要对树中的结点进行调整
)
,即可降低树的高度,从而减少平均
搜索长度。
一棵
AVL
树或者是空树,或者是具有以下性质的二叉搜索树:
它的左右子树都是
AVL
树
左右子树高度之差
(
简称平衡因子
)
的绝对值不超过
1(-1/0/1)
如果一棵二叉搜索树是高度平衡的,它就是
AVL
树。如果它有
n
个结点,其高度可保持在
$O(log_2 n)$
,搜索时间复杂度
O($log_2 n$)
。
4.2
红黑树
4.2.1
红黑树的概念
红黑树
,是一种
二叉搜索树
,但
在每个结点上增加一个存储位表示结点的颜色,可以是
Red
或
Black
。 通过对
任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路
径会比其他路径长出俩倍
,因而是
接近平衡
的。
4.2.2
红黑树的性质
1.
每个结点不是红色就是黑色
2.
根节点是黑色的
3.
如果一个节点是红色的,则它的两个孩子结点是黑色的
4.
对于每个结点,从该结点到其所有后代叶结点的简单路径上,均 包含相同数目的黑色结点
5.
每个叶子结点都是黑色的
(
此处的叶子结点指的是空结点
)
4.3红黑树与AVL树的比较
红黑树和
AVL
树都是高效的平衡二叉树,增删改查的时间复杂度都是
O($log_2 N$)
,红黑树不追
求绝对平衡,其只需保证最长路径不超过最短路径的
2
倍,相对而言,降低了插入和旋转的次数,
所以在经常进行增删的结构中性能比
AVL
树更优,而且红黑树实现比较简单,所以实际运用中红
黑树更多。