在接触了诸如二叉搜索树、AVL树、红黑树的树形结构之后,我们对树的结构有了大致的了解,现在引入真正的关联式容器。
首先,先明确了关联式容器的概念。我们之前所接触到的如vector、list等容器,我们知道他们实际上都是线性的数据结构,因此也称之为序列式容器。而关联式容器也是存储数据用,只是其特别的<key,value>键值对的元素结构使得在数据检索方面的效率得到了很大的提升。
STL中提供的关联式容器可以分为两类:树形结构和哈希结构。哈希结构我们会在后文再叙述。树形结构中关联式容器主要有:set、map、multiset、multimap四种,其底层都是红黑树。
4. set与multiset的用法
4.1 set的特征
set实际上就是我们之前介绍的K模型,下面给出一些set特征的汇总:
①容器中存储的元素只有一个值,这个值既是其value又是标识它的key,不允许重复元素;
②set的元素只允许插入或删除操作,不允许修改(元素类型是const);
③set的底层是红黑树,所以其底层实际存放的是<value,value>的键值对,但在插入删除时只需要给出value即可。其查找元素时间复杂度是logN。
4.2 set的接口
4.2.1 set的模板参数
模板参数中包含:
key——set中存放的数据类型;
Compare——比较逻辑的仿函数,缺省值是less小于比较,形成左树小,右树大的结构。
4.2.2 set构造函数
(1)默认构造;
(2)迭代区间(first,last)构造;
(3)拷贝构造。
4.2.3 set迭代器
iterator begin()——返回set中起始位置元素的迭代器
iterator end()——返回set中最后一个元素后面的迭代器
const_iterator cbegin() const ——返回set中起始位置元素的const迭代器
const_iterator cend() const ——返回set中最后一个元素后面的const迭代器
reverse_iterator rbegin() ——返回set第一个元素的反向迭代器,即end
reverse_iterator rend() ——返回set最后一个元素下一个位置的反向迭代器, 即begin
const_reverse_iterator crbegin() const ——返回set第一个元素的反向const迭代器,即cend
const_reverse_iterator crend() const ——返回set最后一个元素下一个位置的反向const迭代器,即cbegin
4.2.4 set的其他函数
①empty
检测set是否为空,空返回true,否则返回true。
②size
返回set中有效元素的个数。
③insert
(1)单元素:在set中插入元素val,实际插入的是<val, val>构成的键值对,如果插入成功,返回<该元素在set中的位置,true>;如果插入失败,说明val在set中已经存在,返回<val在set中的位置,false>。
(2)范围插入。
④erase
(1)删除set中position位置上的元素。
(2)删除set中值为val的元素,返回删除的元素的个数。
(3)删除set中[first, last)区间中的元素。
⑤swap
交换两个set。
⑥clear
将set中的元素清空。
⑦find
返回set中值为val的元素的位置。
⑧count
返回set中值为val的元素的个数。
4.3 multiset
multiset的接口使用方法和set完全一致,其唯一不同就是允许存储重复元素。
5. map的用法
5.1 map的特征
map和set有一定的相似性,运用到的是KV模型,下面是mapt特征的汇总:
①容器中存储的元素有两个值,一个是标识它的key,一个是表示其值的value。不允许出现相同key的元素,而不同key允许value相同。
②map的元素key不可以被修改,但是其对应的value允许修改,可通过[]操作符进行新增或修改操作。
③map的底层是红黑树,其底层存放的是<key,value>的键值对。查找元素时间复杂度是logN。
5.2 map的接口
5.2.1 map的模板参数
模板参数中包含:
key——map中存放的键值对的key的类型;
T——map中存放的键值对的value的类型;
Compare——比较逻辑的仿函数,缺省值是less小于比较,形成左树小,右树大的结构。
5.2.2 map构造函数
(1)默认构造;
(2)迭代区间(first,last)构造;
(3)拷贝构造。
5.2.3 map迭代器
iterator begin()——返回set中起始位置元素的迭代器
iterator end()——返回set中最后一个元素后面的迭代器
const_iterator cbegin() const ——返回set中起始位置元素的const迭代器
const_iterator cend() const ——返回set中最后一个元素后面的const迭代器
reverse_iterator rbegin() ——返回set第一个元素的反向迭代器,即end
reverse_iterator rend() ——返回set最后一个元素下一个位置的反向迭代器, 即begin
const_reverse_iterator crbegin() const ——返回set第一个元素的反向const迭代器,即cend
const_reverse_iterator crend() const ——返回set最后一个元素下一个位置的反向const迭代器,即cbegin
5.2.4 map的其他函数
①empty
检测map是否为空,空返回true,否则返回true。
②size
返回map中有效元素的个数。
③insert
(1)单元素:在map中插入键值对元素val,如果插入成功,返回<该元素在map中的位置,true>;如果插入失败,说明在map中已经存在,返回<val在map中的位置,false>。
(2)范围插入。
④erase
(1)删除map中position位置上的元素。
(2)删除map中key为k的元素,返回删除的元素的个数。
(3)删除map中[first, last)区间中的元素。
⑤swap
交换两个map。
⑥clear
将map中的元素清空。
⑦find
返回map中key为k的元素的位置。
⑧count
返回map中key为k的元素的个数。
⑨[]操作符
[]操作符通过给定的key值找到其对应的value值,返回的是value值(即键值对第二个成员)的引用,因此[]既可以用于访问key对应的value,也可以用于修改对应的value值。
5.3 multimap
multimap的接口使用方法和map完全一致,其唯一不同也是允许存储重复元素。
6.set和map的模拟实现
6.1 红黑树的接口改造
因为set和map的底层都是红黑树,所以我们首先需要对之前写过的红黑树进行改造。
6.1.1 红黑树的结点
红黑树结点为了同时适用于set和map,因此模板参数使用一个T来表示。当set使用时,T就是一个规定的类型;当map使用时,T就是一个pair类型的键值对。
enum color {
RED,
BLACK
};
//红黑树的结点
//由于不确定所适配的是什么容器(set是K,map是KV),因此使用一个模板参数T进行代替
template<class T>
struct RBTreeNode {
T _val;
RBTreeNode<T>* _left;
RBTreeNode<T>* _right;
RBTreeNode<T>* _parent;
color _color;
RBTreeNode(T val)
:_val(val)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
, _color(RED)
{}
};
6.1.2 红黑树的迭代器
因为set和map均需要使用迭代器,因此红黑树也需要实现它的迭代器。我们首先给出其框架代码,然后再逐一补全。
迭代器封装的是红黑树的结点,除此之外,为了满足自减操作的需要,需要额外需要一个说明树的根节点的成员(在库中使用了带头结点的树来满足这个需求)。迭代器的模板为了满足const的需求,依旧是经典的三个。
//对于红黑树,我们需要为它写一个迭代器类型
template<class T, class Ptr, class Ref>
class RBTreeIterator {
private:
typedef RBTreeNode<T> Node;
Node* _node;
Node* _root;
typedef RBTreeIterator<T, Ptr, Ref> self;
public:
RBTreeIterator(Node* node, Node* root)
:_node(node)
, _root(root)
{}
};
6.1.2.1 前置++
一般遍历红黑树的策略都是中序遍历,因为这样得到的是一个递增或递减的序列,具有实际意义。所以我们就要通过能够仅凭一个指定的点,找到其在红黑树中序遍历的下一个结点。
中序遍历顺序是左→中→右,因此拿到一个节点,其突破点就在于有无右树。
①若其具有右树,则说明此时迭代器当前处于“中”,接下来就该中序访问右子树,即下一个结点是右子树的最左节点。
②若其没有右子树,则说明当前右子树遍历完了,现在就需要确定是哪棵树的右子树遍历完了,于是可以一直向父结点回溯寻找。如果是右孩子就说明它的右子树也遍历完了,所以继续向上找父结点;当发现是父结点的左孩子就说明它的左子树遍历完了,那么此时下一个节点即为这个父结点;也有可能父结点为空了,说明整棵树遍历完成,返回空指针作为遍历的end。
self& operator++()
{
//采取中序遍历(左根右)的策略,那么对于++而言,找到下一位置是谁即可
//分情况讨论:
//基本思路就是看当前子树是否遍历完成,有右树就代表没有完成,需要继续处理右树。如果完成就向上找,自己属于哪一棵左子树,从而继续遍历根节点和右树
//①如果发现当前结点有右孩子,那么说明下一个结点是右子树的最左孩子
if (_node->_right)
{
Node* cur = _node->_right;
while (cur->_left)
{
cur = cur->_left;
}
_node = cur;
}
else
{
Node* cur = _node;
Node* parent = _node->_parent;
//②如果发现当前结点是父结点的左孩子,那么下一个结点就是应该是该结点的父亲
//③如果发现当前结点没有右子树,那么说明下个结点就是向上找,直到找到是左孩子的父结点
while (parent && cur == parent->_right)
{
cur = parent;
parent = parent->_parent;
}
_node = parent;
}
return *this;
}
6.1.2.2 前置--
--即为++的逆序,逻辑十分相似。首先因为end是由空指针替代,所以没有任何树的信息,于是才引入了一个成员记录树的根节点,以便在第一次--操作时可以通过一直找右的方法找到第一个遍历的结点。
在之后,类似的,只需判断有无左孩子。有则说明下一个节点就是左子树的最右结点;没有则向上回溯直到找到是谁的右孩子。
self& operator--()
{
//相当于++操作的逆序,也就成了右根左的遍历顺序了
//基本思路:看当前子树是否遍历完成,有左树就代表没有完成,需要继续处理左树。如果完成就向上找,自己属于哪一棵右子树,从而继续遍历根节点和左树
//对于--操作而言,起点可以是end(),即一个空指针,当从空指针开始--时,需要找到中序遍历的最后一个节点,即最右节点,因此需要知道根节点,所以迭代器需要新增一个root成员
//但在实际的std库中,红黑树具有一个头结点,所以迭代器不会走到空,也就不需要这个root成员了
if (_node == nullptr)
{
Node* cur = _root;
while (cur->_right)
{
cur = cur->_right;
}
_node = cur;
}
//①如果发现当前结点有左孩子,那么说明下一个结点是左子树的最右孩子
else if (_node->_left)
{
Node* cur = _node->left;
while (cur->_right)
{
cur = cur->_right;
}
_node = cur;
}
else
{
Node* cur = _node;
Node* parent = _node->_parent;
//②如果发现当前结点是父结点的右孩子,那么下一个结点就是应该是该结点的父亲
//③如果发现当前结点没有左子树,那么说明下个结点就是向上找,直到找到是右孩子的父结点
while (parent && cur == parent->_left)
{
cur = parent;
parent = parent->_parent;
}
_node = parent;
}
return *this;
}
6.1.2.3 其他函数
其他函数包括解引用、判断相等等函数。
Ref operator*()
{
return _node->_val;
}
Ptr operator->()
{
return &(_node->_val);
}
bool operator==(const self& it)
{
return it._node == _node;
}
bool operator!=(const self& it)
{
return it._node != _node;
}
6.1.3 红黑树
6.1.3.1 模板参数与默认成员函数
为了同时兼容set和map,红黑树参数模板缩减至三个。、
K——key的类型;
T——value的类型,或者说是应该存储的元素的类型。对于set而言T与K是相同的,对于map而言T就是pair<key,value>;
KeyOfT——取得key值的仿函数。因为set的key可以直接取得,而map的key需要访问pair的first成员得到,因此给出仿函数来解决这个问题。
template<class K, class T, class KeyOfT>
//模板参数:
// K——key的类型
// T——value的类型,对于set而言T与K是相同的,对于map而言T就是pair<key,value>
// KeyOfT——取得key值的仿函数
class RBTree {
typedef RBTreeNode<T> RBNode;
public:
//无参构造
RBTree()
:_root(nullptr)
{}
//拷贝构造
RBTree(const RBTree& rb)
{
_root = copy(rb._root);
}
private:
RBNode* copy(RBNode* root)
{
if (root == nullptr) return nullptr;
RBNode* newnode = new RBNode(root->_val);
newnode->_left = copy(root->_left);
newnode->_right = copy(root->_right);
return newnode;
}
public:
//析构函数
~RBTree()
{
destroy(_root);
_root = nullptr;
}
private:
void destroy(RBNode* root)
{
if (root == nullptr) return;
destroy(root->_left);
destroy(root->_right);
delete root;
}
public:
//赋值重载操作符
RBTree& operator=(const RBTree rb)
{
swap(_root, rb->_root);
return *this;
}
private:
RBNode* _root;
};
6.1.3.2 迭代器
实现了const和非const两种迭代器。begin函数即为开始点,找到最左结点即可;end函数则是空指针构造迭代器。
//迭代器
public:
typedef RBTreeIterator<T, T*, T&> iterator;
typedef RBTreeIterator<T, const T*, const T&> constiterator;
iterator begin()
{
RBNode* cur = _root;
while (cur && cur->_left)
{
cur = cur->_left;
}
return iterator(cur, _root);
}
iterator end()
{
return iterator(nullptr, _root);
}
constiterator cbegin()
{
RBNode* cur = _root;
while (cur && cur->_left)
{
cur = cur->_left;
}
return constiterator(cur, _root);
}
constiterator cend()
{
return { nullptr,_root };
}
6.1.2.3 其他函数
注意修改insert和find返回值。insert返回迭代器和bool的pair,使用make_pair来构造。find返回迭代器。
//插入
//在标准库中,insert返回的实际上是pair<iterator,bool>,可以通过库函数make_pair(T1 x,T2 y)来创建pair
pair<iterator, bool> insert(const T& data)
{
//第一个结点特殊处理
if (_root == nullptr)
{
_root = new RBNode(data);
_root->_color = BLACK;
return make_pair(iterator(_root, _root), true);
}
RBNode* cur = _root;
RBNode* parent = nullptr;
//对于set和map,它们取出key值的方法是不同的
//set的key和value相同,就是传入的参数data,因此直接使用data既可以拿到key值
//而map的key值不同,它传入的data是一个结构体pair,需要通过pair.first的形式来拿到key值
//可见面对这样同种目的但操作不同的情况,就需要通过仿函数来解决了
//
//以红黑树为底层的容器,需要提供对应的仿函数来完成取得key值的功能,而在红黑树中,只需要使用即可
KeyOfT Getkey;
while (cur)
{
if (Getkey(cur->_val) > Getkey(data))
{
parent = cur;
cur = cur->_left;
}
else if (Getkey(cur->_val) < Getkey(data))
{
parent = cur;
cur = cur->_right;
}
else
{
return make_pair(iterator(cur,_root),false);
}
}
cur = new RBNode(data);
if (Getkey(parent->_val) > Getkey(data))
{
parent->_left = cur;
cur->_parent = parent;
}
else
{
parent->_right = cur;
cur->_parent = parent;
}
RBNode* ret = cur;
//调整红黑树颜色
//红黑树规则:
// ①根结点颜色一定是黑色
// ②不能出现连续的红结点,即红结点的孩子一定是黑色
// ③各条路径(根结点->叶子结点)上的黑色节点数目相同
// ④叶子结点(此处认为是空结点)颜色为黑色
//在这样的规则限制下,不难发现红黑树最长路径一定小于最短路径的二倍这个特征
//当违反了红黑树规则才需要调整红黑树颜色
//插入新的结点时,选择插入红色节点可能违反不能有连续的红色节点的规则;选择插入黑色节点则必然会违反黑色节点数目相同的规则
//因此两害相权取其轻,选择插入红色节点,因此我们主要处理的就是连续红结点的问题
//于是连续的两个节点:cur和p都是红色的,而u作为p的兄弟节点决定了调整方式,而在调整中受影响的则是p和u的父结点g
while (parent && parent->_color == RED)
{
//根据形式的不同,一般分为三类处理
//在解决连续红色的问题时,也要兼顾到褐色节点数目相同这一规则
RBNode* grandparent = parent->_parent;
RBNode* uncle = parent == grandparent->_left ? grandparent->_right : grandparent->_left;
//①u为红色(p、u均为红)
//p、u同时变为黑色,g变为红色,因为g是红色,因此需要继续向上检查
if (uncle && uncle->_color == RED)
{
parent->_color = uncle->_color = BLACK;
grandparent->_color = RED;
parent = grandparent->_parent;
cur = grandparent;
}
//②u为黑色或不存在,而g、p和cur是顺位(左左或右右)
//此时单纯的变色会使得p子树和u子树路径黑色节点数目不同(因为在修改p为黑,u本就为黑,u相较p黑色节点少一个)
//为了可以顺利变色,我们首先要旋转,红色的p成为了子树的根,黑色的g成为了u这棵树的父结点,此时可以证明只需要p变为黑,g变为红即可
//旋转操作就是AVL树中的左右单旋
//③u为黑色或不存在,而g、p和cur是逆位(左右或右左)
//此时只需要将p结点左旋或右旋一次即可形成如②的情况,因此这种情况使用双旋即可
else
{
if (parent == grandparent->_left)
{
//左左顺位——右旋,p变黑,g变红
if (cur == parent->_left)
{
RotateR(grandparent);
}
//左右逆位——左右双旋,p变黑,g变红
else
{
RotateLR(grandparent);
}
}
else
{
//右右顺位——左旋,p变黑,g变红
if (cur == parent->_right)
{
RotateL(grandparent);
}
//右左逆位——右左双旋,p变黑,g变红
else
{
RotateRL(grandparent);
}
}
//由于②③结果的子树根结点都是黑色因此不会影响上一层,无需向上检查
break;
}
}
//根结点有可能变色,需要修改
_root->_color = BLACK;
return make_pair(iterator(ret, _root), true);
}
iterator find(const K& key)
{
RBNode* cur = _root;
KeyOfT Getkey;
while (cur)
{
if (key > Getkey(cur->_val))
{
cur = cur->_right;
}
else if (key < Getkey(cur->_val))
{
cur = cur->_left;
}
else
{
return iterator(cur, _root);
}
}
return iterator(nullptr, _root);
}
private:
void RotateL(RBNode* grandparent)
{
RBNode* subR = grandparent->_right;
RBNode* subRL = subR->_left;
//结点链接三组:subR和grandparent、grandparent和sunRL、grandparent->_parent和subR
subR->_left = grandparent;
grandparent->_right = subRL;
if (grandparent->_parent == nullptr)
{
_root = subR;
}
else if (grandparent->_parent->_left == grandparent)
{
grandparent->_parent->_left = subR;
}
else
{
grandparent->_parent->_right = subR;
}
subR->_parent = grandparent->_parent;
grandparent->_parent = subR;
if (subRL) //右左子树为空树
subRL->_parent = grandparent;
//修改颜色:p变黑,g变红
subR->_color = BLACK;
grandparent->_color = RED;
}
void RotateR(RBNode* grandparent)
{
RBNode* subL = grandparent->_left;
RBNode* subLR = subL->_right;
//结点链接三组:subL和grandparent、grandparent和sunLR、grandparent->_parent和subL
subL->_right = grandparent;
grandparent->_left = subLR;
if (grandparent->_parent == nullptr)
{
_root = subL;
}
else if (grandparent->_parent->_left == grandparent)
{
grandparent->_parent->_left = subL;
}
else
{
grandparent->_parent->_right = subL;
}
subL->_parent = grandparent->_parent;
grandparent->_parent = subL;
if (subLR) //左右子树为空树
subLR->_parent = grandparent;
//修改颜色:p变黑,g变红
subL->_color = BLACK;
grandparent->_color = RED;
}
//左右双旋
void RotateLR(RBNode* grandparent)
{
RBNode* subL = grandparent->_left;
RBNode* subLR = grandparent->_left->_right;
//只需要旋转,颜色最后指定
RotateL(subL);
RotateR(grandparent);
//修改颜色:cur变黑,g变红
subLR->_color = BLACK;
grandparent->_color = RED;
}
//右左双旋
void RotateRL(RBNode* grandparent)
{
RBNode* subR = grandparent->_right;
RBNode* subRL = grandparent->_right->_left;
//只需要旋转,颜色最后指定
RotateR(subR);
RotateL(grandparent);
//修改颜色:cur变黑,g变红
subRL->_color = BLACK;
grandparent->_color = RED;
}
6.2 set的封装
封装set只需要调用对应红黑树的接口就好。
注意两处:①提供红黑树使用的仿函数:set的key和value相同,传入key,返回key即可。②typedef迭代器时,由于定义的是模板类的中的类型,因为模板没有实例化,所以编译器不知道iterator是什么,需要给出关键字typename说明这是一个类型名。
template <class K>
class set {
//取出Key的仿函数
struct Set_KeyOfT
{
//传入一个value,是T类型,要求返回value的key
//set的value和key相同
const K& operator()(const K& key)
{
return key;
}
};
public:
//由于是对模板类中的类型进行重命名,模板类没有实例化,编译器并不知道iterator是什么,因此需要加上typename来告诉编译器这是一个类型名
typedef typename RBTree::RBTree<K, K, Set_KeyOfT>::iterator iterator;
typedef typename RBTree::RBTree<K, K, Set_KeyOfT>::constiterator constiterator;
iterator begin()
{
return _tree.begin();
}
iterator end()
{
return _tree.end();
}
constiterator cbegin()
{
return _tree.cbegin();
}
constiterator cend()
{
return _tree.cend();
}
pair<iterator,bool> insert(const K& key)
{
return _tree.insert(key);
}
iterator find(const K& key)
{
return _tree.find(key);
}
private:
RBTree::RBTree<K, K, Set_KeyOfT> _tree;
};
6.3 map的封装
同样的,封装map也只需要调用对应红黑树的接口就好。
注意三处:①提供红黑树使用的仿函数:传入value值,即一个pair,返回pair的first成员就是key。②typedef迭代器需要给出关键字typename。③注意[]函数的实现。
template <class K, class V>
class map {
//取出Key的仿函数
struct Map_KeyOfT
{
//传入一个value,是T类型,要求返回value的key
//map的value是一个pair,key是pair的first
const K& operator()(const pair<K, V>& kv)
{
return kv.first;
}
};
public:
//由于是对模板类中的类型进行重命名,模板类没有实例化,编译器并不知道iterator是什么,因此需要加上typename来告诉编译器这是一个类型名
typedef typename RBTree::RBTree<K, pair<const K, V>, Map_KeyOfT>::iterator iterator;
typedef typename RBTree::RBTree<K, pair<const K, V>, Map_KeyOfT>::constiterator constiterator;
iterator begin()
{
return _tree.begin();
}
iterator end()
{
return _tree.end();
}
constiterator cbegin()
{
return _tree.cbegin();
}
constiterator cend()
{
return _tree.cend();
}
pair<iterator, bool> insert(const pair<K,V>& kv)
{
return _tree.insert(kv);
}
iterator find(const K& key)
{
return _tree.find(key);
}
V& operator[](const K& key)
{
return find(key)->second;
}
private:
RBTree::RBTree<K, pair<const K, V>, Map_KeyOfT> _tree;
};