模拟实现map和set
- map和set是红黑树的两种不同封装形式,底层使用同一颗泛型结构的红黑树。
- set是红黑树的K模型;map是红黑树的KV模型。
下面的代码和讲解着重体现红黑树的底层实现和map\set上层封装的衔接。关于二叉搜索树性质,map和set的介绍,搜索树的旋转,红黑树的性质等内容请依次阅读下面几篇文章:
- 【高阶数据结构】二叉搜索树 {概念;实现:核心结构,增删查,默认成员函数;应用:K模型和KV模型;性能分析;相关练习}
- 【STL】map和set的介绍和使用 {关联式容器;键值对;map和set;multimap和multiset;OJ练习}
- 【高阶数据结构】AVL树 {概念及实现;节点的定义;插入并调整平衡因子;旋转操作:左单旋,右单旋,左右双旋,右左双旋;AVL树的验证及性能分析}
- 【高阶数据结构】红黑树 {概念及性质;红黑树节点的定义;红黑树插入操作详细解释;红黑树的验证}
一、红黑树的核心结构
-
问题一:map和set底层使用同一颗泛型结构的红黑树,如何处理map(pair<key,value>)和set(key)存储值不同的问题?
解决方案:泛型底层红黑树的存储类型,通过不同的实例化参数,实现出map和set。
1.1 节点的定义
// RBTree.hpp
#pragma once
#include <utility>
#include <assert.h>
using std::pair;
using std::make_pair;
enum Color{
RED,
BLACK
};
template <class T>
struct RBTreeNode{
typedef RBTreeNode<T> Node;
Node *_left;
Node *_right;
Node *_parent;
T _data; //泛型底层红黑树的存储类型,通过不同的实例化参数,实现出map和set。
Color _color;
RBTreeNode(const T &data = T(), Color color = RED)
:_left(nullptr),
_right(nullptr),
_parent(nullptr),
_data(data),
_color(color)
{}
};
1.2 红黑树的结构定义
STL中的红黑树结构
- 为了后续实现关联式容器map/set,STL红黑树的实现中增加一个头结点;
- 因为根节点必须为黑色,为了与根节点进行区分,将头结点给成红色;
- 并且让头结点的
_parent
域指向红黑树的根节点,_left
域指向红黑树中最小的节点,_right
域指向红黑树中最大的节点。
头结点的作用(begin, end):
- STL明确规定,begin()与end()代表的是一段前闭后开的区间,而对红黑树进行中序遍历后,可以得到一个有序的序列,因此:begin()可以放在红黑树中最小节点(即最左侧节点)的位置,end()放在最大节点(最右侧节点)的下一个位置,关键是最大节点的下一个位置在哪块?
- 能否给成nullptr呢?答案是行不通的,因为对end()位置的迭代器进行–操作,必须要能找最后一个元素,此处就不行,因此最好的方式是将end()放在头结点的位置:
// RBTree.hpp
// K: key的类型,
// T: 如果是map,则为pair<K, V>; 如果是set,则为K
// KofT: 通过T类型的data来获取key的一个仿函数类
template <class K, class T, class KofT>
class RBTree{
typedef RBTreeNode<T> Node; //第二个模版参数T,决定红黑树的存储类型
Node *_phead; //指向头结点的指针
public:
typedef RBT_iterator<T, T&, T*> iterator; //普通迭代器
typedef RBT_iterator<T, const T&, const T*> const_iterator; //const迭代器
//构造,创建头结点
RBTree(){
_phead = new Node(T(), RED); //为了和根节点区分,头节点设为红色
_phead->_left = _phead->_right = _phead;
}
//普通对象返回普通迭代器
iterator begin(){
return iterator(_phead->_left); //begin放在红黑树最左节点的位置
}
iterator end(){
return iterator(_phead); //end放在头结点的位置
}
//const对象返回const迭代器
const_iterator begin() const{
return const_iterator(_phead->_left);
}
const_iterator end() const{
return const_iterator(_phead);
}
//插入和查找
pair<iterator, bool> Insert(const T& data);
iterator Find(const K &k);
private:
//获取根节点,注意返回指针的引用便于修改
Node*& GetRoot(){
return _phead->_parent;
}
//获取最左节点
Node* LeftMost(){
Node *proot = GetRoot();
if(proot == nullptr)
{
return _phead;
}
else{
Node *left = proot;
while(left->_left != nullptr)
{
left = left->_left;
}
return left;
}
}
//获取最右节点
Node* RightMost(){
Node *proot = GetRoot();
if(proot == nullptr)
{
return _phead;
}
else{
Node *right = proot;
while(right->_right != nullptr)
{
right = right->_right;
}
return right;
}
}
//旋转
void RotateL(Node *parent);
void RotateR(Node *parent);
二、红黑树的迭代器
2.1 迭代器的基本操作
红黑树的迭代器底层封装一个指向节点的指针,基本操作的详细解释请参照list迭代器的实现。
// RBTree.hpp
template<class T, class Ref, class Ptr>
class RBT_iterator{
typedef RBT_iterator<T, Ref, Ptr> iterator;
typedef RBTreeNode<T> Node;
Node *_pnode; //红黑树的迭代器底层封装一个指向节点的指针
public:
//基本操作请参照list迭代器的实现,不做过多解释
RBT_iterator(Node *pnode)
:_pnode(pnode)
{}
Ref operator*() const{
return _pnode->_data;
}
Ptr operator->() const{
return &_pnode->_data;
}
bool operator==(const iterator &it) const{
return _pnode == it._pnode;
}
bool operator!=(const iterator &it) const{
return _pnode != it._pnode;
}
//......
};
2.2 operator++
红黑树迭代器的实现难点在于++和–操作:
operator++:(中序:左子树,根,右子树)
-
如果当前节点的右子树不为空,++就是找右子树中序的第一个节点(最左节点)。11->12。
-
如果当前节点的右子树为空,++就是找孩子不是右节点的那个祖先。7->8。
-
特殊情况:根节点没有右孩子,迭代器在根位置(如下图),此时进行++迭代器因该指向头结点end遍历结束。但如果按照上面的逻辑由于根节点恰好是头结点的右孩子(根节点没有右孩子),最终迭代器又会指向根节点永远无法到达头结点end,导致程序陷入死循环。因此需要特殊处理。
提示:右子树为空或孩子是右节点,说明这棵子树已经遍历访问完了。
//前置和后置++,后置复用前置
iterator& operator++(){
if(_pnode->_right != nullptr) //如果右子树不为空,++就是找右子树的最左节点
{
Node *left = _pnode->_right;
while(left->_left != nullptr)
{
left = left->_left;
}
_pnode = left;
}
else //如果右子树为空,++就是找孩子不是右节点的那个祖先
{
Node *parent = _pnode->_parent;
while(_pnode == parent->_right)
{
_pnode = parent;
parent = parent->_parent;
}
//特殊情况:根节点没有右孩子,迭代器在根位置。
//经过循环此时_pnode指向头节点,parent指向根节点,做特殊处理使_pnode指向头结点
if(_pnode->_right != parent)
_pnode = parent;
}
return *this;
}
iterator operator++(int){
iterator it(_pnode);
++*this;
return it;
}
2.3 operator–
operator–:和++相反(右子树,根,左子树)
- 如果当前节点的左子树不为空,–就是找左子树的最右节点。8->7
- 如果当前节点的左子树为空,–就是找孩子不是左节点的那个祖先。12->11
- 特殊情况:如果迭代器指向end,即头结点。此时进行–操作因该使迭代器指向最右节点。
- –操作也存在++操作中的特殊情况——根节点没有左孩子。但不需要做特殊处理,–后仍指向根节点即可。
提示:左子树为空或孩子是左节点,说明这棵子树已经遍历访问完了。
//前置和后置--,后置复用前置
iterator operator--(){
//特殊情况:如果迭代器指向end,进行--操作因该使迭代器指向最右节点。
if(_pnode->_parent->_parent == _pnode && _pnode->_color == RED)
{
_pnode = _pnode->_right;
}
else if(_pnode->_left != nullptr) //如果左子树不为空,--就是找左子树的最右节点
{
Node *right = _pnode->_left;
while(right->_right != nullptr)
{
right = right->_right;
}
_pnode = right;
}
else //如果左子树为空,--就是找孩子不是左节点的那个祖先
{
Node *parent = _pnode->_parent;
while(_pnode == parent->_left)
{
_pnode = parent;
parent = parent->_parent;
}
_pnode = parent; //不需要特殊处理
}
return *this;
}
iterator operator--(int){
iterator it(_pnode);
--*this;
return it;
}
三、红黑树的插入和查找
-
问题二:在进行查找、插入、删除等操作时,要对key值进行比较。在同一模版中,如何区别比较map和set中的key值?
解决方案:通过传入仿函数KofT(KeyofTree)解决。如果是set,传入SetKofT返回data的值;如果是map,传入MapKofT返回data.first的值;
注意:pair中重载了关系运算符,但first和second都参与运算,不符合要求。要求只比较pair.first (key)。
3.1 插入
pair<iterator, bool> Insert(const T& data){
Node* &rproot = GetRoot(); //这里注意要用引用接收返回值
if(rproot == nullptr)
{
rproot = new Node(data, BLACK); //因为GetRoot返回指针的引用,所以改的实际是_phead->_parent
rproot->_parent = _phead;
_phead->_left = _phead->_right = rproot;
//返回pair<iterator, bool>,方便实现operator[]。
return make_pair(iterator(rproot), true);
}
KofT kot; //创建KofT对象,用于取出data中的key
Node *cur = rproot;
Node *parent = nullptr;
while(cur != nullptr)
{
parent = cur;
if(kot(data) > kot(cur->_data)) //不管是map还是set都能正确的取出key进行比较。
cur = cur->_right;
else if(kot(data) < kot(cur->_data))
cur = cur->_left;
else
return make_pair(iterator(cur), false);
}
cur = new Node(data, RED);
if(kot(data) > kot(parent->_data))
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
Node* newnode = cur; //在调整红黑树的过程中cur的指向会改变,所以要提前记录新节点的指针。
//上一次循环中grandparent 为根节点,此次循环parent == _phead
//关于红黑树性质的检查和平衡调整请阅读文章:【高阶数据结构】红黑树
while(parent != _phead && parent->_color == RED)
{
Node* grandparent = parent->_parent;
assert(grandparent!=nullptr);
assert(grandparent->_color == BLACK);
Node* uncle = grandparent->_left;
if(grandparent->_left == parent)
uncle = grandparent->_right;
if(uncle != nullptr && uncle->_color == RED)
{
parent->_color = uncle->_color = BLACK;
grandparent->_color = RED;
cur = grandparent;
parent = grandparent->_parent;
}
else
{
if(parent == grandparent->_left)
{
if(cur == parent->_left)
{
RotateR(grandparent);
parent->_color = BLACK;
grandparent->_color = RED;
}
else
{
RotateL(parent);
RotateR(grandparent);
cur->_color = BLACK;
grandparent->_color = RED;
}
}
else
{
if(cur == parent->_right)
{
RotateL(grandparent);
parent->_color = BLACK;
grandparent->_color = RED;
}
else
{
RotateR(parent);
RotateL(grandparent);
cur->_color = BLACK;
grandparent->_color = RED;
}
}
break;
}
} //end of while
//如果在调整过程中将根节点变为红色,记得重新变回黑色。
if(parent == _phead)
cur->_color = BLACK;
//令头节点的左指针指向红黑树的最左节点
_phead->_left = LeftMost();
//令头节点的右指针指向红黑树的最右节点
_phead->_right = RightMost();
//返回pair<iterator, bool>,方便实现operator[]。
return make_pair(iterator(newnode), true);
}
3.2 旋转
void RotateL(Node *parent){
Node* subR = parent->_right;
Node* subRL = subR->_left;
Node* ppNode = parent->_parent;
subR->_left = parent;
parent->_parent = subR;
parent->_right = subRL;
if(subRL != nullptr)
subRL->_parent = parent;
if(ppNode == _phead) //如果parent是根节点,要修改头结点的_parent指针。
{
_phead->_parent = subR;
}
else
{
if(parent == ppNode->_left)
ppNode->_left = subR;
else
ppNode->_right = subR;
}
subR->_parent = ppNode;
}
void RotateR(Node *parent){
Node *subL = parent->_left;
Node *subLR = subL->_right;
Node *ppNode = parent->_parent;
subL->_right = parent;
parent->_parent = subL;
parent->_left = subLR;
if(subLR != nullptr)
subLR->_parent = parent;
if(ppNode == _phead) //如果parent是根节点,要修改头结点的_parent指针。
{
_phead->_parent = subL;
}
else
{
if(parent == ppNode->_left)
ppNode->_left = subL;
else
ppNode->_right = subL;
}
subL->_parent = ppNode;
}
3.3 查找
iterator Find(const K &k)
{
KofT kot; //创建KofT对象,用于取出data中的key
Node *cur = GetRoot();
if(cur == nullptr) return end(); //如果是空树,返回end。
while(cur != nullptr)
{
if(k > kot(cur->_data)) //不管是map还是set都能正确的取出key进行比较。
cur = cur->_right;
else if(k < kot(cur->_data))
cur = cur->_left;
else
return iterator(cur); //找到返回指向节点的迭代器
}
return end(); //如果找不到,返回end。
}
四、map和set的封装
4.1 map
//Map.hpp
#pragma once
#include "RBTree.hpp"
namespace zty{
template <class K, class V>
class map{
//MapKofT返回kv.first
struct MapKofT{
const K& operator()(const pair<K,V> &kv){
return kv.first;
}
};
//map是KV模型的红黑树,存储pair<K,V>键值对
typedef RBTree<K, pair<K,V>, MapKofT> RBT;
RBT _rbt;
public:
//取类模版中的内嵌类型时,需要在类型前加typename;告诉编译器,后面这一串是类型不是静态成员。
typedef typename RBT::iterator iterator; //map的迭代器类型
typedef typename RBT::const_iterator const_iterator; //const迭代器
//C++11的用法:使用了default关键字,表示使用编译器自动生成的默认构造函数
map() = default;
//迭代器区间构造
template <class InputIterator>
map(InputIterator first, InputIterator last){
while(first!=last)
{
_rbt.Insert(*first);
++first;
}
}
iterator begin(){
return _rbt.begin();
}
iterator end(){
return _rbt.end();
}
const_iterator begin() const{
return _rbt.begin();
}
const_iterator end() const{
return _rbt.end();
}
std::pair<iterator, bool> insert(const pair<K,V> &kv){
return _rbt.Insert(kv);
}
//Insert返回pair<iterator, bool>,方便实现operator[]。
//具体内容阅读文章:【STL】map和set的介绍和使用
V& operator[](const K& k){
pair<iterator, bool> ret = _rbt.Insert(make_pair(k, V()));
return ret.first->second;
}
iterator find(const K& k){
return _rbt.Find(k);
}
};
}
4.2 set
//Set.hpp
#pragma once
#include "RBTree.hpp"
namespace zty{
template <class K>
class set{
//SetKofT返回k
struct SetKofT{
const K& operator()(const K &k)
{
return k;
}
};
//set是K模型的红黑树,只存储key值
typedef RBTree<K, K, SetKofT> RBT;
RBT _rbt;
public:
//取类模版中的内嵌类型时,需要在类型前加typename;告诉编译器,后面这一串是类型不是静态成员。
typedef typename RBT::iterator iterator; //set的迭代器类型
typedef typename RBT::const_iterator const_iterator; //const迭代器
//C++11的用法:使用了default关键字,表示使用编译器自动生成的默认构造函数
set() = default;
//迭代器区间构造
template <class InputIterator>
set(InputIterator first, InputIterator last){
while(first!=last)
{
_rbt.Insert(*first);
++first;
}
}
iterator begin(){
return _rbt.begin();
}
iterator end(){
return _rbt.end();
}
const_iterator begin() const{
return _rbt.begin();
}
const_iterator end() const{
return _rbt.end();
}
std::pair<iterator, bool> insert(const K& k){
return _rbt.insert(k);
}
iterator find(const K& k){
return _rbt.Find(k);
}
};
}