目录
- 序言
- 1 AVL树的概念
- 2 AVL树节点的定义
- 3 AVL树的插入
- 是否继续更新依据:子树的高度是否变化
- 4 AVL树的旋转
- 旋转的原则:
- 1. 新节点插入较高左子树的左侧---左左:右单旋
- 2. 新节点插入较高右子树的右侧---右右:左单旋
- 3. 新节点插入较高左子树的右侧---左右:先左单旋再右单旋
- 4. 新节点插入较高右子树的左侧---右左:先右单旋再左单旋
- 5.如何验证一颗树是AVL树的验证?
- 6 AVL树的删除(了解)
- 7 AVL树的性能
接——map和set的应用总结
序言
前面对map/multimap/set/multiset进行了简单的介绍,在其文档介绍中发现,这几个容器有个共同点是:其底层都是按照二叉搜索树来实现的,但是二叉搜索树有其自身的缺陷,假如往树中插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成O(N),因此map、set等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。
1 AVL树的概念
二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:
- 它的左右子树都是AVL树
- 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在 O ( l o g 2 n ) O(log_2 n) O(log2n),搜索时间复杂度O( l o g 2 n log_2 n log2n)。
2 AVL树节点的定义
AVL树节点的定义:
平衡因子(_bf)=右子树的高度-左子树的高度
struct AVLTreeNode
{
pair<K, V> _kv;//键值对
AVLTreeNode<K, V>* _left;
AVLTreeNode<K, V>* _right;
AVLTreeNode<K, V>* _parent;
int _bf; // 平衡因子 balance factor=右子树的高度-左子树的高度
AVLTreeNode(const pair<K, V>& kv)
:_kv(kv)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
, _bf(0)
{}
};
3 AVL树的插入
AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树。
那么AVL树的插入过程可以分为两步:
- 按照二叉搜索树的方式插入新节点
- 调整节点的平衡因子
是否继续更新依据:子树的高度是否变化
下面拿一个右单旋的图来说明一下parent、subL、subLR三者之间的关系,让读者更能理解这里向上更新平衡因子的逻辑。
更新之后如果:(_bf为该节点的平衡因子,平衡因子=右子树的高度-左子树的高度)
-
parent->_bf == 0,那么之前parent->_bf是 1 或者 -1。
说明之前parent一边高一边低,这次插入填上矮的那边,parent所在子树整体高度不变,对于parent的双亲结点没有影响,不需要继续往上更新。 -
parent->_bf == 1 或 -1,之前是parent->_bf == 0。
说明插入前两边一样高,现在插入一边更高了,parent所在子树高度变了,继续往上更新。 -
parent->_bf == 2 或 -2,之前parent->_bf == 1 或者 -1。
现在插入一个新节点后严重不平衡,违反规则需要就地处理——旋转,如何旋转?下面会有介绍。
AVL树的插入代码整体框架:
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)//如果当前是空树
{
_root = new Node(kv);
return true;
}
//向下找该结点的插入位置
//开始向下寻找该要被插入结点的父节点
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;//往右走
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;//往左走
}
else
{
return false;//不能插入相等(重复)的值
}
}
//找到位置然后正确的将结点插入
cur = new Node(kv);
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
cur->_parent = parent;
}
else
{
parent->_left = cur;
cur->_parent = parent;
}
// 1、开始向上更新 平衡因子
while (parent) // parent为空,也就更新到根了
{
// 新增在右,parent->bf++;
// 新增在左,parent->bf--;
if (cur == parent->_left)
{
parent->_bf--;
}
else
{
parent->_bf++;
}
//parent->_bf == 0,那么之前parent->_bf是 1 或者 -1
//说明之前parent一边高一边低,这次插入填上矮的那边,parent所在子树整体高度不变,
//对于parent的双亲结点没有影响,不需要继续往上更新,退出更新的循环
if (parent->_bf == 0)
{
break;
}
//parent->_bf == 1 或 -1,说明之前是parent->_bf == 0,两边一样高,
//现在插入一边更高了,parent所在子树高度变了,继续往上更新。
else if (parent->_bf == 1 || parent->_bf == -1)
{
cur = parent;
parent = parent->_parent;
}
// parent->_bf == 2 或 -2,说明之前parent->_bf == 1 或者 -1,
// 现在插入严重不平衡,违反规则需要就地处理——旋转
else if (parent->_bf == 2 || parent->_bf == -2)
{
//左单旋
if (parent->_bf == 2 && cur->_bf == 1)
{
RotateL(parent);
}
//右单旋
else if (parent->_bf == -2 && cur->_bf == -1)
{
RotateR(parent);
}
//左右双旋
else if (parent->_bf == -2 && cur->_bf == 1)
{
RotateLR(parent);
}
//右左双旋
else if (parent->_bf == 2 && cur->_bf == -1)
{
RotateRL(parent);
}
else
{
assert(false);
}
break;
}
else
{
assert(false);
}
}
return true;
}
4 AVL树的旋转
旋转的原则:
1、让这颗子树左右高度不超过1
2、旋转过程中继续保持是搜索树
3、更新调整节点的平衡因子
4、让这颗子树的高度跟插入前保持一致
如果在一棵原本是平衡的AVL树中插入一个新节点,可能造成不平衡,此时必须调整树的结构,使之平衡化。根据节点插入位置的不同,AVL树的旋转分为四种:
1. 新节点插入较高左子树的左侧—左左:右单旋
上图在插入前,AVL树是平衡的,新节点插入到30的左子树(注意:此处不是左孩子)中,30左子树增加了一层,导致以60为根的二叉树不平衡,要让60平衡,只能将60左子树的高度减少一层,右子树增加一层,即将左子树往上提,这样60转下来,因为60比30大,只能将其放在30的右子树,而如果30有右子树,右子树根的值一定大于30,小于60,只能将其放在60的左子树,旋转完成后,更新节点的平衡因子即可。
在旋转过程中,编写程序时有以下几种情况需要考虑:
- 30节点的右孩子可能存在,也可能不存在
- 60可能是根节点,也可能是子树。如果是根节点,旋转完成后,要更新根节点;如果是子树,可能是某个节点的左子树,也可能是右子树。
代码及注释:
void RotateR(Node* parent)
{
// SubL: parent的左孩子
// SubLR: parent左孩子的右孩子,注意:该结点可能为空
Node* subL = parent->_left;
Node* subLR = subL->_right;
// 旋转完成之后,30的右孩子作为60的左孩子
parent->_left = subLR;
// 并且如果30的右孩子存在,因为时三叉连,需要更换其双亲结点parent为60
if (subLR)
{
subLR->_parent = parent;
}
// 因为60可能是棵子树,因此在更新其双亲前必须先保存60的双亲
Node* ppNode = parent->_parent;
// 60 作为 30的右孩子
subL->_right = parent;
// 更新60的双亲
parent->_parent = subL;
// 如果60是根节点,根新指向根节点的指针
//if (_root == parent)
if (ppNode == nullptr)
{
_root = subL;
_root->_parent = nullptr;
}
else
{
// 如果60是子树,可能是其双亲的左子树,也可能是右子树
if (ppNode->_left == parent)
{
ppNode->_left = subL;
}
else
{
ppNode->_right = subL;
}
//更新subL也就是30的双亲结点
subL->_parent = ppNode;
}
// 根据调整后的结构更新部分节点的平衡因子,看图调整即可,右单旋都是固定的
subL->_bf = parent->_bf = 0;
}
2. 新节点插入较高右子树的右侧—右右:左单旋
实现及情况考虑可参考右单旋,这里就不多赘述了。
参考代码:
void RotateL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
parent->_right = subRL;
if (subRL)
subRL->_parent = parent;
Node* ppNode = parent->_parent;
subR->_left = parent;
parent->_parent = subR;
if (ppNode == nullptr)
{
_root = subR;
_root->_parent = nullptr;
}
else
{
if (ppNode->_left == parent)
{
ppNode->_left = subR;
}
else
{
ppNode->_right = subR;
}
subR->_parent = ppNode;
}
parent->_bf = subR->_bf = 0;
}
3. 新节点插入较高左子树的右侧—左右:先左单旋再右单旋
将双旋变成单旋后再旋转,即:先对30进行左单旋,然后再对90进行右单旋,旋转完成后再考虑平衡因子的更新。
判断整体的平衡因子的重要依据就是看60旋转前的平衡因子,从图中可以知道,60的左右孩子分别变成30的右孩子和90的左孩子,所以最终平衡因子的判断只需要看是
- 在60的左边b新增
(平衡因子:30->0,60->0,90->1)
- 还是在60右边c新增
(平衡因子:30->-1,60->0,90->0)
- 60自己就是新增的结点,那么之前a、d的高度一定是0(否则插入60之前就不是一颗AVL树了)
(平衡因子:30->0,60->0,90->0)
void RotateLR(Node* parent)
{
Node* subL = parent->_left;//30
Node* subLR = subL->_right;//60
//最后判断整体的平衡因子的重要依据就是看60的平衡因子,从图中可以知道,60的左右孩子分别变成,
//30的有孩子和90的左孩子,所以最终平衡因子的判断只需要看在60的左边b新增,还是右边c新增即可
int bf = subLR->_bf;
//对30进行左旋
RotateL(parent->_left);
//对90进行右旋
RotateR(parent);
if (bf == -1) // 60左子树新增
{
subL->_bf = 0;
parent->_bf = 1;
subLR->_bf = 0;
}
else if (bf == 1) // 60右子树新增
{
parent->_bf = 0;
subL->_bf = -1;
subLR->_bf = 0;
}
else if (bf == 0) // 60自己就是新增结点
{
parent->_bf = 0;
subL->_bf = 0;
subLR->_bf = 0;
}//其他情况就报断言错误
else
{
assert(false);
}
}
4. 新节点插入较高右子树的左侧—右左:先右单旋再左单旋
具体细节可参考左右双旋,先对90进行右单旋,然后再对30进行左单旋,旋转完成后再考虑平衡因子的更新。
判断整体的平衡因子的重要依据就是看60旋转前的平衡因子,从图中可以知道,60的左右孩子分别变成30的右孩子和90的左孩子,所以最终平衡因子的判断只需要看在60的左边b新增,还是右边c新增,或者说自己就是新增的结点即可。
代码:
void RotateRL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
int bf = subRL->_bf;
RotateR(parent->_right);
RotateL(parent);
if (bf == 1)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = -1;
}
else if (bf == -1)
{
subR->_bf = 1;
subRL->_bf = 0;
parent->_bf = 0;
}
else if (bf == 0)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
总结:
假如以parent为根的子树不平衡,即parent的平衡因子为2或者-2,分以下情况考虑:
- parent的平衡因子为2,说明parent的右子树高,设parent的右子树的根为subR
当subR的平衡因子为1时,执行左单旋
当subR的平衡因子为-1时,执行右左双旋 - parent的平衡因子为-2,说明parent的左子树高,设parent的左子树的根为subL
当subL的平衡因子为-1是,执行右单旋
当subL的平衡因子为1时,执行左右双旋
旋转完成后,原parent为根的子树个高度降低,已经平衡,不需要再向上更新。
5.如何验证一颗树是AVL树的验证?
AVL树是在二叉搜索树的基础上加入了平衡性的限制,因此要验证AVL树,可以分两步:
- 验证其为二叉搜索树
如果中序遍历可得到一个有序的序列,就说明为二叉搜索树 - 验证其为平衡树
- 每个节点子树高度差的绝对值不超过1(注意节点中如果没有平衡因子)
- 节点的平衡因子是否计算正确
void Inorder()//封装中序遍历函数,防止直接访问根节点_root
{
_Inorder(_root);
}
void _Inorder(Node* root)
{
if (root == nullptr)
return;
_Inorder(root->_left);
cout << root->_kv.first << ":" << root->_kv.second << endl;
_Inorder(root->_right);
}
int Height(Node* root)
{
if (root == nullptr)
return 0;
int lh = Height(root->_left);
int rh = Height(root->_right);
return lh > rh ? lh + 1 : rh + 1;
}
bool IsBalance()//封装判断平衡函数,防止直接访问根节点_root
{
return IsBalance(_root);
}
bool IsBalance(Node* root)
{
if (root == nullptr)
{
return true;
}
int leftHeight = Height(root->_left);
int rightHeight = Height(root->_right);
if (rightHeight - leftHeight != root->_bf)
{
cout <<root->_kv.first<<"平衡因子异常" << endl;//和当前标识的平衡因子不符
return false;
}
return abs(rightHeight - leftHeight) < 2//平衡因子大于等于2就不是一个AVL树了
&& IsBalance(root->_left)
&& IsBalance(root->_right);
}
6 AVL树的删除(了解)
因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除,然后再更新平衡因子,只不过与删除不同的时,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。具体实现可参考《算法导论》或《数据结构-用面向对象方法与C++描述》殷人昆版。
7 AVL树的性能
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即
l
o
g
2
(
N
)
log_2 (N)
log2(N)。但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,通过频繁的旋转才达到这样的绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。
红黑树会减少一些旋转次数,插入数据时相比AVL树就不会那么严格。
AVL树完整代码链接
推荐阅读:C++——一种特殊的二叉搜索树之红黑树