AVL树的概念
二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下,时间复杂度为O(N);
两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。AVL树,即是高度平衡的二叉搜索树。
一棵AVL树是一棵平衡二叉搜索树,也能是一棵空树。
AVL树的性质:
①它的左右子树都是AVL树
②左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
③如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在log_2N,搜索的时间复杂度是log_2N。
AVL树的定义:
AVL树的定义中:①拥有键值对。②多加一个双亲节点,用于调整平衡二叉树。③增加平衡因子,用于判断插入或删除后,是否还是一棵AVL树。
template<class K,class V>
struct AVLTreeNode
{
pair<K, V> _kv;//键值对
AVLTreeNode<K, V>* _left;
AVLTreeNode<K, V>* _right;
AVLTreeNode<K, V>* _parent;
int _bf;//balance factor
AVLTreeNode(const pair<K, V>& kv)
:_kv(kv)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
{}
};
AVL树的插入
AVL树的插入分成两步:第一步是按照二叉搜索树的方式来新增节点。第二步是是调整节点,使其成为一棵平衡的二叉搜索树。
先展示代码,我们分析以下思路:
1.首先按照二叉搜索树的方式来新增节点,但这需要新增一个双亲指针,方便后续在调节节点。因此,在新增节点的最后部分的代码中,我们需要让cur->_parent指向双亲节点parent。
2.完成二叉搜索树的创建后,开始去判断各个节点的平衡因子。
①当平衡因子_bf等于0的时候,说明parent节点一边高一边矮,新增的这个节点填上了矮的地方,这种情况就不需要更新了,直接beak掉。
②当平衡因子_bf等于1或者-1的时候,说明parent原本的平衡因子是0,parent两边一样高,新增了节点之后,有一边变高了。这种情况需要继续往上走。
③当平衡因子_bf等于2或-2的时候,说明之前parent->_bf == 1 或者 -1,现在插入严重不平衡,违反规则,此时需要原地旋转,即以当前节点为轴旋转。
随后将重点分析:当平衡因子是2或-2的时候,说明需要通过旋转调节节点。那该如何去旋转呢?
bool Insert(const pair<K, V>& kv)
{
//一开始是一棵空树
if (_root == nullptr)
{
_root = new Node(kv);
return true;
}
//一开始不是空树
Node* parent = nullptr;
Node* cur = _root;
//寻找插入的地方,是左子树还是右子树
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
//找到插入的位置后,即确认了是在左子树还是右子树
cur = new Node(kv);
//确定是在父节点的左还是右
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
cur->_parent = parent;
}
else
{
parent->_left = cur;
cur->_parent = parent;
}
//更新平衡因子,判断插入后的树,是否是一棵AVL树
while (parent)
{
//插入的是在父节点的左边,即是左孩子
if (cur == parent->_left)
{
parent->_bf--;//一般是右-左,因此,如果是插入在左边,那就是减一
}
else //是右孩子
{
parent->_bf++;
}
//更新完平衡因子后,判断是否是一棵AVL树
//如果平衡因子是0,任何节点的平衡因子都没被改变
if (parent->_bf == 0)
{
break;
}
else if (parent->_bf == 1 || parent->_bf == -1)
{
//如果平衡因子是1或-1,那么就说明,父节点往上的节点的平衡因子有可能被改变了
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
//旋转
//右单旋----高出来的那一部分按下去!
if (parent->_bf == -2 && cur->_bf == -1)
{
RotateR(parent);
}
else if(parent->_bf==2 && cur->_bf== 1)//左单旋
{
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == 1) //先左旋后右旋
{
RotateLR(parent);
}
else if (parent->_bf == 2 && cur->_bf == -1) //先右旋再左旋
{
RotateRL(parent);
}
}
else //不排除在创建一棵AVL树的时候,代码写错了
{
assert(false);
}
}
return true;
}
旋转节点
旋转的要求:
⭐让这颗子树左右高度之差不超过1
⭐旋转过程中继续保持他是搜索树
⭐更新调整孩子节点的平衡因子
⭐让这颗子树的高度跟插入前保持一致。因为这样就不会对上层的平衡因子造成影响,此时就可以结束对这棵树的更新旋转。
旋转的情况有四种:
①新节点插入较高左子树的左侧---左左:右单旋
这种情况是新增的节点位于比较高的左子树的左侧的某个位置上,此时在往上检查平衡因子发现值为60的节点是平衡因子为-2,说明左子树的高度是比右子树高的(这里选择右减左),所以当我们的判断条件if(parent->_bf==-2 && cur->_bf == -1)成立时,就表示着符合当前情况。所以,我们需要将60的节点的平衡因子减小,那就是将它按下去!以60的节点为轴旋转:
⭐旋转的动作:因为b是30节点的右孩子,根据二叉搜索树的性质,b子树所有的值肯定是大于30,小于60的,而且60节点需要下来,说明60节点是要成为30节点的右孩子的,因此b子树就需要成为60节点的左孩子了。
⭐当然,我们需先判断一下,30节点的右孩子是否为空,即30节点没有右孩子。如果没有右孩子,那么就不能让它指向60节点的左孩子。
⭐然而,我们旋转的这颗树,可能是一颗子树,因此需要判断一下60节点的双亲节点是否为空,如果为空,说明它不是子树,此时就可以让_root指向subL,成为新的根,然后subL的双亲节点置为nullptr,因为subL->parent原本是指向60节点的。
⭐如果不为空,那就说明它是一棵子树,那么就让60节点的双亲节点的左或右孩子点指向30节点,30节点的双亲指向60原先的双亲节点。
右单旋的代码如下:
void RotateR(Node* parent)
{
//一开始,例子中的60节点便是parent
//先创建指向30节点的指针和指向b节点的指针
Node* subL = parent->_left;
Node* subLR = subL->_right;
//这一步是让60节点的左孩子指向b节点
parent->_left = subLR;
//这一步判断b节点是否为空,如果不为空,那么就让它的双亲节点指向60节点(本来是指向subL的)
if (subLR)
{
subLR->_parent = parent;
}
//上面两步成功将b节点改链接到60节点上去
//先保存60节点的双亲节点
Node* ppNode = parent->_parent;
//让30节点subL的右孩子指向60节点,即60节点链接到了30节点subL的右孩子上
subL->_right = parent;
//60节点的双亲节点指向30节点subL
parent->_parent = subL;
//判断60节点原本的双亲节点是否为空
//为空
if (ppNode == nullptr)
{
_root = subL;
_root->_parent = nullptr;
}
else //不为空,说明是一棵子树
{
if (ppNode->_left == parent) //如果parent是原先的双亲节点的左孩子
{
ppNode->_left = subL;
}
else //如果parent是原先的双亲节点的右孩子
{
ppNode->_right = subL;
}
//链接后,再让成为新根后的30节点subL的双亲节点指向ppNode
subL->_parent = ppNode;
}
//最后将30节点subL和60节点parent的平衡因子修改
//
subL->_bf = parent->_bf = 0;
//此时,右单旋完成
//因为旋转的要求是让这颗子树的高度跟插入前保持一致
//那就说明,此时完成旋转的这树,不会对上层的平衡因子造成影响,此时就可以结束对这棵树的更新旋转
}
②新节点插入较高右子树的右侧---右右:左单旋
这种情况是新增的节点位于比较高的右子树的右侧的某个位置上,此时在往上检查平衡因子发现值为30的节点是平衡因子为2,说明右子树的高度是比左子树高的(这里选择右减左),所以当我们的判断条件if(parent->_bf==2 && cur->_bf == 1)成立时,就表示着符合当前情况。所以,我们需要将30的节点的平衡因子减小,那就是将它按下去!以30的节点为轴旋转:
⭐旋转的动作:因为b是60节点的左孩子,根据二叉搜索树的性质,b子树所有的值肯定是大于30,小于60的,而且30节点需要下来,说明30节点是要成为60节点的左孩子孩子的,因此b子树就需要成为30节点的右孩子了。
⭐同样的,我们需先判断一下,60节点的左孩子是否为空,即60节点没有左孩子。如果没有左孩子,那么就不能让它指向30节点的右孩子。
⭐同样的,需要盘点一下是否是一棵子树。因此需要判断一下30节点的双亲节点是否为空,如果为空,说明它不是子树,此时就可以让_root指向subR,成为新的根,然后subR的双亲节点置为nullptr,因为subR->parent原本是指向30节点的。
⭐如果不为空,那就说明它是一棵子树,那么就让30节点的双亲节点的左或右孩子点指向60节点,60节点的双亲指向30原先的双亲节点。
左单旋代码如下:
void RotateL(Node* parent)
{
//创建60节点subR,右右是左旋嘛
Node* subR = parent->_right;
//创建指向b节点的指针subRL
Node* subRL = subR->_left;
//先让parent的右孩子节点指向subRL。
parent->_right = subRL;
//判断subRL是否为空,不为空,那就让subRL的父节点指向parent
if (subRL)
{
subRL->_parent = parent;
}
//上面步骤成功将b节点链接到了parent上
//先把parent的父节点保存起来,不管存在不存在
Node* ppNode = parent->_parent;
//接下来就是把parent按下了,成为subR的左孩子,让subR成为新根
subR->_left = parent;
parent->_parent = subR;
//让subR成为新根
if (ppNode == nullptr)
{
_root = subR;
_root->_parent = nullptr;
}
else
{
if (ppNode->_left = parent)
{
ppNode->_left = subR;
}
else
{
ppNode->_right = subR;
}
subR->_parent = ppNode;
}
//修改平衡因子
parent->_bf = subR->_bf = 0;
}
③新节点插入较高左子树的右侧---左右:先左单旋再右单旋
这种情况是新增的节点位于比较高的左子树的右侧的某个位置上,此时在往上检查平衡因子发现值为parent节点的平衡因子为-2,说明左子树的高度是比右子树高的(这里选择右减左),所以当我们的判断条件if(parent->_bf==-2 && cur->_bf == 1)成立时,就表示着符合当前情况。这种情况采取的旋转方式是先左旋后右旋。左旋的轴是subL节点,右旋的轴就是parent节点。
此时,我们复用左单旋和右单旋的情况即可。但是需要注意的是,尽管在右单旋和左单旋中,已经对平衡因子进行了修改,但我们通过画图可以看出来,修改过的平衡因子并不符合实际上的值,因此我们需要重新修改一遍。
代码如下:
void RotateLR(Node* parent)
{
Node* subL = parent->_left;
Node* subLR = subL->_right;
int bf = subLR->_bf;//记录调整节点之前,subLR的平衡因子,因为subLR最后是新根
//开始调整
RotateL(parent->_left);
RotateR(parent);
//修改平衡因子
if (bf == -1)//说明是在左子树上新增节点,即图中的b子树
{
parent->_bf = 1;
subL->_bf = 0;
subLR->_bf = 0;
}
else if (bf == 1)//说明是在右子树c上新增节点
{
parent->_bf = 0;
subL->_bf = -1;
subLR->_bf = 0;
}
else if(bf==0)//说明subLR自己就是新增的节点
{
parent->_bf = 0;
subL->_bf = 0;
subLR->_bf = 0;
}
else
{
assert(false);
}
}
④新节点插入较高右子树的左侧---右左:先右单旋再左单旋
这种情况是新增的节点位于比较高的右子树的左侧的某个位置上,此时在往上检查平衡因子发现值为parent节点的平衡因子为2,说明右子树的高度是比左子树高的(这里选择右减左),所以当我们的判断条件if(parent->_bf==2 && cur->_bf == -1)成立时,就表示着符合当前情况。这种情况采取的旋转方式是先右旋后左旋。右旋的轴是subR节点,左旋的轴就是parent节点。
此时,我们复用左单旋和右单旋的情况即可。但是需要注意的是,尽管在右单旋和左单旋中,已经对平衡因子进行了修改,但我们通过画图可以看出来,修改过的平衡因子并不符合实际上的值,因此我们需要重新修改一遍。
代码如下:
void RotateRL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
int bf = subRL->_bf;//记录调整节点之前,subRL的平衡因子,因为subRL最后是新根
RotateR(parent->_right);
RotateL(parent);
if (bf == 1) //在右子树上新增节点
{
parent->_bf = -1;
subR->_bf = 0;
subRL->_bf = 0;
}
else if (bf == -1) //在左子树上新增节点
{
parent->_bf = 0;
subR->_bf = -1;
subRL->_bf = 0;
}
else if (bf == 0) //说明subRL本身就是那个新增的节点
{
parent->_bf = 0;
subR->_bf = 0;
subRL->_bf = 0;
}
else
{
assert(false);
}
}
总结:
假如以pParent为根的子树不平衡,即pParent的平衡因子为2或者-2,分以下情况考虑:
①pParent的平衡因子为2,说明pParent的右子树高,设pParent的右子树的根为pSubR。
当pSubR的平衡因子为1时,执行左单旋
当pSubR的平衡因子为-1时,执行右左双旋
②pParent的平衡因子为-2,说明pParent的左子树高,设pParent的左子树的根为pSubL
当pSubL的平衡因子为-1是,执行右单旋
当pSubL的平衡因子为1时,执行左右双旋
旋转完成后,原pParent为根的子树个高度降低,已经平衡,不需要再向上更新。
验证AVL树
由于AVL树是在二叉搜索树的基础上加了平衡性后得到的树,因此需要确认一棵树是AVL树,那么就需要以下两步:
1.先确定是否是一棵二叉搜索树:如果中序遍历可得到一个有序的序列,就说明为二叉搜索树。
2.验证其是否平衡:①每个节点子树高度差的绝对值不超过1(注意节点中如果没有平衡因子)。②节点的平衡因子是否计算正确。
代码如下:
①中序遍历:
void Inorder()
{
_Inorder(_root);
}
void _Inorder(Node* root)
{
if (root == nullptr)
return;
_Inorder(root->_left);
cout << root->_kv.first << ": " << root->_kv.second << endl;
_Inorder(root->_right);
}
②计算高度:
int Height(Node* root)
{
if (root == nullptr)
{
return 0;
}
//先计算左子树的高度
int ln = Height(root->_left);
//然后计算右子树的高度
int rn = Height(root->_right);
return ln > rn ? ln + 1 : rn + 1;
}
③验证平衡:
bool IsBalance()
{
return _IsBalance(_root);
}
bool _IsBalance(Node* root)
{
if (root == nullptr)
return true;
//计算当前节点root的平衡因子
int leftHeight = Height(root->_left);
int rightHeight = Height(root->_right);
//如果不同,那就将当前节点的值打印出来,并提升异常
if (rightHeight - leftHeight != root->_bf)
{
cout << root->_kv.first << "平衡因子异常" << endl;
return false;
}
//通过递归,验证每一个节点的平衡因子是否符合
return abs(rightHeight - leftHeight) < 2
&& _IsBalance(root->_left)
&& _IsBalance(root->_right);
}
AVL树性能
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即log_2 (N)。
但是如果要对AVL树做一些结构修改的操作,性能非常低下,因为做修改就很大可能需要进行旋转,每一次旋转都是比较消耗性能的!