C++笔记---二叉搜索树

1. 二叉搜索树的概念

二叉搜索树又称二叉排序树，它或者是一棵空树，或者是具有以下性质的二叉树:

• 若它的左子树不为空，则左子树上所有结点的值都小于等于根结点的值。

• 若它的右子树不为空，则右子树上所有结点的值都大于等于根结点的值。

• 它的左右子树也分别为二叉搜索树。

• 二叉搜索树中可以支持插入相等的值，也可以不支持插入相等的值，具体看使用场景定义，后续我们学习map/set/multimap/multiset系列容器底层就是二叉搜索树，其中map/set不支持插入相等值，multimap/multiset支持插入相等值。

除了支不支持插入相同的值以外，二叉搜索树还可以按照其带的值分为两类：key和key/value。

key：只带一个值key

key/value：带两个相绑定的值，构建二叉树与进行查找时都以key为准。

这两种搜索二叉树的实现大同小异，接下来的介绍中我们以key类型为例，key/value类型的只需要在结点的结构中加上value即可(函数随之微调)。

2. 二叉搜索树的性能分析

二叉搜索树查找的时间复杂度与其高度相同。

最优情况下，二叉搜索树为完全二叉树(或者接近完全二叉树)，其高度为： $O(log_{2}N)$

最差情况下，二叉搜索树退化为单支树(或者类似单支)，其高度为： $O(N/2)$

所以综合而言二叉搜索树增删查改时间复杂度为： $O(N)$

那么这样的效率显然是无法满足我们需求的，为了使二叉搜索树的搜索效率足够高，我们需要使得二叉搜索树尽可能地接近完全二叉树，于是就有了我们之后会讲到的平衡二叉搜索树，以及AVL树和红黑树等。

另外需要说明的是，二分查找也可以实现 O(logN) 级别的查找效率，但是二分查找有两大缺陷：

1. 需要存储在支持下标随机访问的结构中，并且有序。

2. 插入和删除数据效率很低，因为存储在下标随机访问的结构中，插入和删除数据一般需要挪动数据。这里也就体现出了平衡二叉搜索树的价值。

3. 二叉搜索树的实现

3.1 结点定义及二叉搜索树类的框架

template<class K>
struct BSTreeNode
{
	K _key;
	BSTreeNode<K, V>* _left;
	BSTreeNode<K, V>* _right;

	BSTreeNode(const K& key)
		:_key(key)
		,_left(nullptr)
		,_right(nullptr)
	{}
};

template<class K>
class BSTree
{
	typedef BSTreeNode<K> Node;
public:
    //强制生成默认构造
	BSTree() = default;
    //拷贝构造
	BSTree(const BSTree& tree);
    //析构
	~BSTree();
    //赋值重载
	BSTree& operator=(BSTree tree);
    //插入
	bool Insert(const K& key);
	//查找
	Node* Find(const K& key);
    //删除
	bool Erase(const K& key);
	//中序遍历
	void InOrder();

private:
    //辅助拷贝构造进行递归拷贝
	Node* Construct(Node* root);
    //辅助析构函数进行递归释放结点
	void Destroy(Node* root);
    //辅助进行递归中序遍历
	void _InOrder(Node* root);

private:
	Node* _root = nullptr;
};

3.2 默认成员函数

3.2.1 构造函数

由于我们给了_root缺省值，所以编译器自动生成的默认构造函数就够用。

而拷贝构造需要我们自己实现深拷贝，即访问被拷贝的树的全部结点并拷贝链接。

对于树形结构，访问一棵树的全部结点，递归永远是最方便的选择。可是，如何在类内部设计递归函数呢？毕竟需要直接将树结点的指针作为参数才好实现递归。

这时，我们就可以选择在递归函数的外面套一层成员函数的壳。

BSTree() = default;

BSTree(const BSTree& tree)
{
	_root = Construct(tree._root);
}

Node* Construct(Node* root)
{
	if (root == nullptr)
		return nullptr;

	Node* copy = new Node(root->_key);
	copy->_left = Construct(root->_left);
	copy->_right = Construct(root->_right);
	return copy;
}

3.2.2 赋值重载

有了拷贝构造，就可以考虑现代写法：

BSTree& operator=(BSTree tree)
{
	swap(_root, tree._root);
	return *this;
}

3.2.3 析构函数

递归访问每个结点并释放，同理需要套一层外壳：

~BSTree()
{
	Destroy(_root);
	_root = nullptr;
}

void Destroy(Node* root)
{
	if (root == nullptr)
		return;

	Destroy(root->_left);
	Destroy(root->_right);
	delete root;
}

3.3 二叉搜索树的插入

1. 树为空，则直接新增结点，赋值给root指针。

2. 树不空，按二叉搜索树性质，插入值比当前结点大往右走，插入值比当前结点小往左走，找到空位置，插入新结点。

3. 如果支持插入相等的值，插入值跟当前结点相等的值可以往右走，也可以往左走，找到空位置，插入新结点。（要注意的是要保持逻辑一致性，插入相等的值不要一会往右走，一会往左走）

下面的代码是不支持插入相等的值的情形：

bool Insert(const K& key)
{
	if (_root == nullptr)
	{
		_root = new Node(key);
		return true;
	}
	
	Node* cur = _root, *parent = nullptr;
	while (cur)
	{
		parent = cur;
		if (key < cur->_key)
			cur = cur->_left;
		else if (key > cur->_key)
			cur = cur->_right;
		else
			return false;
	}

	cur = new Node(key);
	if (key < parent->_key)
		parent->_left = cur;
	else
		parent->_right = cur;

	return true;
}

3.4 二叉搜索树的查找

1. 从根开始比较，查找x，x比根的值大则往右边走查找，x比根值小则往左边走查找。

2. 最多查找高度次，走到到空，还没找到，这个值不存在。

3. 如果不支持插入相等的值，找到x即可返回。

4. 如果支持插入相等的值，意味着有多个x存在，一般要求查找中序的第一个x。如下图，查找3，要找到1的右孩子的那个3返回。

个人认为，如果支持插入相同的值，最好是把相同的值插入到右子树。这样一来，按照前序遍历找到的第一个x就是中序遍历的第一个x（两种遍历方式都是最后查找右子树）。

3.5 二叉搜索树的删除

首先查找元素是否在二叉搜索树中，如果不存在，则返回false。

如果查找元素存在则分以下四种情况分别处理：（假设要删除的结点为N）

1. 要删除结点N左右孩子均为空

2. 要删除的结点N左孩子位空，右孩子结点不为空

3. 要删除的结点N右孩子位空，左孩子结点不为空

4. 要删除的结点N左右孩子结点均不为空

对应以上四种情况的解决方案：

1. 把N结点的父亲对应孩子指针指向空，直接删除N结点（情况1可以当成2或者3处理，效果是一样的）

2. 把N结点的父亲对应孩子指针指向N的右孩子，直接删除N结点

3. 把N结点的父亲对应孩子指针指向N的左孩子，直接删除N结点

4. 无法直接删除N结点，因为N的两个孩子无处安放，只能用替换法删除。找N左子树的值最大结点LR(最右结点)或者N右子树的值最小结点RL(最左结点)替代N，因为这两个结点中任意一个，放到N的位置，都满足二叉搜索树的规则。替代N的意思就是N和R的两个结点的值交换，转而变成删除R结点，R结点符合情况2或情况3，可以直接删除。

另外，在每种情况中，都要注意判断被删除的结点是否为根结点_root，因为在删除的过程中需要记录被删除结点的父节点，而根节点没有父节点，在通用逻辑下会导致对空指针的访问。

bool Erase(const K& key)
{
	Node* del = _root, *parent = nullptr;
	while (del && del->_key != key)
	{
		parent = del;
		if (key < del->_key)
			del = del->_left;
		else
			del = del->_right;
	}
	if (del == nullptr)
		return false;

	if (del->_left == nullptr)//左结点为空（或者左右都为空）
	{
		if (parent == nullptr)//被删除的是根结点
		{
			_root = del->_right;
		}
		else if (del->_key < parent->_key)
			parent->_left = del->_right;
		else
			parent->_right = del->_right;

		delete del;
	}
	else if (del->_right == nullptr)//右结点为空且左节点不为空
	{
		if (parent == nullptr)//被删除的是根结点
		{
			_root = del->_left;
		}
		else if (del->_key < parent->_key)
			parent->_left = del->_left;
		else
			parent->_right = del->_left;

		delete del;
	}
	else//左右结点都不为空
	{
		Node* replace = del->_right;
		parent = del;
		while (replace->_left)
		{
			parent = replace;
			replace = replace->_left;
		}
		del->_key = replace->_key;
		del->_value = replace->_value;
		if (parent->_right == replace)
			parent->_right = replace->_right;
		else
			parent->_left = replace->_right;
		delete replace;
	}

	return true;
}

3.6 完整代码

template<class K>
struct BSTreeNode
{
	K _key;
	BSTreeNode<K, V>* _left;
	BSTreeNode<K, V>* _right;

	BSTreeNode(const K& key)
		:_key(key)
		,_left(nullptr)
		,_right(nullptr)
	{}
};

template<class K>
class BSTree
{
	typedef BSTreeNode<K> Node;
public:
	BSTree() = default;

	BSTree(const BSTree& tree)
	{
		_root = Construct(tree._root);
	}

	~BSTree()
	{
		Destroy(_root);
		_root = nullptr;
	}

	BSTree& operator=(BSTree tree)
	{
		swap(_root, tree._root);
		return *this;
	}

	bool Insert(const K& key)
	{
		if (_root == nullptr)
		{
			_root = new Node(key);
			return true;
		}
		
		Node* cur = _root, *parent = nullptr;
		while (cur)
		{
			parent = cur;
			if (key < cur->_key)
				cur = cur->_left;
			else if (key > cur->_key)
				cur = cur->_right;
			else
				return false;
		}

		cur = new Node(key);
		if (key < parent->_key)
			parent->_left = cur;
		else
			parent->_right = cur;

		return true;
	}

	Node* Find(const K& key)
	{
		Node* cur = _root;
		while (cur)
		{
			if (key == cur->_key)
				return cur;
			else if (key < cur->_key)
				cur = cur->_left;
			else
				cur = cur->_right;
		}

		return nullptr;
	}

	bool Erase(const K& key)
	{
		Node* del = _root, *parent = nullptr;
		while (del && del->_key != key)
		{
			parent = del;
			if (key < del->_key)
				del = del->_left;
			else
				del = del->_right;
		}
		if (del == nullptr)
			return false;

		if (del->_left == nullptr)
		{
			if (parent == nullptr)
			{
				_root = del->_right;
			}
			else if (del->_key < parent->_key)
				parent->_left = del->_right;
			else
				parent->_right = del->_right;

			delete del;
		}
		else if (del->_right == nullptr)
		{
			if (parent == nullptr)
			{
				_root = del->_left;
			}
			else if (del->_key < parent->_key)
				parent->_left = del->_left;
			else
				parent->_right = del->_left;

			delete del;
		}
		else
		{
			Node* replace = del->_right;
			parent = del;
			while (replace->_left)
			{
				parent = replace;
				replace = replace->_left;
			}
			del->_key = replace->_key;
			del->_value = replace->_value;
			if (parent->_right == replace)
				parent->_right = replace->_right;
			else
				parent->_left = replace->_right;
			delete replace;
		}

		return true;
	}

	void InOrder()
	{
		_InOrder(_root);
		cout << endl;
	}

private:
	Node* Construct(Node* root)
	{
		if (root == nullptr)
			return nullptr;

		Node* copy = new Node(root->_key);
		copy->_left = Construct(root->_left);
		copy->_right = Construct(root->_right);
		return copy;
	}

	void Destroy(Node* root)
	{
		if (root == nullptr)
			return;

		Destroy(root->_left);
		Destroy(root->_right);
		delete root;
	}

	void _InOrder(Node* root)
	{
		if (root == nullptr)
			return;

		_InOrder(root->_left);
		cout << root->_key << " ";
		_InOrder(root->_right);
	}

private:
	Node* _root = nullptr;
};

4. 二叉搜索树key和key/value的使用场景

4.1 key搜索场景

只有key作为关键码，结构中只需要存储key即可，关键码即为需要搜索到的值，搜索场景只需要判断key在不在。

key的搜索场景实现的二叉树搜索树支持增删查，但是不支持修改，因为修改key会破坏搜索树结构。

场景1：小区无人值守车库，小区车库买了车位的业主车才能进小区，那么物业会把买了车位的业主的车牌号录入后台系统，车辆进入时扫描车牌在不在系统中，在则抬杆，不在则提示非本小区车辆，无法进入。

场景2：检查一篇英文文章单词拼写是否正确，将词库中所有单词放入二叉搜索树，读取文章中的单词，查找是否在二叉搜索树中，不在则波浪线标红提示。

4.2 key/value搜索场景

每一个关键码key，都有与之对应的值value，value可以任意类型对象。

树的结构中(结点)除了需要存储key还要存储对应的value，增/删/查还是以key为关键字走二叉搜索树的规则进行比较，可以快速查找到key对应的value。

key/value的搜索场景实现的二叉树搜索树支持修改，但是同样不支持修改key，可以修改value。

场景1：简单中英互译字典，树的结构中(结点)存储key(英文)和vlaue(中文)，搜索时输入英文，则同时查找到了英文对应的中文。

场景2：商场无人值守车库，入口进场时扫描车牌，记录车牌(key)和入场时间(value)，出口离场时，扫描车牌，查找入场时间，用当前时间-入场时间计算出停车时长，计算出停车费用，缴费后抬杆，车辆离场。

场景3：统计一篇文章中单词(key)出现的次数(value)，读取一个单词，查找单词是否存在，不存在这个说明第一次出现，（单词，1），单词存在，则++单词对应的次数。

void TestBSTree()
{
    // 四个单词的简单词典
	BSTree<string, string> dict;
	dict.Insert("insert", "插入");
	dict.Insert("erase", "删除");
	dict.Insert("left", "左边");
	dict.Insert("string", "字符串");

	string str;
	while (cin >> str)
	{
		auto ret = dict.Find(str);
		if (ret)
		{
			cout << str << ":" << ret->_value << endl;
		}
		else
		{
			cout << "单词拼写错误" << endl;
		}
	}


    // 统计水果出现次数
	string strs[] = { "苹果", "西瓜", "苹果", "樱桃", "苹果", "樱桃", "苹果", "樱桃", "苹果" };
	// 统计水果出现的次
	BSTree<string, int> countTree;
	for (auto str : strs)
	{
		auto ret = countTree.Find(str);
		if (ret == nullptr)
		{
			countTree.Insert(str, 1);
		}
		else
		{
			ret->_value++;
		}
	}

	countTree.InOrder();
}

4.3 key/value版本二叉搜索树

template<class K, class V>
struct BSTreeNode
{
	K _key;
	V _value;
	BSTreeNode<K, V>* _left;
	BSTreeNode<K, V>* _right;

	BSTreeNode(const K& key, const V& value)
		:_key(key)
		,_value(value)
		,_left(nullptr)
		,_right(nullptr)
	{}
};

template<class K, class V>
class BSTree
{
	typedef BSTreeNode<K, V> Node;
public:
	BSTree() = default;

	BSTree(const BSTree& tree)
	{
		_root = Construct(tree._root);
	}

	~BSTree()
	{
		Destroy(_root);
		_root = nullptr;
	}

	BSTree& operator=(BSTree tree)
	{
		swap(_root, tree._root);
		return *this;
	}

	bool Insert(const K& key, const V& value)
	{
		if (_root == nullptr)
		{
			_root = new Node(key, value);
			return true;
		}
		
		Node* cur = _root, *parent = nullptr;
		while (cur)
		{
			parent = cur;
			if (key < cur->_key)
				cur = cur->_left;
			else if (key > cur->_key)
				cur = cur->_right;
			else
				return false;
		}

		cur = new Node(key, value);
		if (key < parent->_key)
			parent->_left = cur;
		else
			parent->_right = cur;

		return true;
	}

	Node* Find(const K& key)
	{
		Node* cur = _root;
		while (cur)
		{
			if (key == cur->_key)
				return cur;
			else if (key < cur->_key)
				cur = cur->_left;
			else
				cur = cur->_right;
		}

		return nullptr;
	}

	bool Erase(const K& key)
	{
		Node* del = _root, *parent = nullptr;
		while (del && del->_key != key)
		{
			parent = del;
			if (key < del->_key)
				del = del->_left;
			else
				del = del->_right;
		}
		if (del == nullptr)
			return false;

		if (del->_left == nullptr)
		{
			if (parent == nullptr)
			{
				_root = del->_right;
			}
			else if (del->_key < parent->_key)
				parent->_left = del->_right;
			else
				parent->_right = del->_right;

			delete del;
		}
		else if (del->_right == nullptr)
		{
			if (parent == nullptr)
			{
				_root = del->_left;
			}
			else if (del->_key < parent->_key)
				parent->_left = del->_left;
			else
				parent->_right = del->_left;

			delete del;
		}
		else
		{
			Node* replace = del->_right;
			parent = del;
			while (replace->_left)
			{
				parent = replace;
				replace = replace->_left;
			}
			del->_key = replace->_key;
			del->_value = replace->_value;
			if (parent->_right == replace)
				parent->_right = replace->_right;
			else
				parent->_left = replace->_right;
			delete replace;
		}

		return true;
	}

	void InOrder()
	{
		_InOrder(_root);
		cout << endl;
	}

private:
	Node* Construct(Node* root)
	{
		if (root == nullptr)
			return nullptr;

		Node* copy = new Node(root->_key, root->_value);
		copy->_left = Construct(root->_left);
		copy->_right = Construct(root->_right);
		return copy;
	}

	void Destroy(Node* root)
	{
		if (root == nullptr)
			return;

		Destroy(root->_left);
		Destroy(root->_right);
		delete root;
	}

	void _InOrder(Node* root)
	{
		if (root == nullptr)
			return;

		_InOrder(root->_left);
		cout << root->_key << ":" << root->_value << " ";
		_InOrder(root->_right);
	}

private:
	Node* _root = nullptr;
};