系列文章目录
二叉树搜索树
map和set习题
文章目录
- 系列文章目录
- 前言
- 一、关联式容器
- 键值对
- 二、树形结构的关联式容器
- 2.1 set
- 2.1.1 set的介绍
- 2.1.3 set的使用
- 删除节点
- find的不同效率
- count举例
- lower_bound 和 upper_bound
- 2.2 multiset
- 2.2.1 区别:
- find查找
- erase删除
- equal_range
- 2.3 map
- 2.3.1 map的介绍
- 2.3.2 map的使用
- 构造map对象
- 使用迭代器迭代map对象
- 模型举例
- map中的`operator[]`和 `at()`
- 2.4 multimap
前言
vector
、list
是序列式容器。本章介绍的是关联式容器map
和set
.它们的底层是用红黑树实现的。
关于怎么使用这里俩个容器,实际上和string一样 。我们只介绍要注意的地方。
一、关联式容器
在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面 存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>
结构的键值对,在数据检索时比序列式容器效率更高。
键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key
和value
,key
代表键值,value
表示与key
对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。
STL库中有关于键值对:
pair
SGI-STL中关于键值对的定义:
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair(): first(T1()), second(T2())
{}
pair(const T1& a, const T2& b): first(a), second(b)
{}
};
二、树形结构的关联式容器
根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:map
、set
、multimap
、multiset
。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。
2.1 set
2.1.1 set的介绍
set文档介绍
翻译:
- set是按照一定次序存储元素的容器
- 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
- 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
- set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
- set在底层是用二叉搜索树(红黑树)实现的。
注意:
- 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
- set中插入元素时,只需要插入value即可,不需要构造键值对(pair(T1,T2))。
- set中的元素不可以重复(因此可以使用set进行去重)。
- 使用set的迭代器遍历set中的元素,可以得到有序序列
- set中的元素默认按照小于来比较
- set中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
- set中的元素不允许修改(为什么?)
- set中的底层使用二叉搜索树(红黑树)来实现。
既然set式默认按照小于来比较的,那么有什么办法按照大于来比较呢?
Compare仿函数比较器默认使用的式less<T>
. 二叉树搜索树时我们使用的是:
if (cur->_data < data)
//比根大往右找
cur = cur->_right;
else if (cur->_data > data)
//比根小往左找
cur = cur->_left;
实际上将逻辑反过来就可以按照大于来比较。
if (cur->_data > data)
//比根小往右找
cur = cur->_right;
else if (cur->_data < data)
//比根大往左找
cur = cur->_left;
2.1.3 set的使用
-
set的模板参数列表:|
T: set中存放元素的类型,实际在底层存储<value, value>的键值对。
Compare:set中元素默认按照小于来比较.
Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理. -
set的构造
函数声明 | 功能介绍 |
---|---|
set (const Compare& comp = Compare(), const Allocator&= Allocator() ); | 构造空的set |
set (InputIterator first, InputIterator last, constCompare& comp = Compare(), const Allocator& =Allocator() ); | 用[first, last)区间中的元素构造set |
set ( const set<Key,Compare,Allocator>& x); | set的拷贝构造 |
- set的迭代器
函数声明 | 功能介绍 |
---|---|
iterator begin() | 返回set中起始位置元素的迭代器 |
iterator end() | 返回set中最后一个元素后面的迭代器 |
const_iterator cbegin()const | 返回set中起始位置元素的const迭代器 |
const_iterator cend() const | 返回set中最后一个元素后面的const迭代器 |
reverse_iterator rbegin() | 返回set第一个元素的反向迭代器,即end |
reverse_iterator rend() | 返回set最后一个元素下一个位置的反向迭代器,即rbegin |
const_reverse_iterator crbegin() const | 返回set第一个元素的反向const迭代器,即cend |
const_reverse_iterator crend() const | 返回set最后一个元素下一个位置的反向const迭代器,即crbegin |
- set的容量
函数声明 | 功能介绍 |
---|---|
bool empty ( ) const | 检测set是否为空,空返回true,否则返回true |
size_type size() const | 返回set中有效元素的个数 |
- set修改操作
函数声明 | 功能介绍 |
---|---|
pair<iterator,bool> insert (const value_type& x ) | 在set中插入元素x,实际插入的是<x, x>构成的键值对,如果插入成功,返回<该元素在set中的位置,true>,如果插入失败,说明x在set中已经存在,返回<x在set中的位置,false> |
void erase ( iterator position ) | 删除set中position位置上的元素 |
size_type erase ( const key_type& x ) | 删除set中值为x的元素,返回删除的元素的个数 |
void erase ( iterator first, iterator last ) | 删除set中[first, last)区间中的元素 |
void swap (set<Key,Compare,Allocator>& st ); | 交换set中的元素 |
void clear ( ) | 将set中的元素清空 |
iterator find ( const key_type& x ) const | 返回set中值为x的元素的位置 |
size_type count ( const key_type& x ) const | 返回set中值为x的元素的个数 |
- set的使用举例
删除节点
删除最小的节点:
#include <set>
#include <iostream>
using namespace std;
int main()
{
set<int> s; // set is a binary search tree
s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
//迭代器遍历
set<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " "; it++;
}
cout << endl;
//删除最小元素,就是最左边的节点,即begin()
s.erase(s.begin());
//范围for遍历
for (auto x : s)
cout << x << " ";
cout << endl;
}
如果使用值方式去删除时,删除元素存在就会删除,不存在不做处理。可以使用删除函数的返回值进行判断是否删除成功。
set<int> s; // set is a binary search tree
s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
set<int> s; // set is a binary search tree
s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
//迭代器遍历
set<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " "; it++;
}
cout << endl;
int x;
cin >> x;
int num = s.erase(x);
if (num == 0)
cout << "删除元素不存在" << endl;
//范围for遍历
for (auto x : s)
cout << x << " ";
cout << endl;
如果使用find()
来删除,元素不存在则会报错,find()
找到了会返回这个位置的迭代器,没有找到会返回end()
;
set<int> s; // set is a binary search tree
s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
//迭代器遍历
set<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " "; it++;
}
cout << endl;
//find删除
s.erase(s.find(30));
//范围for遍历
for (auto x : s)
cout << x << " ";
cout << endl;
s.erase(s.find(1));
所以使用find时最好使用:
//find删除
auto pos = s.find(30);
if(pos !=s.end())
{
s.erase(pos);
}
else
cout << "元素不存在" << endl;
find的不同效率
搜索二叉树中的find
和 普通算法中的find
效率不一样。
搜索二叉树中的是按照 它的规则来的效率是 O(log2N).
而普通算法遍历的是迭代器,效率是:O(N)
count举例
#include <set>
void TestSet()
{
// 用数组array中的元素构造set
int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 6, 8, 0 };
set<int> s(array, array+sizeof(array)/sizeof(array));
cout << s.size() << endl;
// 正向打印set中的元素,从打印结果中可以看出:set可去重
for (auto& e : s)
cout << e << " ";
cout << endl;
// 使用迭代器逆向打印set中的元素
for (auto it = s.rbegin(); it != s.rend(); ++it)
cout << *it << " ";
cout << endl;
// set中值为3的元素出现了几次
cout << s.count(3) << endl;
}
count 的效率是:O(log2N)
lower_bound 和 upper_bound
lower_bound
返回 >= val
的位置。
upper_bound
返回 > val
的位置。
例如:
// set::lower_bound/upper_bound
#include <iostream>
#include <set>
int main ()
{
std::set<int> myset;
std::set<int>::iterator itlow,itup;
for (int i=1; i<10; i++) myset.insert(i*10); // 10 20 30 40 50 60 70 80 90
itlow=myset.lower_bound (30); // >= 30 的位置,即30位置
itup=myset.upper_bound (60); // >60 的位置,即70的位置
//然后删除[30,70)之间的元素
myset.erase(itlow,itup); // 10 20 70 80 90
std::cout << "myset contains:";
for (std::set<int>::iterator it=myset.begin(); it!=myset.end(); ++it)
std::cout << ' ' << *it;
std::cout << '\n';
return 0;
}
传的值可以不为set中的元素:
2.2 multiset
multiset
和set
的区别就在于multiset
允许键值冗余。
它就不会去重了。相同的元素会保留下来。
那么在结构中,插入一个相同的值它会插入在哪呢?
相同的元素会集中到一块:
这样实际上会发生旋转,但是目前我们了解一下。到底层实现会更加清楚。
相等的值继续插入,插入在左边或者右边都可以,因为旋转后,插入在右边,也可能会旋转到左边。
2.2.1 区别:
find查找
1、find
查找x
时,多个x
在树中,返回中序第一个x
.
相等的一定是连续的:
int main()
{
multiset<int> s; s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
s.insert(40); s.insert(40); s.insert(40);
for (auto x : s) cout << x << " "; cout << endl;
auto pos = s.find(40);
while (pos != s.end() && *pos == 40)
{
cout << *pos << " "; pos++;
}
return 0;
}
这里使用count
就很方便.
erase删除
那么erase是全删呢,还是一个呢?
我们验证一下:
int main()
{
multiset<int> s; s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
s.insert(40); s.insert(40); s.insert(40);
for (auto x : s) cout << x << " "; cout << endl;
s.erase(40);
for (auto x : s) cout << x << " "; cout << endl;
return 0;
}
说明是全部删除,那么这里就有迭代器失效的问题。
删除掉元素后,之后的节点也删除了。那么迭代器++就不能获取到后面的元素。
所以C++98
中的erase
没有返回值:
要解决也比较简单,提前记录好删除完之后的节点即可。
C++11
中有返回值:
equal_range
该函数,用于找到相同元素的区间。返回值值是一个键值对。键值对的第一个元素first是左区间.
第二个元素是second是右区间(相同元素的后一个),注意是左闭右开.
// multiset::equal_elements
#include <iostream>
#include <set>
typedef std::multiset<int>::iterator It; // aliasing the iterator type used
int main ()
{
int myints[]= {77,30,16,2,30,30};
std::multiset<int> mymultiset (myints, myints+6); // 2 16 30 30 30 77
std::pair<It,It> ret = mymultiset.equal_range(30); // ^ ^
mymultiset.erase(ret.first,ret.second);
std::cout << "mymultiset contains:";
for (It it=mymultiset.begin(); it!=mymultiset.end(); ++it)
std::cout << ' ' << *it;
std::cout << '\n';
return 0;
}
2.3 map
2.3.1 map的介绍
map的文档简介
翻译:
- map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
- 在map中,键值key通常用于排序和惟一地标识元素,而值
value
中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key
与value
通过成员类型value_type
绑定在一起,为其取别名称为pair: typedef pair<const key, T> value_type
; - 在内部,map中的元素总是按照键值key进行比较排序的。
- map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序
对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。 - map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
- map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。
2.3.2 map的使用
-
map的模板参数说明
key: 键值对中key的类型
T: 键值对中value的类型
Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器
注意:在使用map时,需要包含头文件。 -
map的构造
函数声明 | 功能介绍 |
---|---|
map() | 构造一个空的map |
- map的迭代器
函数声明 | 功能介绍 |
---|---|
begin() 和 end() | begin:首元素的位置,end最后一个元素的下一个位置 |
cbegin()和cend() | 与begin和end意义相同,但cbegin和cend所指向的元素不能修改 |
rbegin()和rend() | 反向迭代器,rbegin在end位置,rend在begin位置,其++和–操作与begin和end操作移动相反 |
crbegin()和crend() | 与rbegin和rend位置相同,操作相同,但crbegin和crend所指向的元素不能修改 |
- map的容量与元素访问
函数声明 | 功能介绍 |
---|---|
bool empty ( ) const | 检测map中的元素是否为空,是返回true,否则返回false |
size_type size() const | 返回map中有效元素的个数 |
mapped_type& operator[] (const key_type& k) | 返回去key对应的value |
问题:当key不在map中时,通过operator获取对应value时会发生什么问题?
注意:在元素访问时,有一个与operator[]
类似的操作at()(
该函数不常用)函数,都是通过key
找到与key对应的value然后返回其引用,不同的是:当key不存在时,operator[]
用默认value
与key
构造键值对然后插入,返回该默认value,at()函数直接抛异常。
- map中元素的修改
函数声明 | 功能介绍 |
---|---|
pair<iterator,bool> insert ( const value_type& x ) | 在map中插入键值对x,注意x是一个键值对,返回值也是键值对:iterator代表新插入元素的位置,bool代表释放插入成功 |
void erase ( iterator position ) | 删除position位置上的元素 |
size_type erase ( const key_type& x ) | 删除键值为x的元素 |
void erase ( iterator first, iterator last ) | 删除[first, last)区间中的元素 |
void swap ( map<Key,T,Compare,Allocator>& mp ) | 交换两个map中的元素 |
void clear ( ) | 将map中的元素清空 |
iterator find ( const key_type& x ) | 在map中插入key为x的元素,找到返回该元素的位置的迭代器,否则返回end |
const_iterator find ( const key_type& x ) const | 在map中插入key为x的元素,找到返回该元素的位置的const迭代器,否则返回cend |
size_type count ( const key_type& x ) const | 返回key为x的键值在map中的个数,注意map中key是唯一的,因此该函数的返回值要么为0,要么为1,因此也可以用该函数来检测一个key是否在map中 |
构造map对象
由于map对象是使用键值对的方式进构建的,所以有以下几种构建方式:
map<string, string> dict1;
pair<string, string> kv1("left","左边"); //有名对象初始化
dict1.insert(kv1);
dict1.insert(pair<string, string>("right", "右边")); //匿名对象初始化
dict1.insert(make_pair("insert","插入")); //make_pair初始化
dict1.insert({ "string", "字符串" }); //初始化列表初始化,多参数构造隐式类型转化
map<string, string> dict2{ {"up","上面"},{"down","下面"}}; //initializer list初始化
使用迭代器迭代map对象
由于键值对pair
没有支持 <<
和>>
的重载。
所以使用下面方式进行迭代是不行的:
//map<string,string>::iterator it = dict1.begin();
auto it = dict1.begin();
while (it != dict1.end())
{
cout << (*it) << endl;
it++;
}
但是pair
支持获取到它的俩个成员first
和 second
:
map<string, string> dict1;
pair<string, string> kv1("left","左边"); //有名对象初始化
dict1.insert(kv1);
dict1.insert(pair<string, string>("right", "右边")); //匿名对象初始化
dict1.insert(make_pair("insert","插入")); //make_pair初始化
dict1.insert({ "string", "字符串" }); //初始化列表初始化,多参数构造隐式类型转化
map<string, string> dict2{ {"up","上面"},{"down","下面"}}; //initializer list初始化
//map<string,string>::iterator it = dict1.begin();
auto it = dict1.begin();
while (it != dict1.end())
{
cout << (*it).first << ":" << (*it).second << endl;
it++;
}
结果:
可以发现同样是按照字典序的排序方式进行输出。
当时使用最多的是使用it->first
和it->second
.调用的是迭代器模式的,operator->()
使用范围for
注意要使用&
,因为全是深拷贝,所以要高效率.
for(const auto& e : dict1)
{
cout << e.first << ":" << e.second << endl;
}
C++17 以后可以如下进行遍历:
for(auto& [x,y] : dict1)
{
cout << x << ":" << y << endl;
}
模型举例
这样之后就可以创建kv模型(简单字典):
int main()
{
map<string, string> dict1;
pair<string, string> kv1("left", "左边"); //有名对象初始化
dict1.insert(kv1);
dict1.insert(pair<string, string>("right", "右边")); //匿名对象初始化
dict1.insert(make_pair("insert", "插入")); //make_pair初始化
dict1.insert({ "string", "字符串" }); //初始化列表初始化,多参数构造隐式类型转化
string str;
while (cin >> str)
{
auto ret = dict1.find(str);
if (ret != dict1.end())
cout << "->" << ret->second << endl;
else
cout << "没有该单词" << endl;
}
return 0;
}
也可以统计次数:
int main()
{
// 统计水果出现的次数
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
map<string, int> countTree;
for (const auto& str : arr)
{
// 先查找水果在不在搜索树中
// 1、不在,说明水果第一次出现,则插入<水果, 1>
// 2、在,则查找到的节点中水果对应的次数++
//map<string, int>* ret = countTree.find(str);
auto ret = countTree.find(str);
if (ret == countTree.end())
countTree.insert({ str, 1 });
else
ret->second++;
}
for (const auto& e : countTree)
{
cout << e.first << ":" << e.second << endl;
}
return 0;
}
map中的operator[]
和 at()
opeartor[]
:
翻译:
如果k与容器中某个元素的键匹配,则函数返回其映射值的引用。
如果k与容器中任何元素的键都不匹配,则函数插入一个带有该键的新元素,并返回其映射值的引用。请注意,即使没有为该元素分配映射值(该元素使用其默认构造函数构造),这始终会使容器的大小增加一个。
一个类似的成员函数,map::at,在键存在的情况下具有相同的行为,但在键不存在时会引发异常。
调用此函数等同于: (*((this->insert(make_pair(k, mapped_type()))).first)).second
我们只需要传k
,而它调用insert
使用了 匿名对象. C++对内置类型进行升级,int()
默认是初始化为0
使用了insert()
的返回值:
翻译返回值解释:
单元素版本(1)返回一对值,其中其成员pair::first
被设置为指向新插入元素或映射中具有等效键的元素的迭代器。pair::second
元素设置为true
,如果插入了新元素,则设置为true
,如果等效键已经存在,则设置为false
。
也就是说:
1.插入成功,指向新插入的节点,bool
为true
2.插入失败,指向相同元素的节点,bool
为false
有了这一个特性,那么operator[]
就可以获取到该元素的value
:
类似于:
V& operator[](const K& key)
{
pair<iterator,bool> ret = insert(make_pair(key,V()));
iterator it = ret.first;
return it->second;
}
那么下面的程序就是使用了该特性
int main()
{
map<string, string> dict;
dict.insert(make_pair("left", "左边"));
// 查找
cout << dict["left"] << endl;
// 插入 + 修改
dict["right"] = "右边";
// 查找
cout << dict["right"] << endl;
// 修改
dict["left"] = "左边、剩余";
// 查找
cout << dict["left"] << endl;
//插入
dict["insert"];
// 查找
cout << dict["insert"] << endl;
return 0;
}
可以通过调试窗口进行查看.
int main()
{
// 统计水果出现的次数
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
map<string, int> countTree;
for (const auto& str : arr)
countTree[str]++;
for (const auto& e : countTree)
cout << e.first << ":" << e.second << endl;
return 0;
}
2.4 multimap
multimap文档介绍
翻译:
- Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key,value>,其中多个键值对之间的key是可以重复的。
- 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
- 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
- multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
- multimap在底层用二叉搜索树(红黑树)来实现。
注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。
int main()
{
map<string,string> dict;
dict.insert(make_pair("sort","排序"));
dict.insert(make_pair("sort","xxx"));//插入失败不会进行修改
multimap<string,string> dict2;
dict.insert(make_pair("sort","排序"));
dict.insert(make_pair("sort","xxx"));//插入成功,属于新增的节点
dict.insert(make_pair("sort","排序"));//插入成功,属于新增的节点
return 0;
}
所以multimap
不提供operator[]
有多个key,不知道返回哪个.
如果你有所收获,可以留下你的点赞和关注,谢谢你的观看!!!