[本节目标]
-
关联式容器
-
键值对
-
树形结构的关联式容器
-
底层结构
🏷️ 关联式容器
序列式容器:vector list 栈 队列 (类似以前学习的线性表)…
关联式容器: map set …
关联式容器,数据与数据之间有很强的关联,并不是单纯的存储数据
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>
结构的键值对,在数据检索时比序列式容器效率更高。
🏷️ 键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key
和value
,key
代表键值,value
表示与key
对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。
🏷️ 树形结果的关联式容器
根据应用场景的不同,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结
构的关联式容器主要有四种:map、set、multimap、multiset
。这四种容器的共同点是:使
用平衡搜索树(即红黑树) 作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一
个容器。
📌 set
set 是 key搜索模型的容器,用来判断在不在的,所以我们可以增加,删除,查看,但是没有修改
来,我们浅浅感受一下set
#include <iostream>
#include <set>
using namespace std;
void test_set1()
{
set<int> s;
s.insert(5);
s.insert(2);
s.insert(6);
s.insert(1);
s.insert(1);
s.insert(2);
s.insert(5);
s.insert(5);
// 遍历方法使用迭代器
set<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl;
}
int main()
{
test_set1();
return 0;
}
上面👆🏻代码的运行结果是:
1 2 5 6
观察这个结果,我们可以知道,底层是搜索树,走的是中序遍历,不会往里面插入重复的值,
✏️ 我们在这里提一下:pair
我们通过刚才的的实验知道,insert
不会插入重复的元素,如果是重复的元素,insert 函数会返回 false
但是我们这里没法使用 bool
值来接收它的放回值,因为这里的insert
函数的返回值并不是只返回了bool
set : insert 函数的返回值
❓ 那什么是pair?
这也就意味着我们可以这样来接收insert
函数的返回值:
pair< set<int>::iterator, bool> ret1 = s.insert(5);
// 打印:
cout << ret1.second << endl; // 取到这个 bool 值
这里我们也可以简写:
auto ret2 = s.insert(5);
cout << ret2.second << endl;
✏️ 回到我们的 set
我们除了用迭代器来遍历,我们同样也可以使用范围 for
// 范围 for
for (auto e : s)
{
cout << e << " ";
}
cout << endl;
栈不能用范围 for 。因为栈没有迭代器。范围 for 的底层是替换成迭代器,只要支持迭代器就支持范围 for
✏️ erase 删除
举个例子,比如我们要把 2
给删除了
方式一:s.erase(2)
方式二 :
set<int>::iterator it = s.find(2);
if (it != s.end())
{
s.erase(it);
}
cout << endl;
find函数
的返回值是一个迭代器,如果找到了 就返回指向当前元素的迭代器,如果没找到就返回 end
如果是删除的一个不存在的值:比如
s.erase(1000) // 1000 不在我们的set<int> s之中,但是,这样写程序也不会崩溃,不会有任何事情发生
✏️ lower_bound
, upper_bound
函数
void test_set2()
{
set<int> myset;
set<int>::iterator itlow, itup;
for (int i = 1; i < 10; i++)
{
myset.insert(i * 10);
}
itlow = myset.lower_bound(30); // >= val值位置的 iterator
itup = myset.upper_bound(60); // > val值位置的 iterator
myset.erase(itlow, itup);
for(auto e:myset)
{
cout << e << " ";
}
}
lower_bound(val)
: 返回的是:值 >= val 位置的 迭代器
upper_bound(val)
: 返回的是:值 > val 位置的 迭代器
✏️ equal_range函数
// set::equal_elements
#include <iostream>
#include <set>
int main ()
{
std::set<int> myset;
for (int i=1; i<=5; i++) myset.insert(i*10); // myset: 10 20 30 40 50
std::pair<std::set<int>::const_iterator,std::set<int>::const_iterator> ret;
ret = myset.equal_range(30);
std::cout << "the lower bound points to: " << *ret.first << '\n';
std::cout << "the upper bound points to: " << *ret.second << '\n';
return 0;
}
运行结果:
the lower bound points to: 30
the upper bound points to: 40
这个函数的返回值类型也是:pair
类型,其中first
是 >= val 的值,second
是 > val 的值
注意: set 不支持 修改
✏️ multiset
set: 排序 + 去重 ,可以查找在不在
multiset: 排序 但是不去重
void test_set4()
{
multiset<int> s;
s.insert(5);
s.insert(2);
s.insert(6);
s.insert(1);
s.insert(1);
s.insert(2);
s.insert(5);
s.insert(5);
multiset<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl;
}
这段代码运行结果:
1 1 2 2 5 5 5 6
这个 multiset 也是走的中序。
❓ 来看看这个 multiset 的迭代器,如果有多个值,那我们返回哪个值呢?
void test_set4()
{
multiset<int> s;
s.insert(5);
s.insert(2);
s.insert(6);
s.insert(1);
s.insert(1);
s.insert(2);
s.insert(5);
s.insert(5);
multiset<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl;
// 如果有多个2,Find 返回中序的第一个 2
it = s.find(2);
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl;
}
如果有多个值,Find 返回中序的第一 个val
🧲 equal_range 在 muliset 中的使用:
比如你想把下面代码中所有的 2 都删除掉
void test_set4()
{
multiset<int> s;
s.insert(5);
s.insert(2);
s.insert(6);
s.insert(1);
s.insert(1);
s.insert(2);
s.insert(5);
s.insert(5);
multiset<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl;
// 目的是把所有的 2 都删除掉,我们可以这样做:
auto ret = s.equal_range(2);
s.erase(ret.first, ret.second);
// 打印删除之后的结果
for (auto e : s)
{
cout << e << " ";
}
cout << endl;
}
上面👆🏻代码中equal_range(2)
,first
是 >= 2
的值,second
是 > 2
的值,类比到数学中的区间就是:
[>=2, >2)
❓ 如果我在 multiset 容器里使用(结合上面代码):s.erase(2)
它是删一个 2 还是把所有的 2全部删除?
void test_set4()
{
multiset<int> s;
s.insert(5);
s.insert(2);
s.insert(6);
s.insert(1);
s.insert(1);
s.insert(2);
s.insert(5);
s.insert(5);
multiset<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl;
s.erase(2);
for (auto e : s)
{
cout << e << " ";
}
cout << endl;
}
运行上面👆🏻的代码,我们发现它是全删的。
📌map
我们先来简单的创建一个map
类型的 dict
(这是字典的英文缩写)我们想要用 map 来实现一个简单的字典的功能,比如:sort 是 排序的意思。 insert 是插入的意思
void test_map1()
{
map<string, string> dict;
}
int main()
{
test_map1();
return 0;
}
那我们如何向里面插入数据呢?
✏️ map 如何插入数据?
我们看到map
的相关知识:
所以我们可以这样插入:
dict.insert( pair<string, string>("sort", "排序") );
dict.insert( pair<string, string>("insert", "插入") );
dict
:这是一个std::map
类型的变量,用于存储键值对。insert
:这是std::map
的成员函数,用于向映射中插入一个元素。pair<string, string>
:这是std::pair
类型的一个实例,用于表示键值对。"sort"
:这是键(key),在std::map
中,键是唯一的,用于查找元素。"排序"
:这是值(value),与键相关联的数据。
🧲 除了上面的那种插入方式之外,我们还可以使用make_pair
来进行插入
看代码:
dict.insert( make_pair("right", "右边") );
dict.insert( make_pair("left", "左边") );
什么是make_pair
❓
std::make_pair
是 C++ 标准库中的一个函数模板,它用来创建一个 std::pair
对象。std::pair
是一个模板类,用于存储一个包含两个元素的组合,这两个元素可以是不同的类型。std::make_pair
函数简化了 std::pair
对象的创建过程,使得代码更加清晰和易于理解
std::make_pair
的基本语法如下:
std::make_pair(T1 a, T2 b);
- T1 和 T2 是模板参数,表示两个元素的类型。
- a 是第一个元素的值。
- b 是第二个元素的值。
返回值:
std::make_pair
返回一个 std::pair<T1, T2>
类型的对象,其中 T1
和 T2
是自动推断的类型。
简单来说,使用make_pair
我们就可以不用写具体的类型了,这个函数模板会自动的推断类型
✏️ 遍历
迭代器遍历
map<string, string>::iterator it = dict.begin();
while (it != dict.end())
{
cout << (*it).first << ":";
cout << (*it).second << endl;
++it;
}
cout << endl;
}
范围 for 遍历
//范围 for遍历
for (auto kv : dict)
{
cout << kv.first << ":" << kv.second << endl;
}
但是上面👆🏻的写法有点小瑕疵,因为范围 for 是依次取这里dict
里面的数据,再来转换成迭代器的,然后把*it
赋值给kv
, *it
是一个 pair
类型的,这个pair
类型里面还是个string
。赋值给kv
的话,这里的string
就是一个深拷贝,代价太大了,所以我们用引用,如下:
//范围 for遍历
for (const auto &kv : dict)
{
cout << kv.first << ":" << kv.second << endl;
}
目前代码:
#include <iostream>
#include <map>
using namespace std;
void test_map1()
{
map<string, string> dict;
dict.insert(pair<string, string>("sort", "排序"));
dict.insert(pair<string, string>("insert", "插入"));
dict.insert(pair<string, string>("left", "左边"));
dict.insert(make_pair("right", "右边"));
dict.insert(make_pair("left", "左边"));
map<string, string>::iterator it = dict.begin();
while (it != dict.end())
{
cout << (*it).first << ":";
cout << (*it).second << endl;
++it;
}
cout << endl;
}
int main()
{
test_map1();
return 0;
}
map 不支持 key 的修改,但是支撑 value 的修改
✏️ 用 map来统计水果出现的次数
第一种写法:
void test_map2() // 用 map 来统计水果出现的次数
{
// 这个数组里面装的水果
string arr[] = {"苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉"};
// 用这个 map 类型的 countMap 来统计水果出现的次数
map<string, int> countMap;
for (auto &str : arr) // 用范围for来遍历这个数组
{
auto ret = countMap.find(str); // ret 是 find 函数的返回值是一个迭代器
if (ret == countMap.end()) // 满足这个条件说明 map 中没有这个水果,所以我们要插入
{
countMap.insert(make_pair(str, 1)); // 由于是第一次出现,所以 value 的值我们给 1 。
}
else
{
ret->second++; // 如果是 else,说明 map 中已经有了对应的水果了,这个时候我们要对它的数量加加
}
}
for (auto kv : countMap)
{
cout << kv.first << "出现了 " << kv.second << "次" << endl;
}
}
如果上面代码ret那里不用auto
: 因为它是个迭代器嘛
map<string, int>::iterator ret = countMap.find(str);
第二种写法----- 我们要学习到的
for (auto str : arr)
{
countMap[str]++;
}
for (auto kv : countMap)
{
cout << kv.first << "出现了 " << kv.second << "次" << endl;
}
}
这里的[ ]
是被重载了的:
-
下标操作符
[]
:在map
类型中,下标操作符[]
被重载了,它用来访问或创建map
中的键值对。当你使用countMap[str]
时,你实际上是在查找map
中key
为str
的元素。 -
查找或创建元素:如果
str
作为key
已经存在于map
中,countMap[str]
将返回key
对应的value
的引用,如果str
不存在,map
会自动创建一个新的键值对,其中key
是str
,value
是该类型的默认值(对于int
类型,默认值是0
)。
✏️ 探索一下 []
是如何实现的?
// 源代码:
mapped_type &operator[](const key_type &k)
{
return (*((this->insert(make_pair(k, mapped_type()))).first)).second;
}
也就是说,operator[]
是用 insert
来实现的。
好,那我们再来看看 map的 insert 。
这个insert
的返回值类型是一个 pair
,
-
pair::first:这个成员是一个迭代器,它指向
map
中的某个元素。如果插入操作成功地添加了一个新的元素,那么这个迭代器就指向这个新插入的元素。如果map
中已经存在一个与要插入的元素键值相等的元素,那么这个迭代器就指向那个已存在的元素。 -
pair::second:这个成员是一个布尔值,用于指示插入操作的结果。如果插入操作导致了一个新的元素被加入到
map
中,那么这个布尔值就是true
。如果因为map
中已经存在一个键值相等的元素而没有执行插入操作,那么这个布尔值就是false
。
插入成功 pair<新插入key所在节点的iterator, true>
插入失败 pair<已经存在的key所在节点的iterator,false>
这个[]
的功能相当丰富:
void test_map3()
{
map<string, string> dict;
// 插入
dict["erase"];
// 查找
cout << dict["erase"] << endl;
// 修改
dict["erase"] = "删除";
// 查找
cout << dict["erase"] << endl;
// 修改
dict["test"] = "测试";
dict["left"] = "左边、剩余";
}
下面是代码中 map
使用 []
操作符的不同用法的解释:
-
插入:
dict["erase"];
这行代码尝试在
map
中查找键为"erase"
的元素。如果找到了,它不会做任何改变。如果没有找到,它会插入一个新元素,键为"erase"
,值为默认构造的字符串,即空字符串。 -
查找:
cout << dict["erase"] << endl;
这行代码同样查找键为
"erase"
的元素。如果找到了,它会输出该元素的值。如果之前没有插入"erase"
,那么它会输出一个空字符串。 -
修改:
dict["erase"] = "删除";
这行代码查找键为
"erase"
的元素。如果找到了,它会修改该元素的值为"删除"
。如果之前没有插入"erase"
,那么它会插入一个新的键值对,键为"erase"
,值为"删除"
。 -
查找:
cout << dict["erase"] << endl;
再次查找键为
"erase"
的元素,并输出其值。由于上一步已经将"erase"
的值修改为"删除"
,所以这次输出的将是"删除"
。 -
修改:
dict["test"] = "测试"; dict["left"] = "左边、剩余";
这两行代码分别插入两个新的键值对到
map
中。第一行插入键"test"
和值"测试"
,第二行插入键"left"
和值"左边、剩余"
。
需要注意的是,使用 []
操作符时,如果键不存在,map
会自动创建一个新的键值对,并将值初始化为该类型的默认值。这意味着,如果你尝试查找一个不存在的键,map
会插入一个新元素,其值为默认构造的值。对于字符串来说,就是空字符串。
📌 multimap
和 map的区别在于,multimap 支撑键值冗余,但是不支持 []
。