map与set介绍及使用
- 关联式容器
- 健值对
- set
- multiset
- map
- multimap
关联式容器
之前我们学的list,vector等等是序列式容器,这里的set和map和之后的哈希表都是关联式容器,比如说搜索二叉树我们想插入一个值,不能随意的插入,因为每个数都是有关联的,需要找到准确位置才能进行插入。
健值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代
表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然
有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应
该单词,在词典中就可以找到与其对应的中文含义。
SGI-STL中关于键值对的定义:
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair() : first(T1()), second(T2())
{}
pair(const T1& a, const T2& b) : first(a), second(b)
{}
};
https://legacy.cplusplus.com/reference/utility/pair/?kw=pair
set
set文档介绍:https://cplusplus.com/reference/set/set/
这是一颗平衡搜索二叉树,也就是说不会出现那种只出现一边倾斜的情况,时间复杂度是稳定的 O(logN).
template < class T, // set::key_type/value_type
class Compare = less< T >, // set::key_compare/value_compare
class Alloc = allocator< T > // set::allocator_type
> class set;
#include<iostream>
#include<set>
using namespace std;
int main()
{
set<int>tree;
tree.insert(1);
tree.insert(3);
tree.insert(9);
tree.insert(4);
tree.insert(1);
tree.insert(7);
tree.insert(1);
tree.insert(3);
for (auto& e : tree)//这里的e尽量用引用
{
cout << e << ' ';
}
cout << endl;
return 0;
}
首先我们看这段代码,了解到set的功能就是排序+去重的功能。
第一个参数是插入一个值。第二个是在某个位置插入一个值,但是这个接口要慎用,因为有可能破坏树的结构。第三个是迭代器的区间。
第一个参数是迭代器位置。第二个是值,这里如果删除的值不存在会返回0,存在返回1。第三个是迭代器区间。
这里是查找一个值,返回的是迭代器的位置,如果没有找到就返回end的位置。
这个接口的作用是统计这棵树中有多少个这个值的结点。
这个接口是为了multiset存在的。
multiset
multiset文档介绍https://cplusplus.com/reference/set/multiset/
template < class T, // multiset::key_type/value_type
class Compare = less, // multiset::key_compare/value_compare
class Alloc = allocator > // multiset::allocator_type
> class multiset;
multiset是允许值冗余:
#include<iostream>
#include<set>
using namespace std;
int main()
{
multiset<int>tree;
tree.insert(1);
tree.insert(3);
tree.insert(9);
tree.insert(4);
tree.insert(1);
tree.insert(7);
tree.insert(1);
tree.insert(3);
for (auto& e : tree)//这里的e尽量用引用
{
cout << e << ' ';
}
cout << endl;
return 0;
}
这就是为什么set要设计要设计一个count接口了:
那么在查找这棵树的1的时候,先找到的就是中序遍历的第一个1。
#include<iostream>
#include<set>
using namespace std;
int main()
{
multiset<int>tree;
tree.insert(1);
tree.insert(3);
tree.insert(9);
tree.insert(4);
tree.insert(1);
tree.insert(7);
tree.insert(1);
tree.insert(3);
auto it = tree.find(1);
while (it != tree.end())
{
cout << *it << ' ';
it++;
}
cout << endl;
return 0;
}
迭代器所有的区间基本都符合左闭右开的特性:
upper_bound是>
lower_bound是>=
map
template < class Key, // map::key_type
class T, // map::mapped_type
class Compare = less, // map::key_compare
class Alloc = allocator<pair<const Key,T> > // map::allocator_type
> class map;
map也是一个平衡二叉搜索树,是一个KV模型。
上面的键值对,是数中结点值的类型。
#include<iostream>
#include<map>
using namespace std;
int main()
{
map<string, string>dict;
dict.insert(pair<string, string>("一", "one"));
dict.insert(pair<string, string>("二", "two"));
dict.insert(pair<string, string>("三", "three"));
dict.insert(make_pair("四", "four"));//这里和上面三个是等价的写法
return 0;
}
#include<iostream>
#include<map>
using namespace std;
int main()
{
map<string, string>dict;
dict.insert(pair<string, string>("一", "one"));
dict.insert(pair<string, string>("二", "two"));
dict.insert(pair<string, string>("三", "three"));
dict.insert(make_pair("四", "four"));//这里和上面三个是等价的写法
for (const auto& e : dict)//如果不改变加const,e前面不加引用就是这个类型的拷贝构造,代价有些大
{
cout << e.first << ":" << e.second << endl;//e不能直接访问,因为<<没有对pair类型进行重载
}
return 0;
}
map当中最重要的是:
(*((this->insert(make_pair(k,mapped_type()))).first)).second
返回值很长,逐步分析:
首先看一下insert的返回值
pair<iterator,bool> insert (const value_type& val);
这里如果插入(没有一个与他相同的key)成功就返回true,插入失败失败返回false。
注意:无论成功与否都会返回一个迭代器。
那么operator[]中返回值插入的是什么?
make_pair(k,mapped_type())
插入的是k, value类型的匿名对象,在这里匿名对象会仅有默认值,比如int类型就是0,指针类型就是空指针等等。
也就是说,插入接口调用完之后返回的迭代器的位置就是pair对应的位置,然后去调用first,也就是插入返回的iterator值,就是k对应的结点,然后再去找second,也就是k对应的结点的value。
也就是说,这个operator[]可以插入,修改,查找。(要小心,如果一个值没有,会进行插入的操作)
#include<iostream>
#include<map>
using namespace std;
int main()
{
map<string, string>dict;
dict.insert(pair<string, string>("一", "one"));
dict.insert(pair<string, string>("二", "two"));
dict.insert(pair<string, string>("三", "three"));
dict.insert(make_pair("四", "four"));//这里和上面三个是等价的写法
dict["五"] = "five";//插入+修改
dict["六"];
dict.insert(make_pair("六", "six"));//不能修改,因为这个key值存在
for (auto& e : dict)
{
cout << e.first << ":" << e.second << " ";
}
cout << endl;
dict["六"] = "six";
for (auto& e : dict)
{
cout << e.first << ":" << e.second << " ";
}
return 0;
}
这里和operator[]的区别就是,如果不存在会抛出一个异常。
这里第二个参数只需要一个key,不需要pair。
multimap
这里和map最大的区别就是不提供operator[],因为一棵树当中会有多个相同的key,所以没必要存在operator[]。还有就是find会中序遍历查找,找到的第一个就是。