文章目录
- 一、关联式容器
- 二、键值对
- 三、树形结构的关联式容器
- 1.set
- 2.multiset
- 3.map
- 4.multimap
- 四、题目练习
一、关联式容器
序列式容器
📕:已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列
的数据结构,里面存储的是元素本身。
关联式容器
📕:也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构
的键值对,在数据检索时比序列式容器效率更高
二、键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value
,key代表键值
,value表示与key对应的信息
。
比如📝:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义
SGI-STL中关于键值对
的定义 👇
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair(): first(T1()), second(T2())
{}
pair(const T1& a, const T2& b): first(a), second(b)
{}
};
三、树形结构的关联式容器
根据应用场景的不同,STL总共实现了两种不同结构的管理式容器🔴:树型结构与哈希结构
。
树型结构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)
作为其底层结果,容器中的元素是一个有序
的序列。
下面,我们一起来看一看这四种关联式容器👇
1.set
\1. set是按照
一定次序存储元素
的容器
\2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一
的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除
它们。
\3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
\4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
\5. set在底层是用二叉搜索树(红黑树)
实现的 ,中序之后自然是有序的,插入元素之后:小的往左边走,大的往右边走,相等则返回false。
set的模板参数列表
T
: set中存放元素的类型,实际在底层存储<value, value>的键值对。
Compare
:仿函数,set中元素默认按照小于来比较
Alloc
:set中元素空间的管理方式,使用STL提供的空间配置器管理
set的构造函数
默认构造、迭代器区间构造、拷贝构造(深拷贝):
void test_set()
{
int arr[] = { 1,2,3,4,5 };
set<int> s;//默认构造
set<int> s1(arr, arr + 5);//区间构造
set<int> s2(s1);//拷贝构造
for (auto e : s1) cout << e << " "; cout << endl;
for (auto e : s2) cout << e << " "; cout << endl;
}
set的迭代器
函数声明 | 功能介绍 |
---|---|
iterator begin() \end() | 返回set中起始位置元素的迭代器\返回set中最后一个元素后面的迭代器 |
const_iterator cbegin()\cend() const | 返回set中起始位置元素的const迭代器\返回set中最后一个元素后面的const迭代器 |
reverse_iterator rbegin() \rend() | 返回set第一个元素的反向迭代器,即end\返回set最后一个元素下一个位置的反向迭代器,即 rbegin |
const_reverse_iterator crbegin() \crend() const | 返回set第一个元素的反向const迭代器,即cend\返回set最后一个元素下一个位置的反向const迭代器, 即crbegin |
我们简单来看一看代码把:
void test_set1()
{
set<int> s;
s.insert(1);
s.insert(2);
s.insert(1);
s.insert(3);
s.insert(4);
s.insert(5);
//排序+去重
for (auto e : s)
{
cout << e << " ";
}
cout << endl;
//set<int>::iterator it = s.begin();
auto it = s.begin();
while (it != s.end())
{
cout << *it << " ";
++it;
}
cout << endl;
}
int main()
{
test_set1();
return 0;
}
默认是升序,如果是想要降序:使用反向迭代器
仿函数:less👉greater
:
set的修改操作
find&&erase
对于find和erase我们都是比较熟悉的了,我们可以直接上手代码的实现:
void test_set3()
{
set<int> s;
s.insert(1);
s.insert(2);
s.insert(1);
s.insert(3);
s.insert(4);
s.insert(5);
//set<int>::iterator it = s.begin();
auto it = s.begin();
while (it != s.end())
{
cout << *it << " ";
++it;
}
cout << endl;
auto pos = s.find(3);//更快一点点,借助二叉树查找O(logN)
//auto pos = find(s.begin(), s.end(), 3);
//暴力查找O(N)
if (pos != s.end())
{
s.erase(pos);
}
s.erase(1);
for (auto e : s) cout << e << " ";
cout << endl;
}
值得一提的是,set还有一个count接口,count
:返回个数,可以判断一个值是否存在
但是count不是为此设计的!是为了和multiset
容器保持接口的一致性。
2.multiset
\1. multiset是按照特定顺序存储元素的容器,其中元素是可以
重复
的。
\2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
\3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
\4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
\5. multiset底层结构为二叉搜索树(红黑树)
上面说了这么多的内容,其实就是与set的区别是👉:multiset中的元素可以重复,set是中value是唯一的
void test_multiset()
{
int arr[] = {1,2,3,1,1,6,8};
multiset<int> s(arr, arr + sizeof(arr) / sizeof(int));
for (auto& e : s)
{
cout << e << " ";
}
cout << endl;
}
另外,如果有多个值相同,find返回的值是中序的第一个:
void test_multiset()
{
int arr[] = {1,2,3,4,5,6,3};
multiset<int> s(arr, arr + sizeof(arr) / sizeof(int));
for (auto& e : s)
{
cout << e << " ";
}
cout << endl;
auto it = s.find(3);
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl;
}
3.map
\1. map是
关联容器
,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
\2. 在map中,键值key通常用于排序和惟一地标识元素
,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair:typedef pair value_type;
\3. 在内部,map中的元素总是按照键值key
进行比较排序的。
\4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
\5. map支持下标访问符
,即在[]
中放入key,就可以找到与key对应的value。
\6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))
map的模板参数
key
: 键值对中key的类型
T
:键值对中value的类型
Compare
: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc
:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器
map的构造
void test_map()
{
map<int, int> m;
int arr[] = { 1,1,1,2,3,4,5,6 };
for (auto& e : arr)
{
m.insert(make_pair(e, e));
}
map<int, int>m1(m.begin(), m.end());//迭代器区间构造
for (auto& e : m1)cout << e.first<<":"<<e.second << " "; cout << endl;
map<int, int> m2(m1);//拷贝构造
for (auto& e : m2)cout << e.first << ":" << e.second << " "; cout << endl;
}
map的修改
insert插入
void test_map1()
{
map<string, string> dict;
dict.insert(pair<string, string>("排序", "sort"));
dict.insert(pair<string, string>("左边", "left"));
dict.insert(pair<string, string>("右边","right"));
dict.insert(make_pair("字符串", "string"));
map<string, string>::iterator it = dict.begin();
//auto it = dict.begin()
while (it != dict.end())
{
//(*it).first
cout << it->first<<":"<<it->second << endl;
++it;
}
cout << endl;
for (auto& e : dict)
{
cout << e.first << ":" << e.second << endl;
}
}
make_pair
:函数模板,不需要像pair一样显示声明类型,而是通过传参自动推导,相比于typedef更好用一些
统计次数
第一种方法:迭代器
void test_map2()
{
//统计水果出现的次数
string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果",
"苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
map<string, int> countMap;
for (auto& e : arr)
{
map<string, int>:: iterator it = countMap.find(e);
if (it == countMap.end())
{
countMap.insert(make_pair(e, 1));
}
else
{
it->second++;
}
}
for (const auto& kv : countMap)
{
cout << kv.first << ":" << kv.second << endl;
}
}
第二种方法:map[]的使用:
void test_map2()
{//统计水果出现的次数
string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果","苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
map<string, int> countMap;
for (auto& e : arr)
{
countMap[e]++;
}
for (const auto& kv : countMap)
{
cout << kv.first << ":" << kv.second << endl;
}
}
[]有三个功能:1.插入 2.修改 3.查找
(给一个key,可以查找在不在,如果不在则可以插入,在的话既可以查找也可以进行修改value)
注意
:[]用的时候要小心,不在的话会偷偷给你插入
下面我们来仔细看一看[]:[]实际上调用的是insert,insert有啥好调用的,我们要关注的是insert的返回值
返回second的别名就可以进行修改了。简单运用一下[]把:
void test_map1()
{
map<string, string> dict;
dict.insert(pair<string, string>("排序", "sort"));
dict.insert(pair<string, string>("左边", "left"));
dict.insert(pair<string, string>("右边","right"));
dict.insert(make_pair("字符串", "string"));
dict["迭代器"] = "iterator";//插入+修改
dict["insert"];
dict.insert(make_pair("左边", "xxx"));//插入失败,搜索树只会比较key
dict["insert"] = "插入";//修改
cout << dict["左边"] << endl;//查找:key在就是查找
auto it = dict.begin();
while (it != dict.end())
{
cout << it->first<<":"<<it->second << endl;
++it;
}
cout << endl;
}
4.multimap
multimap容器与map容器的底层实现以及成员函数的接口都是基本一致,其中多个键值对之间的key是可以重复的
void test_multimap()
{
multimap<string, string> dict;
dict.insert(make_pair("left", "左边"));
dict.insert(make_pair("left", "左边"));
dict.insert(make_pair("right", "右边"));
dict.insert(make_pair("sort", "排序"));
dict.insert(make_pair("left", "xxx"));
map<string, int> countMap;
for (auto& kv : dict)
{
cout << kv.first << ":" << kv.second << endl;
}
cout << endl;
}
multimap并没有[],find()返回中序的第一个,剩下的没什么区别:
void test_multimap()
{
multimap<string, string> dict;
dict.insert(make_pair("left","左边"));
dict.insert(make_pair("right", "右边"));
dict.insert(make_pair("sort", "排序"));
dict.insert(make_pair("left", "xxx"));
map<string, int> countMap;
for (auto& kv : dict)
{
cout << kv.first << ":" << kv.second << endl;
}
cout << endl;
}
multimap同样是可以统计次数的:
void test_multimap1()
{
multimap<string, int> countMap;
string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果",
"苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
for (auto& e : arr)
{
auto it = countMap.find(e);
if (it == countMap.end())
{
countMap.insert(make_pair(e, 1));
}
else
{
it->second++;
}
}
for (const auto& kv : countMap)
{
cout << kv.first << ":" << kv.second << endl;
}
}
下面做两个题目试一试把👇
四、题目练习
前K个高频单词
给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。
class Solution {
public:
class greater
{
public:
bool operator()(const pair<string,int>&l,const pair<string,int>& r)
{
return l.second>r.second||(l.second==r.second&&l.first<r.first);
}
};
vector<string> topKFrequent(vector<string>& words, int k) {
unordered_map<string,int> countMap;
for(auto&e:words) countMap[e]++;
priority_queue<pair<string,int>,vector<pair<string,int>>,greater> pq;
for(auto it = countMap.begin();it!=countMap.end();it++)
{
pq.push(*it);
if(pq.size()>k)
pq.pop();
}
vector<string> ret;
ret.resize(k);
for(int i = k-1;i>=0;i--)
{
ret[i] = pq.top().first;
pq.pop();
}
return ret;
}
};
两个数组的交集
给定两个数组 nums1
和 nums2
,返回 它们的交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序。
利用set的排序+去重特性
,然后去进行比对,找出两个数组之间的交集:
class Solution {
public:
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
//排序+去重
set<int> s1(nums1.begin(),nums1.end());
set<int> s2(nums2.begin(),nums2.end());
//比对算法逻辑
auto it1 = s1.begin();
auto it2 = s2.begin();
vector<int> ret;
while(it1!=s1.end()&&it2!=s2.end())
{
if(*it1==*it2)
{
ret.push_back(*it1);
it1++;
it2++;
}
else if(*it1>*it2)
{
it2++;
}
else
{
it1++;
}
}
return ret;
}
};
本篇结束…