之前对C++当中的string类做了了解和模拟实现:
C++-string类的模拟实现_chihiro1122的博客-CSDN博客
C++ string类-2_chihiro1122的博客-CSDN博客
C++ string类 迭代器 范围for_string类型迭代器_chihiro1122的博客-CSDN博客
vector类使用模版来实现了,我们可以用 char 类型作为显示实例化,同样可以像string一样存储和修改字符串,那么是不是可以认为 string类 可以被 vector 代替呢?
其实结果是显然不行的,如果可以的话,C++官方文档当中就不会单独存在 string类了。
原因也很简单,string类和vector类 其中一些实现细节是不同的,比如string类是以'\0' 结尾了,虽然在 vector类 也可以尾差一个 '\0' 但是你可以保证这样操作,其他人不一定都会这样做,而且string类是自动加 '\0' 结尾的;
其实最重要的一点是 不用 '\0' 结尾的话,是不好跟C语言进行兼容的,我们在写C/C++ 都知道是向上兼容的,string类就可以跟 C 当中的字符串来进行兼容。
而且就功能上说,string类的接口是比vector 跟丰富的,在string类当中有比如 "+=" 比较大小 等等的,在 vector 有比较大小的接口,但是vector 一般不用于比较大小,vector的比较大小相比于string类的比较大小没有多大意义。
string类是一个确定类型,就可以以string类作为显示实例化,来用vector存储string。
vector类
vector的介绍
而vector是表示可变大小数组的序列容器。就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。可以把vector理解为顺序表。
只不过vector在分配空间上和之前在C语言当中实现的顺序表不太一样,它进行了一些优化:
本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
所以,vector为了能管理储存空间的能力,就占用了更多的储存空间,并且这种储存空间以一种有效的方式动态增长。
与其他动态序列容器相比(deque, list and forward_list),vector 的访问元素更加高效,在其末尾添加和删除元素的时候效率很高,但是对于不在末尾的操作,效率就很低;比起list和forward_list统一的迭代器和引用更好。
而且vector类和string类的使用方式其实是很多地方都是类似的。
vector的定义
有四大类构造函数:
(constructor)构造函数声明 | 接口说明 |
vector() | 无参构造 |
vector(size_type n, const value_type& val = value_type()) | 构造并初始化n个val |
vector (const vector& x); | 拷贝构造 |
vector (InputIterator first, InputIterator last); | 使用迭代器进行初始化构造 |
例1:
int main()
{
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
for (auto v : v1)
{
cout << v << " ";
}
//1 2 3 4
}
可以构造一个空类,然后尾差值。
例2:
vector<int> v1(10, 1);
for (auto val : v1)
{
cout << val << " ";
}
//1 1 1 1 1 1 1 1 1 1
vector<string> v2(10, "***");
for (auto val : v2)
{
cout << val << " ";
}
//*** *** *** *** *** *** *** *** *** ***
可以定义多个值,在构造对象的时候。
例3:
vector<int> v1(10, 1);
for (auto val : v1)
{
cout << val << " ";
}
//1 1 1 1 1 1 1 1 1 1
vector<int> v2(v1.begin(), v1.end());
for (auto val : v2)
{
cout << val << " ";
}
//1 1 1 1 1 1 1 1 1 1
可以使用迭代器来进行初始化,像上述就是拿v1的迭代器来进行初始化。
例4:
string str("hello world");
vector<char> v1(str.begin(), str.end());
for (auto val : v1)
{
cout << val << " ";
}
//h e l l o w o r l d
不仅仅可以使用vector本类当中的迭代器,因为vector在使用的时候,传入的迭代器使用的是模版实现的迭代器(inputiterator),所以,可以使用其他类的迭代器,像上述例子就是用了string类当中的迭代器。
例5:
int a[] = { 16,86,64,42 };
vector<int> v1(a, a + 4);
for (auto val : v1)
{
cout << val << " ";
}
//16 86 64 42
还可以用指针来表示范围,来初始化vector;因为其实迭代器就是用指针来实现的,像上述的指针范围,本来就是一个天然的迭代器,而我们在类当中实现的迭代器实际上,可以直接理解为指针来表示一个范围。迭代器的行为其实就是模拟的指针。
vector iterator 的使用
vector 当中的迭代器和string 当中迭代器的时候使用一样的,主要使用的有以下几种:
begin + end | 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置 的iterator/const_iterator |
rbegin + rend | 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的 reverse_iterator |
还是和string一样,有正向和反向的迭代器。
关于 vector当中迭代器的使用可以参考string当中迭代器的使用:
C++ string类 迭代器 范围for_string类型迭代器_chihiro1122的博客-CSDN博客https://blog.csdn.net/chihiro1122/article/details/130789273?spm=1001.2014.3001.5501
vector 空间增长问题
接口也是string一样的:
容量空间 | 接口说明 |
size | 获取数据个数 |
capacity | 获取容量大小 |
empty | 判断是否为空 |
resize | 改变vector的size |
reserve | 改变vector的capacity |
- capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。这个问题经常会考察,不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。
- reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。
- resize在开空间的同时还会进行初始化,影响size。
测试扩容:
void TestVectorExpand()
{
size_t sz;
vector<int> v;
sz = v.capacity();
cout << "making v grow:\n";
for (int i = 0; i < 100; ++i)
{
v.push_back(i);
if (sz != v.capacity())
{
sz = v.capacity();
cout << "capacity changed: " << sz << '\n';
}
}
}
VS下输出:
VS下大概就是1.5 倍的样子。
使用reserve()函数可能会出现一下错误:
vector<int> v1;
v1.reserve(10);
for (size_t i = 0; i < 10; i++)
{
v1[i] = i;
}
断言:
上面也说了,reserve()修改的是 _capacity容量,并没有修改 _size 有效字符长度。这时候就要用用resize(),因为resize()也会进行扩容,而且会修改 _size。
vector 增删查改
vector增删查改 | 接口说明 |
push_back | 尾插 |
pop_back | 尾删 |
find | 查找。(注意这个是算法模块实现,不是vector的成员接口) |
insert | 在position之前插入val |
erase | 删除position位置的数据 |
swap | 交换两个vector的数据空间 |
operator[] | 像数组一样访问 |
我们注意到,修改当中,vector并没有提供头插头删,因为头插和头删是需要挪动数据的,这样的话效率不高,不是vector的适用范围。但是也是可以头插头删的,使用insert()和 erase()函数就可以了(如下例子),使用方式也是和string差不多的,可以参考博客开头给的博客链接。
int a[] = { 16,86,64,42 };
vector<int> v1(a, a + 4);
for (auto val : v1)
{
cout << val << " ";
}
//16 86 64 42
v1.erase(v1.begin());
for (auto val : v1)
{
cout << val << " ";
}
//86 64 42
v1.insert(v1.begin(), 1000);
for (auto val : v1)
{
cout << val << " ";
}
//1000 86 64 42
我们还发现在vector类当中是没有实现find()函数的,但是string类当中就实现了find()函数。其实find()函数在STL当中是算法模块(<algorithm>)当中已经实现了模版,我们可以直接使用其中的find()函数:
int a[] = { 16,86,64,42 };
vector<int> v1(a, a + 4);
for (auto val : v1)
{
cout << val << " ";
}
//16 86 64 42
vector<int>::iterator pos = find(v1.begin(), v1.end(), 86);
if (pos != v1.end())
{
v1.erase(pos);
}
for (auto val : v1)
{
cout << val << " ";
}
//16 64 42
那么为什么在string当中就实现了find()函数,而在vector当中就没有实现呢?其实是因为string当中的find()要实现的功能比较特殊,它不仅要求查找字符,还要要求查找字符子串,而vector当中就没有这么多功能,这需要遍历查找即可;
关于vector的例题
136. 只出现一次的数字 - 力扣(LeetCode)
class Solution {
public:
int singleNumber(vector<int>& nums) {
int value = 0;
for (auto e : nums)
{
value ^= e;
}
return value;
}
};
利用了异或的交换率等等一些特性,这些的因为直接判断的是二进制的数,所以效率高。
118. 杨辉三角 - 力扣(LeetCode)
class Solution {
public:
vector<vector<int>> generate(int numRows) {
vector<vector<int>> vv;
vv.resize(numRows);
for(size_t i = 0;i < numRows;i++)
{
vv[i].resize(i + 1, 0);
vv[i][0] = vv[i][i] = 1;
}
for(size_t i =0;i < vv.size();i++)
{
for(size_t j =0; j < vv[i].size();j++)
{
if(vv[i][j] == 0)
{
vv[i][j] = vv[i - 1][j] + vv[i - 1][j - 1];
}
}
}
return vv;
}
};
对于其中的 vector<vector<int>> 其实就是二维数组,如下图:
其实和malloc开辟二维数组空间是的结构是差不多的。
关于vector<vector<int>> 的用法,比如如下所示,是和二维数组的用法很像的,只不过是调用了两次 operator[] 函数:
17. 电话号码的字母组合 - 力扣(LeetCode)
题意其实和9键输入法有点像,他是可以组合成多条路径,比如:
"23" 就是 :
["ad","ae","af","bd","be","bf","cd","ce","cf"]
“258”就是:
如上是 "a" 这一分支的所以的组合,相应的还有 “b” 和 “c” 的组合,这样的遍历其实就是深度优先遍历,a-j-t 是一次,a-j-u 是一次 ,a-j-v 是一次 , a-k-t 是一次 ············
如此,把所以的情况都列出来。
代码实现:
class Solution {
string strA[10] = {"" ,"" ,"abc","def","ghi","jkl","mno","pqrs","tuv","wxyz"};
// 输入的字符串 递归的层数 用于记录每一次递归到最后形成的字符串 用于返回
void Combinations(string digits, int level , string CombinStr , vector<string>& returnStr)
{
if(level == digits.size())
{
returnStr.push_back(CombinStr);
return;
}
int num = digits[level] - '0';
string str = strA[num];
for(int i = 0;i < str.size();i++)
{
Combinations(digits , level + 1, CombinStr + str[i] , returnStr);
}
}
public:
vector<string> letterCombinations(string digits) {
string CombinStr;
vector<string> returnStr;
if(digits.empty())
{
return returnStr;
}
Combinations(digits , 0 , CombinStr , returnStr);
return returnStr;
}
};
上述的vector<string> 类型的 returnstr 加了 “&”,是因为我们要在递归函数当中去修改 returnstr,而传入的用于 记录每一次遍历到最后形成的字符串的 string类型的 CombinStr 不加 “&”,是因为我们不希望这个 CombinStr 被修改,每一次递归完,回溯的时候,CombinStr 都会和上一层递归当中的CombinStr 保持一致。
迭代器失效问题
首先我们来看下面这个代码,是自己实现的 vector的 insert()函数:
void insert(size_t pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
// 扩容
if (_finish == _endOfStorage)
{
int newcapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newcapacity);
}
// 把数据往后挪一位
size_t end = finish - 1;
while (pos <= end)
{
*(end + 1) = *end;
end--;
}
*pos = x;
++finish;
}
上述insert()函数实现的是在pos位置插入一个元素,但是再需要扩容之后就会出现问题,如下图所示:
如上图所示,当使用insert()函数插入一个元素之前,需要扩容的时候,pos 的类型是 iterator 类型,这个类型 是 T* 模版类型指针的 typedef;就根本而言,pos就是一个指针。当我们扩容的时候,_start 等等的成员变量已经跟着reserve()函数修改了,但是pos 是insert()函数当中才有的,reserve()没有做处理,所以 pos 指针还是指向的原来没有扩容的空间,而且这块空间已经在 reserve()函数当中被 delete 掉了,那么pos 就是一个野指针了。
这是在类当中,使用迭代器 很容易出现的一个问题(迭代器失效),向上述的扩容就引发了迭代器失效的问题。
解决办法:就是只要扩容就更新以下pos,但是问题是如果在新空间当中找到pos原本所在的位置。
很简单,我们可以用 指针 - 指针 的方式来计算 _start 和 pos 之间有多少个元素,在扩容之后就可以根据这个元素个数来对 pos 指针进行更新。
修正之后的代码:
void insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
// 扩容
if (_finish == _endOfStorage)
{
size_t len = pos - _start;
int newcapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newcapacity);
pos = _start + len;
}
// 把数据往后挪一位
iterator end = _finish - 1;
while (pos <= end)
{
*(end + 1) = *end;
end--;
}
*pos = x;
++_finish;
}
其实上述还是没有完全解决迭代器失效,上述只是修改了内部的迭代器失效,如果迭代器在外部也是可能会失效的,如下例子:
auto pos = v.begin() + 3;
v.insert(pos, 100); // 假设其中已经扩容
*pos += 10;
上述insert()函数扩容之后,在insert()函数之外的pos指针已经失效了,他只想了还是扩容之前空间的pos位置,之所以insert()当中没有修改到是因为,pos是值传参,不行修改外部的pos。
切记,不能用 “&”传参,因为如果使用的是 begin()类似的迭代器,begin当中返回的是 iterator的对象,返回的是值,并不是引用,所以在两者传参的时候会产生临时对象,临时对象具有常性,这里就涉及到权限的放大,就会编译报错。
这里外部的迭代器失效问题 insert()函数无法解决,所以在使用insert()函数的时候要格外注意。
insert是返回一个迭代器,用与更新外部的迭代器,防止外部的迭代器失效:
最终函数:
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
if (_finish == _endofstorage)
{
size_t len = pos - _start;
size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newcapacity);
// 解决pos迭代器失效问题
pos = _start + len;
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
迭代器失效的介绍:
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)
对于vector可能会导致其迭代器失效的操作有:
会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等
#include <iostream>
using namespace std;
#include <vector>
int main()
{
vector<int> v{ 1,2,3,4,5,6 };
auto it = v.begin();
// 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
// v.resize(100, 8);
// reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
// v.reserve(100);
// 插入元素期间,可能会引起扩容,而导致原空间被释放
// v.insert(v.begin(), 0);
// v.push_back(8);
// 给vector重新赋值,可能会引起底层容量改变
v.assign(100, 8);
/*
出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉,
而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的
空间,而引起代码运行时崩溃。
解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新
赋值即可。
*/
while (it != v.end())
{
cout << *it << " ";
++it;
}
cout << endl;
return 0;
}
指定位置元素的删除操作--erase:
#include <iostream>
using namespace std;
#include <vector>
int main()
{
int a[] = { 1, 2, 3, 4 };
vector<int> v(a, a + sizeof(a) / sizeof(int));
// 使用find查找3所在位置的iterator
vector<int>::iterator pos = find(v.begin(), v.end(), 3);
// 删除pos位置的数据,导致pos迭代器失效。
v.erase(pos);
cout << *pos << endl; // 此处会导致非法访问
return 0;
}
erase删除pos位置元素后,pos位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是:如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,而end位置是没有元素的,那么pos就失效了。因此删除vector中任意位置上元素时,vs就认为该位置迭代器失效了。
注意:Linux下,g++编译器对迭代器失效的检测并不是非常严格,处理也没有vs下极端
/ 1. 扩容之后,迭代器已经失效了,程序虽然可以运行,但是运行结果已经不对了
int main()
{
vector<int> v{ 1,2,3,4,5 };
for (size_t i = 0; i < v.size(); ++i)
cout << v[i] << " ";
cout << endl;
auto it = v.begin();
cout << "扩容之前,vector的容量为: " << v.capacity() << endl;
// 通过reserve将底层空间设置为100,目的是为了让vector的迭代器失效
v.reserve(100);
cout << "扩容之后,vector的容量为: " << v.capacity() << endl;
// 经过上述reserve之后,it迭代器肯定会失效,在vs下程序就直接崩溃了,但是linux下不会
// 虽然可能运行,但是输出的结果是不对的
while (it != v.end())
{
cout << *it << " ";
++it;
}
cout << endl;
return 0;
}
程序输出:
1 2 3 4 5
扩容之前,vector的容量为: 5
扩容之后,vector的容量为 : 100
0 2 3 4 5 409 1 2 3 4 5
// 2. erase删除任意位置代码后,linux下迭代器并没有失效
// 因为空间还是原来的空间,后序元素往前搬移了,it的位置还是有效的
#include <vector>
#include <algorithm>
int main()
{
vector<int> v{ 1,2,3,4,5 };
vector<int>::iterator it = find(v.begin(), v.end(), 3);
v.erase(it);
cout << *it << endl;
while (it != v.end())
{
cout << *it << " ";
++it;
}
cout << endl;
return 0;
}
程序可以正常运行,并打印:
4 4
5
// 3: erase删除的迭代器如果是最后一个元素,删除之后it已经超过end
// 此时迭代器是无效的,++it导致程序崩溃
int main()
{
vector<int> v{ 1,2,3,4,5 };
// vector<int> v{1,2,3,4,5,6};
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
v.erase(it);
++it;
}
for (auto e : v)
cout << e << " ";
cout << endl;
return 0;
}
========================================================
// 使用第一组数据时,程序可以运行
[sly@VM - 0 - 3 - centos 20220114]$ g++ testVector.cpp - std = c++11
[sly@VM - 0 - 3 - centos 20220114]$ . / a.out
1 3 5
======================================================== =
// 使用第二组数据时,程序最终会崩溃
[sly@VM - 0 - 3 - centos 20220114]$ vim testVector.cpp
[sly@VM - 0 - 3 - centos 20220114]$ g++ testVector.cpp - std = c++11
[sly@VM - 0 - 3 - centos 20220114]$ . / a.out
Segmentation fault
总结:从上述三个例子中可以看到:SGI STL中,迭代器失效后,代码并不一定会崩溃,但是运行结果肯定不对,如果it不在begin和end范围内,肯定会崩溃的。
与vector类似,string在插入+扩容操作+erase之后,迭代器也会失效。
而迭代器失效解决办法:在使用前,对迭代器重新赋值即可。