❤️前言
好久不见大家!今天的这篇博客是关于我对于STL(C++标准模板库)中的容器vector的学习和理解,希望大家能够喜欢。
正文
vector是STL中的一种序列容器,对应着数据结构中的顺序表,也可以说是数组。在我们正式学习了解vector之前,我们先看看C++官网对其的文档介绍。
vector的文档介绍
这是纯英文的官网链接:cplusplus.com/reference/vector/vector/https://cplusplus.com/reference/vector/vector/ 这是大概的中文翻译:
- vector是表示可变大小数组的序列容器。
- 就像原生数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
- 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
- 因此,vector占用了更多的存储空间,这是为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
- 与其它动态序列容器相比(deque, list and forward_list),vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。
看不懂也没什么问题,这本来就只是给我们一个大致的vector的印象,接下来我们继续更加细致的了解和学习这个容器。
vector的简单使用
首先我们知道STL是C++的标准模板库,而vector是其中的一种容器(数据结构),它是一种类模板,通过模板的显式实例化可以产生各种各样不同的类,初始化时vector需要我们给出其中存储的数据类型。
要使用vector,我们首先要知道如何初始化一个vector对象。这时候我们就需要关注vector对应的构造函数。
vector的构造函数
如下是C++98中给出的vector构造函数:
第一个构造函数可以看作无参数的默认构造函数,那个唯一的参数叫做空间配置器,在使用vector时我们基本上可以无视,它的作用就是提高堆区内存资源的存取效率,而且它那里给了缺省参数,一般我们在使用的时候是不怎么需要考虑的。
// 使用这个构造函数初始化vector对象的大致方式:
vector<数据类型> v();
// 存储int类型的数据:
vector<int> v();
// 存储vector<int>类型的数据模拟二维数组:
vector<vector<int>> vv();
第二个构造函数的效果是初始化出n个值,初始化的值默认调用vector中数据的默认构造函数。
// 使用这个构造函数初始化vector对象的大致方式:
vector<数据类型> v(初始化数据的个数,数据初始值);
// 存储int类型的数据10个10:
vector<int> v(10, 10);
// 存储vector<int>类型的数据模拟n*n的二维数组:
vector<vector<int>> vv(n, vector<int>(n));
第三个构造函数通过迭代器区间进行构造,我们只需要给出起止的范围即可(迭代器我们在使用string类时就已经接触过了,它是对应着指针的一类对象)。
// 使用这个构造函数初始化vector对象的大致方式:
vector<数据类型> v(起始迭代器,终止迭代器);
// 存储int类型的数据:
int arr[] = { 0,1,2,3,4 };
int* p1 = arr; int* p2 = arr + 5;
vector<int> v(p1,p2);
第四个构造函数就是拷贝构造函数,使用方式想必不需要过多探讨。
vector的迭代器使用
下面是关于迭代器(iterator)的简单介绍:
在STL中,我们要访问顺序容器和关联容器中的元素,需要通过“迭代器(iterator)”进行。迭代器是一个变量,相当于容器和操纵容器的算法之间的中介。迭代器可以指向容器中的某个元素,通过迭代器就可以读写它指向的元素。从这一点上看,迭代器和指针类似。
简单认识了迭代器之后,让我们看看迭代器在vector中的使用。在vector中,我们一般使用迭代器来对应指针在数组中的操作。通过迭代器,我们可以访问vector中的任意元素。那我们该如何使用迭代器呢?下面举例vector迭代器的使用方式:
vector<int> v(10, 10);
// 创建vector迭代器对象指向v的开头
vector<int>::iterator it = v.begin();
while (it != v.end())
{
cout << *it << ' ';
++it;
}
在上述代码中,我调用v的成员函数begin()为it赋初值,我们大概能看出这里的begin()和end()会返回迭代器的值。顾名思义,begin()给出了v的初始位置对应迭代器的值,end()给出末尾元素后的一个位置的值,也就是对应着一个左闭右开的区间。
除此之外,还有一种迭代器被称为反向迭代器(reverse_iterator),这种迭代器从最后一个元素为起始点,第一个元素的前一个位置为终止点,是与普通迭代器相反的迭代器,可以对容器里的元素进行反向遍历,对应在成员函数中就是rbegin()和rend()。使用方式:
vector<int> v(10, 10);
// 创建vector反向迭代器对象指向v的末尾
vector<int>::reverse_iterator rit = v.rbegin();
while (rit != v.rend())
{
cout << *rit << ' ';
++rit;
}
我们可以看到,当我们声明一个迭代器时,它的类型名经常会有些复杂,这时候我们就可以想到之前学习过的一种关键字:auto ,它可以自行推导对象的类型(当然,这需要我们对变量赋初值),这使我们在使用长类型名对象时更加的方便。例如上面的反向迭代器声明就可以变为:
auto rit = v.rbegin();
vector的空间使用
在使用vector时,我们也需要控制内存和数据,类似于我们在学习数据结构时控制顺序表的内存和数据。
相应的函数有size() capacity() empty() reserve() resize()等。
其中reserve() 可以改变vector的capacity resize()可以改变vector的size也就是有效数据个数。
这些接口的使用大家可以参考C++的文档:
vector - C++ Reference (cplusplus.com)https://legacy.cplusplus.com/reference/vector/vector/
vector的增删查改
对于vector的增删查改,我们比较常用的接口有末端插入push_back()、末端删除pop_back()、重载方括号operator[ ]。
这些函数也可以参考文档进行学习。
迭代器失效问题
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。由此可见,迭代器失效也就类似于我们曾经在C指针阶段非常苦恼的野指针问题。
可能会引起迭代器失效的操作有:
1.可能会引起底层空间发生改变的各种操作,都可能会引发迭代器失效。例如:resize、reserve、insert、assign、push_back等。示例代码如下:
vector<int> v{ 1,2,3,4,5,6 };
auto it = v.begin();
// 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
// v.resize(100, 8);
// reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
// v.reserve(100);
// 插入元素期间,可能会引起扩容,而导致原空间被释放
// v.insert(v.begin(), 0);
// v.push_back(8);
// 给vector重新赋值,可能会引起底层容量改变
v.assign(100, 8);
/*
出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉,
而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的
空间,而引起代码运行时崩溃。
解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新
赋值即可。
*/
it = v.begin();
while (it != v.end())
{
cout << *it << " ";
++it;
}
cout << endl;
2.指定位置元素的删除操作--erase,当我们通过erase删除了一个元素之后,那么指向这个元素的迭代器就会失效,因为目前这个迭代器的指向是未知的(它会指向原来的下一个位置)。示例代码如下:
vector<int> v{ 1,2,3,4,5,6 };
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
it = v.erase(it);
else
++it;
}
it = v.begin();
while (it != v.end())
{
std::cout << *it << " ";
++it;
}
std::cout << endl;
总的来说,迭代器失效就类似于野指针问题,我们解决迭代器失效的方式就是为迭代器重新赋值。
vector的模拟实现
大致了解了vector的使用之后,让我们一起学着模拟实现vector,以此加深我们对与vector的理解,让我们更好的使用它。
namespace MO_lion
{
template<typename T>
class vector
{
public:
// 迭代器
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish;
}
// 构造函数
vector()
: _start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{}
// 拷贝构造
vector(const vector<T>& v)
: _start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
reserve(v.capacity());
for (int i = 0; i < v.size(); ++i)
{
_start[i] = v[i];
}
_finish += v.size();
}
vector(int n, const T& x = T())
{
resize(n, x);
}
// 扩容
void reserve(size_t n)
{
if (n <= capacity()) return;
size_t oldsize = size();
iterator tmp = new T[n];
if (_start)
{
for (int i = 0; i < size(); ++i)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + oldsize;
_end_of_storage = _start + n;
}
void resize(size_t n, const T& x = T())
{
if (n > capacity()) reserve(n);
for (int i = size(); i < n; ++i)
{
_start[i] = x;
}
_finish = _start + n;
}
// 尾插
void push_back(const T& x)
{
//if (_finish == _end_of_storage)
//{
// reserve(capacity() == 0 ? 5 : capacity() * 2);
//}
//*_finish = x;
//_finish++;
insert(end(), x);
}
// 随机位置插入
iterator insert(iterator pos, const T& x)
{
assert(pos <= _finish && pos >= _start);
if (_finish == _end_of_storage)
{
size_t len = pos - _start;
reserve(capacity() == 0 ? 5 : capacity() * 2);
pos = _start + len;
}
for (int i = size(); i > pos - _start; --i)
{
_start[i] = _start[i - 1];
}
*pos = x;
_finish++;
return pos;
}
// 指定位置删除
iterator erase(iterator pos)
{
assert(pos < _finish && pos >= _start);
for (int i = pos - _start; i < size() - 1; ++i)
{
_start[i] = _start[i + 1];
}
_finish--;
return pos;
}
// 重载方括号
T& operator[](size_t n)
{
return _start[n];
}
const T& operator[](size_t n) const
{
return _start[n];
}
// 交换两个vector
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
// 重载等号
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
// 返回有效数据个数
size_t size() const
{
return _finish - _start;
}
// 返回可用空间大小
size_t capacity() const
{
return _end_of_storage - _start;
}
// 析构函数
~vector()
{
if (_start == nullptr) return;
delete[] _start;
_start = nullptr;
_finish = nullptr;
_end_of_storage = nullptr;
}
private:
// 将三个指向不同位置的迭代器作为私有成员;
// 起始位置
iterator _start;
// 终止位置
iterator _finish;
// 容量的极限位置
iterator _end_of_storage;
};
}
在vector的模拟实现中,有以下问题比较值得注意:
深浅拷贝问题
由于vector可以存储各种各样不同的数据类型,我们在模拟实现reverse()和拷贝构造函数复制有效数据的过程中使用赋值运算符 "=" 进行操作。
如果我们像实现string时一样使用memcpy()进行数据拷贝,那么当这样的vector用于存储需要进行资源管理的对象的时候(例如vector<vector<int>>),就会发生错误,因为memcpy()是浅拷贝。而使用 "=" 这里就比较妙了,它可以适配所有的对象,因为大家都有赋值运算符,正常情况下,赋值运算符会适配对应对象的资源管理方式。
重载等号的现代写法
上面我们可以看到重载等号的写法十分的简洁,实际上是创建了一个临时的vector对象,然后将成员交换给当前对象,相当于复用了拷贝构造的代码,这里有一个比较妙的点就是传参得来的参数是原对象的临时拷贝。
// 交换两个vector
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
// 重载等号
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
🍀结语
以上内容就是今天的所有vector相关知识啦,接下来我们使用C++经常会使用到vector,希望这篇博客能够对大家有用。