1.vector的介绍
- vector是表示可变大小数组的序列容器。
- 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
- 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是 一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
- 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
- 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list统一的迭代器和引用更好。
2.vector的使用
vector的定义方式
方式一: 构造一个某类型的空容器。
// vector() 无参构造
vector<int> v1; //构造int类型的空容器
方式二: 构造一个含有n个val的某类型容器。
//vector(size_type n, const value_type& val = value_type())
vector<int> v2(10, 2); //构造含有10个2的int类型容器
方式三: 拷贝构造某类型容器的复制品。
//vector (const vector& x) 拷贝构造
vector<int> v3(v2); //拷贝构造int类型的v2容器的复制品
方式四: 使用迭代器拷贝构造某一段内容。
//vector (InputIterator first, InputIterator last) 使用迭代器进行初始化构造
vector<int> v4(v2.begin(), v2.end()); //使用迭代器拷贝构造v2容器的某一段内容
注意:该方式也可用于拷贝其他容器的某一段内容。
string s("hello world");
vector<char> v5(s.begin(), s.end()); //拷贝构造string对象的某一段内容
vector的空间增长问题
size和capacity
通过size函数获取当前容器中的有效元素个数,通过capacity函数获取当前容器的最大容量。
#include <iostream>
#include <vector>
using namespace std;
int main() {
vector<int> v(10, 2);
cout << v.size() << endl; //获取当前容器中的有效元素个数 10
cout << v.capacity() << endl;//获取当前容器的最大容量 10
return 0;
}
resize和reserve
通过reserve函数改变容器的最大容量,resize函数改变容器中的有效元素个数。
reserve规则:
1、当所给值大于容器当前的capacity时,将capacity扩大到该值。
2、当所给值小于容器当前的capacity时,什么也不做。
resize规则:
1、当所给值大于容器当前的size时,将size扩大到该值,扩大的元素为第二个所给值,若未给出,则默认为0。
2、当所给值小于容器当前的size时,将size缩小到该值。
#include <iostream>
#include <vector>
using namespace std;
int main() {
vector<int> v;
for (int i = 0; i < 10; i++) {
v.push_back(i);
}
v.resize(5);
v.resize(8, 100);
v.resize(12);
// vector<int> v2(10,0); //这也可以 ,构造开空间,不推荐,有些情况不适用
cout << "v contains:";
for (size_t i = 0; i < v.size(); i++) {
cout << ' ' << v[i];// 0 1 2 3 4 100 100 100 0 0 0 0
}
cout << endl;
v.resize(8); //修改size值
v.reserve(8); //小于当前容量,什么都不做
cout << v.size() << endl; // 8
cout << v.capacity() << endl;// 16
cout << v.empty() << endl; // 0
}
vector的迭代器使用
begin和end
通过begin函数可以得到容器中第一个元素的正向迭代器,通过end函数可以得到容器中最后一个元素的后一个位置的正向迭代器。
rbegin和rend
通过rbegin函数可以得到容器中最后一个元素的反向迭代器,通过rend函数可以得到容器中第一个元素的前一个位置的反向迭代器。
示例:
void PrintVector(const vector<int> &v) {
// const对象使用const迭代器进行遍历打印
// vector<int>::iterator it = v.begin(); //err 必须const_迭代器
vector<int>::const_iterator it = v.begin();
while (it != v.end()) {
cout << *it << " ";
it++;
}
cout << endl;
}
// vector的迭代器遍历
int main() {
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
for (size_t i = 0; i < v.size(); i++) {
cout << v[i] << " ";// 1 2 3 4 5
}
cout << endl;
vector<int>::iterator it = v.begin();
while (it != v.end()) {
cout << *it << " ";// 1 2 3 4 5
it++;
}
cout << endl;
// C++11 范围for,底层是由迭代器实现的
for (auto e: v) {
cout << e << " ";// 1 2 3 4 5
}
cout << endl;
// 使用迭代器进行修改
it = v.begin();
while (it != v.end()) {
(*it) *= 2;
it++;
}
for (auto e: v) {
cout << e << " ";// 2 4 6 8 10
}
cout << endl;
// 使用反向迭代器进行遍历打印
vector<int>::reverse_iterator rit = v.rbegin();
while (rit != v.rend()) {
cout << *rit << " ";// 10 8 6 4 2
rit++;
}
cout << endl;
PrintVector(v);// 2 4 6 8 10
return 0;
}
vector的增删查改
push_back和pop_back
void push_back(const T& value);
push_back
函数将一个值 value
添加到std::vector
的末尾。它会自动调整容器的大小以适应新元素。
void pop_back();
pop_back
函数从std::vector
的末尾删除最后一个元素。它不会返回被删除的元素,只是简单地将容器的大小减小一个单位。
int main() {
vector<int> v;
// vector<int> v{1,2,3,4}; //C++11支持
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.pop_back();
auto it = v.begin();
while (it != v.end()) {
cout << *it << " ";// 1 2 3
it++;
}
cout << endl;
return 0;
}
insert和erase
iterator insert(iterator pos, const T& value);
insert
函数将一个值 value
插入到指定迭代器 pos
所指向的位置之前。它返回一个迭代器,指向新插入的元素。插入后,其他元素会向后移动以腾出空间。
iterator erase(iterator pos);
iterator erase(iterator first, iterator last);
erase
函数用于从std::vector
中删除一个或一段元素。第一个版本接受一个迭代器 pos
,它将删除该位置的元素,并返回指向下一个元素的迭代器。第二个版本接受两个迭代器 first
和 last
,它将删除这个范围内的元素,并返回指向被删除元素后面的迭代器。
int main() {
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.insert(v.begin(), 0);//在容器开头插入0
v.insert(v.begin(), 5, -1);//在容器开头插入5个-1
v.erase(v.begin());//删除容器中的第一个元素
v.erase(v.begin(), v.begin() + 5);//删除在该迭代器区间内的元素(左闭右开)
return 0;
}
以上是按位置进行插入或删除元素的方式,若要按值进行插入或删除(在某一特定值位置进行插入或删除),则需要用到find函数。
find
std::find
函数用于在容器中查找特定值,并返回一个迭代器指向第一个找到的匹配元素。如果未找到匹配元素,则返回容器的end()
迭代器。这个函数可以用于各种STL容器
template<class InputIterator, class T>
InputIterator find (InputIterator first, InputIterator last, const T& val);
find
函数在指定的范围 [first, last)
内查找值为 val
的元素。如果找到匹配元素,返回指向该元素的迭代器;如果未找到,则返回 last
。
int main() {
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器
v.insert(pos, 10);//在2的位置插入10
pos = find(v.begin(), v.end(), 3);//获取值为3的元素的迭代器
v.erase(pos);//删除3
return 0;
}
注意: find函数是在算法模块(algorithm)当中实现的,不是vector的成员函数。
元素访问
vector当中实现了 [ ] 操作符的重载,因此我们也可以通过“下标+[ ]”的方式对容器当中的元素进行访问。
at 函数:
reference at(size_type pos);
const_reference at(size_type pos) const;
at
函数用于访问指定位置的元素,并返回对该元素的引用。如果位置超出向量的范围,会抛出 std::out_of_range
异常。
data 函数:
T* data() noexcept;
const T* data() const noexcept;
data
函数返回指向向量中第一个元素的指针。这使你可以直接访问向量的底层数组,但要小心在不足范围的情况下使用。
front 函数:
reference front();
const_reference front() const;
front
函数返回向量的第一个元素的引用。
back 函数:
reference back();
const_reference back() const;
back
函数返回向量的最后一个元素的引用。
示例:
int main() {
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
cout << v[1] << endl;// 2
// cout<<v[7]<<endl; //越界不报错,打印0
cout << v.at(1) << endl;// 2
// cout<<v.at(7)<<endl; // 越界报错
cout << v.data() << endl; // 返回C格式地址,0xec1740
cout << v.front() << endl;// 1
cout << v.back() << endl; // 5
return 0;
}
assign/clear/swap
template <class T>
void assign(size_type n, const T& value);
assign
函数用于为向量分配新的元素值,以替换向量中的旧内容。
void clear();
clear
函数用于清空向量中的所有元素,将其大小重置为零,但保留分配的内存空间,以便后续的元素插入可以重用该内存。
template <class T>
void swap(T& a, T& b);
std::swap
函数用于交换两个变量的值。它是一个通用的函数,可以在不同类型的变量之间交换值。std::swap
函数非常有用,因为它可以在不需要临时变量的情况下执行值的交换,从而提高了代码的效率。
示例:
int main() {
vector<int> v1 = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
vector<int> v2 = {11, 12, 13, 14, 15};
v1.assign(v2.begin(), v2.end());
for (auto e: v1) {
cout << e << " ";// 11 12 13 14 15
}
cout << endl;
vector<int> v3 = {1, 2, 3, 4, 5};
v3.assign(5, 0);
for (auto e: v3) {
cout << e << " ";// 0 0 0 0 0
}
cout << endl;
// clear清理
v1.clear();
for (auto e: v1) {
cout << e << " ";// 什么都没有打印
}
cout << endl;
cout << v1.capacity() << endl;// 10;
cout << v1.size() << endl; // 0
// 交换v2和v3 v2为11 12 13 14 15 v3为0 0 0 0 0
v2.swap(v3);
for (auto e: v3) {
cout << e << " ";// 11 12 13 14 15
}
cout << endl;
return 0;
}
3.vector迭代器失效问题
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了 封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的 空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器, 程序可能会崩溃)。
迭代器失效问题举例
实例一:
#include <algorithm>
#include <iostream>
#include <vector>
using namespace std;
int main() {
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
//v: 1 2 3 4 5
vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器
v.insert(pos, 10); //在值为2的元素的位置插入10
//v: 1 10 2 3 4 5
v.erase(pos);//删除元素2 ???error(迭代器失效)
//v: 1 2 3 4 5
return 0;
}
在该代码中,我们本意是使用元素2的迭代器在原序列中2的位置插入一个10,然后将2删除,但我们实际上获取的是指向2的指针,当我们在2的位置插入10后,该指针就指向了10,所以我们之后删除的实际上是10,而不是2。
实例二:
#include <iostream>
#include <vector>
using namespace std;
int main() {
vector<int> v;
for (size_t i = 1; i <= 6; i++) {
v.push_back(i);
}
vector<int>::iterator it = v.begin();
while (it != v.end()) {
if (*it % 2 == 0)//删除容器当中的全部偶数
{
v.erase(it);
}
it++;
}
return 0;
}
该代码看上去实际上并没有什么错误,但如果你画图仔细分析,你就会发现该代码的问题所在,迭代器访问到了不属于容器的内存空间,导致程序崩溃。
不仅如此,而且在迭代器遍历容器中的元素进行判断时,并没有对1、3、5元素进行判断。
迭代器失效解决方法
使用迭代器时,永远记住一句话:每次使用前,对迭代器进行重新赋值。
实例一解决方案:
#include <algorithm>
#include <iostream>
#include <vector>
using namespace std;
int main() {
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
//v: 1 2 3 4 5
vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器
v.insert(pos, 10); //在值为2的元素的位置插入10
//v: 1 10 2 3 4 5
pos = find(v.begin(), v.end(), 2);//重新获取值为2的元素的迭代器
v.erase(pos); //删除元素2
//v: 1 10 3 4 5
return 0;
}
实例二解决方案:
#include <iostream>
#include <vector>
using namespace std;
int main() {
vector<int> v;
for (size_t i = 1; i <= 6; i++) {
v.push_back(i);
}
vector<int>::iterator it = v.begin();
while (it != v.end()) {
if (*it % 2 == 0)//删除容器当中的全部偶数
{
it = v.erase(it);//删除后获取下一个元素的迭代器
} else {
it++;//是奇数则it++
}
}
return 0;
}
对于实例二,我们可以接收erase函数的返回值(erase函数返回删除元素的后一个元素的新位置),并且控制代码的逻辑:当元素被删除后继续判断该位置的元素(因为该位置的元素已经更新,需要再次判断)。
4.vector模拟实现
vector的核心框架接口的模拟实现
#pragma once
#include <algorithm>
#include <cassert>
#include <functional>
#include <iostream>
#include <string.h>
#include <string>
using namespace std;
template<class T>
class vector {
public:
typedef T *iterator;
typedef const T *const_iterator;
vector()
: _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
}
vector(size_t n, const T &val = T())
: _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
reserve(n);
for (size_t i = 0; i < n; i++) {
push_back(val);
}
}
// 重载构造函数
vector(int n, const T &val = T())
: _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
reserve(n);
for (int i = 0; i < n; i++) {
push_back(val);
}
}
// 迭代器构造函数
template<class InputIterator>
vector(InputIterator first, InputIterator last) {
while (first != last) {
push_back(*first);
first++;
}
}
vector(const vector<T> &v) {
_start = new T[v.capacity()];
// memcpy(_start, v._start, sizeof(T) * v.size());
// memcpy会还会导致深拷贝里的深拷贝问题。
// 对于自定义类型,自定义类型里的内存,会被复制,那么拷贝构造的会指向同一块空间,会因调用析构函数出现报错。
// 在进行深拷贝时,应该确保源vector的元素数量小于或等于目标vector的容量,否则会发生缓冲区溢出。
if (v.size() <= capacity())// 确保源向量的大小小于或等于目标向量的容量
{
for (size_t i = 0; i < v.size(); i++) {
// new (_start + i) T(v._start[i]);
// 调用拷贝构造函数进行深拷贝
_start[i] = v._start[i];
// 进行_start[i]赋值。赋值对于自定义类型,会额外开空间,进行深拷贝。这样就解决了深拷贝里的深拷贝
}
_finish = _start + v.size();
} else// 如果源向量的大小大于目标向量的容量,只拷贝目标向量能容纳的部分
{
for (size_t i = 0; i < capacity(); i++) {
_start[i] = v._start[i];
}
_finish = _start + capacity();
}
_end_of_storage = _start + v.capacity();
}
iterator begin() {
return _start;
}
iterator end() {
return _finish;
}
// 这里必须加上const,两个begin函数,只是参数返回类型不同
// 编译器无法根据函数返回类型来区分函数,
// 因为函数重载不允许仅仅因为返回类型不同而进行区分。这将导致编译错误。
// 加入const修饰符,以便编译器可以正确地区分这两个函数
const_iterator begin() const {
return _start;
}
const_iterator end() const {
return _finish;
}
void reserve(size_t n) {
int sz = size();
// n>capacity才需要扩容,否则n<capacity可能会缩容
if (n > capacity()) {
T *tmp = new T[n];
// 将_start的内存,拷贝到tmp中
if (_start) {
// memcpy是一种浅拷贝函数,这里会引起内存问题 ,因为后面_start要释放,调用析构函数
// memcpy(tmp, _start, sizeof(T*) * size());
for (size_t i = 0; i < size(); i++) {
// 手动深拷贝
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
// 这里_start内存发生了变化,所以_finish需要重新初始化,加上原来的sz即可
// 不可以加上现在的size(),因为_start发生了变化,size()得不到想要的结果
_end_of_storage = _start + n;
}
}
void resize(size_t n, T val = T())// //T()默认构造,匿名对象,对于自定义类型,和内置类型比如int都会初始化
{
if (n < size()) {
// 缩容
_finish = _start + n;
} else {
if (n > capacity()) {
reserve(n);
}
while (_finish != _start + n) {
*_finish = val;
_finish++;
}
}
}
void push_back(const T &x) {
if (_finish == _end_of_storage) {
// 扩容 一种是一开始都为NULL,另一种是需要扩容
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
*_finish = x;// 可能发生空指针解引用
_finish++;
}
void pop_back() {
if (!empty())
_finish--;
}
void insert(iterator pos, const T &val = T()) {
assert(pos >= _start);
assert(pos <= _finish);
if (_finish == _end_of_storage) {
// 迭代器失效问题!
// reserve扩容,会释放掉旧空间,那么pos位置也会被释放,需要更新pos,解决pos失效的问题
// 那么pos的位置怎么算呢,相对位置! 算出pos之前的相对_start的相对位置
int len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
// 更新pos
pos = _start + len;
}
iterator end = _finish - 1;
while (end >= pos) {
*(end + 1) = *end;
end--;
}
*pos = val;
_finish++;
}
// erase后迭代器需要更新,因为迭代器指向的在删除后,会改变指向
iterator erase(iterator pos) {
assert(pos >= _start);
assert(pos < _finish);
iterator start = pos + 1;
while (start != _finish) {
*(start - 1) = *(start);
++start;
}
_finish--;
// 返回pos的下一个地址,pos的下一个地址的值被赋值给上一个,所以还是返回pos。
return pos;
}
bool empty() const {
return _start == _finish;
}
size_t capacity() const {
return _end_of_storage - _start;
}
size_t size() const {
return _finish - _start;
}
T &operator[](size_t pos) {
return _start[pos];
}
const T &operator[](size_t pos) const {
return _start[pos];
}
~vector() {
delete[] _start;
_start = nullptr;
_finish = nullptr;
_end_of_storage = nullptr;
}
private:
// vector的成员变量为3个迭代器
iterator _start = nullptr;
iterator _finish = nullptr;
iterator _end_of_storage = nullptr;
//_start 为开始下标0
//_finish 为数值的下一个位置
//_end_of_storage 为容量
};
使用memcpy拷贝问题
假设模拟实现的vector中的reserve接口中,使用memcpy
进行的拷贝,以下代码会发生什么问题?
int main() {
vector<string> v;
v.push_back("1111");
v.push_back("2222");
v.push_back("3333");
return 0;
}
问题分析:
memcpy
是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中- 如果拷贝的是内置类型的元素,
memcpy
既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy
的拷贝实际是浅拷贝。
结论:如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,因为memcpy是浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。
动态二维数组理解
#include <vector>
using namespace std;
// 以杨慧三角的前n行为例:假设n为5
void test2vector(size_t n) {
vector<vector<int>> vv(n);
for (size_t i = 0; i < n; ++i)
vv[i].resize(i + 1, 1);
// 给杨慧三角出第一列和对角线的所有元素赋值
for (int i = 2; i < n; ++i) {
for (int j = 1; j < i; ++j) {
vv[i][j] = vv[i - 1][j] + vv[i - 1][j - 1];
}
}
}
构造一个vv动态二维数组,vv中总共有n个元素,每个元素都是vector类 型的,每行没有包含任何元素,如果n为5时如下所示:
vv中元素填充完成之后,如下图所示: