目录
1.Vector介绍
2.Vector的常见使用
2.1 vector构造函数
2.2 vector iterator使用
2.3 vector空间增长问题
2.4 vector增删改查
2.5 vector迭代器失效问题
3.Vector深度剖析及模拟实现
3.1 模拟实现(可跳过)
3.2 不使用memcpy剖析
1.Vector介绍
- vector是表示可变大小数组的序列容器。
- 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
- 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
- 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
- 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list 统一的迭代器和引用更好。
2.Vector的常见使用
2.1 vector构造函数
(constructor)构造函数声明 | 接口说明 |
vector() | 无参构造 |
vector (size_type n,const value_type&val=value_type()) | 构造并初始化n个val |
vector (const vector& x)
| 拷贝构造 |
vector (InputIterator fifirst, InputIterator last)
| 迭代器进行初始化构造 |
2.2 vector iterator使用
iterator的使用 | 接口说明 |
begin+end |
获取第一个数据位置的
iterator/const_iterator
, 获取最后一个数据的下一个位置的iterator/const_iterator
|
rbegin+rend |
获取最后一个数据位置的
reverse_iterator
,获取第一个数据前一个位置的reverse_iterator
|
简单使用例子:
void test1()
{
vector<int> V;
V.push_back(1);
V.push_back(2);
V.push_back(3);
V.push_back(4);
vector<int>::iterator it = V.begin();
while (it != V.end())
{
cout << *it << ' ';
++it;
}
cout << endl;
//反向迭代器
vector<int>::reverse_iterator rit = V.rbegin();
while (rit != V.rend())
{
cout << *rit << ' ';
++rit;
}
cout << endl;
}
2.3 vector空间增长问题
容量空间 | 接口说明 |
size | 获取数据个数 |
capacity | 获取容量大小 |
empty | 判断是否为空 |
resize | 改变vector的size |
reserve | 改变vector的capacity |
测试vector的默认扩容机制:
void TestVectorExpand()
{
size_t sz;
vector<int> v;
sz = v.capacity();
cout << "making v grow:\n";
for (int i = 0; i < 100; ++i)
{
v.push_back(i);
if (sz != v.capacity())
{
sz = v.capacity();
cout << "capacity changed: " << sz << '\n';
}
}
}
vs下运行:
gcc下运行:
- capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。
reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。 resize在开空间的同时还会进行初始化,影响size。
void test2()
{
vector<int> v;
// set some initial content:
for (int i = 1; i < 10; i++)
v.push_back(i);
v.resize(5);
v.resize(8, 100);
v.resize(12);
cout << v.size() << endl;
cout << "v contains:";
for (size_t i = 0; i < v.size(); i++)
cout << ' ' << v[i];
cout << endl;
}
使用reserve提前设置好容量:
2.4 vector增删改查
vector增删改查 | 接口说明 |
push_back | 尾插 |
pop_back | 尾删 |
find | 查找(算法模块实现,不是vector成员接口) |
insert | 在pos前插入val |
erase | 删除pos位置数据 |
swap | 交换两个vector数据空间 |
operator[ ] | 像数组一样下标访问 |
测试代码:
void test3()
{
vector<int> v{ 1,2,3,4 };//列表方式初始化,C++11新语法
v.push_back(5);
v.push_back(6);
v.pop_back();
for (size_t i = 0; i < v.size(); i++)
{
cout << v[i] << ' ';
}
cout << endl;
vector<int>::iterator pos = find(v.begin(), v.end(), 3);
if (pos != v.end())
{
v.insert(pos, 0);
}
pos = find(v.begin(), v.end(), 3);
v.erase(pos);
for (size_t i = 0; i < v.size(); i++)
{
cout << v[i] << ' ';
}
cout << endl;
}
2.5 vector迭代器失效问题
细心的朋友,可能已经发现我上面圈出来的重复find查找了一次,这是因为如果不再find给pos赋值,insert后不接受迭代器返回值继续erase会造成迭代器失效问题。
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。
对于vector可能会导致其迭代器失效的有效的操作有:
- 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。
扩容后原来的pos已经失效,变为野指针。
若不扩容insert后pos指向插入元素。
- 指定位置元素的删除——erase
vector<int>::iterator pos = find(v.begin(), v.end(), 3);
if (pos != v.end())
{
pos=v.insert(pos, 0);
//pos当前指向0
}
//删除3
++pos;
v.erase(pos);
3.Vector深度剖析及模拟实现
3.1 模拟实现(可跳过)
私有成员变量:与上图保持一致
iterator _start;
iterator _finish;
iterator _end_of_storage;
构造函数:
拷贝构造函数:(现代写法)
swap:
赋值运算符重载:(现代写法)
析构函数:
迭代器:
size和capacity:
reserve:(为什么不使用memcpy在后面将解)
resize:
operator[ ]:
insert:
erase:
push_back,pop_back():(复用insert,erase)
3.2 不使用memcpy剖析
memcpy是浅拷贝
1.memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。2. 如果拷贝的是自定义类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。
假设一个vector<vector<int>>类型,实际内存分配:
memcpy分配:(浅拷贝,释放2次空间,第二次为野指针造成内存泄漏)
采取深拷贝(自己实现):