总言
主要讲述vector的模拟实现。
文章目录
- 总言
- 1、基本框架搭建:成员变量
- 2、对构造函数、析构函数
- 3、增删查改、空间扩容
- 3.1、vector::push_back、vector::pop_back
- 3.2、vector::reserve、vector::capacity、vector::size
- 3.3、operator[ ]
- 3.4、遍历:迭代器(begin、end)、范围for
- 3.5、vector::insert、vector::erase 迭代器失效
- 3.5.1、vector::insert
- 3.5.2、迭代器失效
- 3.5.3、vector::erase
- 3.5.5、细节问题:不同编译器下的迭代器失效
- 3.6、vector::resize
- 3.7、vector::front、vector::back
- 4、拷贝构造与赋值:vector的深拷贝问题
- 4.1、深浅拷贝说明
- 4.2、vector拷贝构造演示
- 4.2.1、写法一:自己开辟空间,自己拷贝数据
- 4.2.2、写法二:复用
- 4.2.3、使用迭代器区间构造构造函数
- 4.2.4、写法三:复用4.2.3、vector:: swap
- 4.2.5、构造函数:n个val值
- 4.3、vector赋值:operator=
- 4.4、二维数组下深浅拷贝问题
1、基本框架搭建:成员变量
同string类模拟实现一致,此处为了解决命名冲突问题,我们使用添加命名空间myvector
的方式来处理。
#pragma once
namespace myvector
{
template<class T>
class vector
{
typedef T* iterator;//将模板T*命名为迭代器iterator
public:
private:
iterator _start;//起始
iterator _finish;//结束
iterator _end_of_storage;//容量空间
};
}
由于后续涉及到迭代器问题,若将typedef T* iterator;
定义成私有,则无法在类外很好的使用。此处修改如下:
#pragma once
namespace myvector
{
template<class T>
class vector
{
public:
typedef T* iterator;//将模板T*命名为迭代器iterator
typedef const T* const_iterator;
private:
iterator _start;//起始
iterator _finish;//结束
iterator _end_of_storage;//容量空间
};
}
2、对构造函数、析构函数
1)、构造函数
对构造函数,我们之前学习时看到其中有内存池的相关内容,此处由于我们暂时没学习它,故对vector的模拟实现中我们不使用它。
vector() //构造函数
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{}
2)、析构函数
~vector()//析构函数
{
delete[] _start;//null出来的空间是连续一块的,以_start为起始点。注意delete的使用方式
_start = _finish = _end_of_storage = nullptr;
}
3、增删查改、空间扩容
3.1、vector::push_back、vector::pop_back
1)、库函数中声明回顾
2)、push_back模拟实现
void push_back(const T& x)
{
//涉及扩容检查
if (_finish == _end_of_storage)
{
reserve(capacity() == 0?4:capacity() * 2);
}
//尾插数据
*_finish = x;
_finish++;
}
为什么需要使用引用和const修饰?
因为这里使用的是T模板参数,我们传入的值可能是内置类型,也可能是自定义类型,如果是后者,则传值传参代价很大。
3)、pop_back模拟实现
void pop_back()
{
assert(_finish > _start);
_finish--;
}
3.2、vector::reserve、vector::capacity、vector::size
1)、库函数中声明回顾
2)、模拟实现
size_t size()const
{
return _finish - _start;
}
size_t capacity()const
{
return _end_of_storage - _start;
}
void reserve(size_t n)
{
if (n > capacity())//满足该条件才进行扩容
{
size_t sz = size();//因为后续重新确定指向关系时需要知道size值
T* tmp = new T[n];
if (_start)//说明原先空间有数据,
{
memcpy(tmp, _start, sizeof(T) * sz);//需要挪动
delete[] _start;//释放旧空间
}
//重新确定指向关系
_start = tmp;
_finish = _start + sz;
//_finish = _start + size();//如果是在这里获取size值,则在原先空间有数据的情况下,_start已经被delete
_end_of_storage = _start + n;
}
}
3.3、operator[ ]
1)、库函数中声明回顾
2)、模拟实现
T& operator[](size_t pos)//加&是为了支持可读可写
{
assert(pos < size());//检查下标是否非法
return _start[pos];
}
const T& operator[](size_t pos)const
{
assert(pos < size());
return _start[pos];
}
3.4、遍历:迭代器(begin、end)、范围for
1)、普通迭代器
//vector的迭代器就是原生指针
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
2)、const修饰的迭代器
为什么需要?
存在如下的情况:const vector<int>& v
,所创建的vector对象被const修饰,如果直接使用vector<int>::iterator it = v.begin();
,则属于权限放大。
typedef const T* const_iterator;
const const_iterator begin()const
{
return _start;
}
const const_iterator end()const
{
return _finish;
}
void Func(const vector<int>& v)
{
vector<int>::const_iterator it = v.begin();
while (it != v.end())
{
//*it = 10;//error
cout << *it << " ";
++it;
}
cout << endl;
for (auto e : v)//此处若使用范围for,const对象会调用对应的const迭代器
{
cout << e << " ";
}
cout << endl;
}
3)、为什么说范围for是傻瓜式替换?
只要我们仿照库中使用对应字符begin、end,则访问for就能起效。相应的,如果我们使用了Begin、End等其它字母,则在我们模拟的vector中范围for失效。
3.5、vector::insert、vector::erase 迭代器失效
3.5.1、vector::insert
1)、库函数中声明回顾
2)、insert模拟实现1.0
void insert(iterator pos, const T& val)
{
assert(pos <= _finish && pos >= _start);
//扩容检查
if (_finish == _end_of_storage)
{
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
//数据挪动
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
//插入val值
*pos = val;
++_finish;
}
3)、insert涉及扩容时迭代器失效问题
问题:
原因解释:
4)、insert模拟实现2.0
解决方案: 若扩容,则要顺带更新pos指向位置
//保存二者指针差距
size_t len = pos - _start;
//扩容后更新pos指向
pos = len + _start;
void insert(iterator pos, const T& val)
{
assert(pos <= _finish && pos >= _start);
//扩容检查
if (_finish == _end_of_storage)
{
//保存二者指针差距
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
//扩容后更新pos指向
pos = len + _start;
}
//数据挪动
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
//插入val值
*pos = val;
++_finish;
}
3.5.2、迭代器失效
1)、问题引入与现象分析
接上一阶段代码,分析下述情形:
一开始我们使用find找到了p位置,然后在p位置前插入一次,现在我们变为p位置前连续插入多次。问:是否能成功?
//使用算法中的find
auto p = find(v.begin(), v.end(), 3);
if (p != v.end())//找到了
{
v.insert(p, 30);//1、插入一个30
cout << *p << endl;//2、再次来到p的位置
v.insert(p, 40);//3、我们p位置前插入一个40,问:是否能成功?
}
现象如下:
可能出现疑问如下:我们在3.5.1中解决了insert中pos位置更新的问题,为什么此处p仍旧不起效?
这里我们需要思考上述写的insert函数中,形参pos和实参p之间的关系。可知晓的是,在insert函数中,它们是值传递,故形参改变不影响实参。
void insert(iterator pos, const T& val)
{
assert(pos <= _finish && pos >= _start);
//扩容检查
if (_finish == _end_of_storage)
{
//保存二者指针差距
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
//扩容后更新pos指向
pos = len + _start;
}
//数据挪动
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
//插入val值
*pos = val;
++_finish;
}
2)、解决方案
①一个相对比较适合的方法是,在此类情况中,最好别再p位置失效后再去访问p。
②有人可能提出,我们在insert中为pos加上一个引用,即传引用返回,这样不就解决了?void insert(iterator& pos, const T& val)
void insert(iterator& pos, const T& val)
{
assert(pos <= _finish && pos >= _start);
//扩容检查
if (_finish == _end_of_storage)
{
//保存二者指针差距
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
//扩容后更新pos指向
pos = len + _start;
}
//数据挪动
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
//插入val值
*pos = val;
++_finish;
}
事实上这样做,针对insert而言确实可以解决问题,但同样会面临新的问题。
第一,这样的模拟实现与库中不匹配,库中直接使用iterator pos
;
第二,这样做会带来新的问题,如下:
v.insert(v.begin(), 1);
此段代码无法编译通过。因为begin模拟实现时,我们使用的是iterator传值返回,中间会生成一份临时变量,具有常性,后续insert处权限放大。
Ⅰ、若为insert加上const,那么又无法解决修改问题。
Ⅱ、而如果将begin也写为传引用返回,iterator& begin()
,这样会使得begin具有修改能力,反而增添麻烦。
iterator begin()
{
return _start;
}
3)、思考:上述值传递中,p一定存在迭代器失效问题吗?
回答:同3.5.2中所讲,在涉及扩容问题时,p才存在失效。
演示:如下述,假如我们一开始插入5个数值,容量空间足够的情况下,此处不存在p失效问题。
4)、insert为push_back提供复用
void push_back(const T& x)
{
insert(end(), x);
}
5)、insert模拟实现3.0:案例演示
案例要求: 在所有的偶数前插入该偶数的二倍值。
代码演示+现象分析:
我们以上述insert2.0版本为例进行演示,顺带再来回顾一下迭代器失效问题。
void test_vector5()
{
std::vector<int> v;
v.reserve(10);
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//v.push_back(5);
//在所有偶数前插入该偶数的2倍
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
v.insert(it, *it * 2);
}
++it;
}
}
上述代码我们直接运行则程序崩溃无输出结果,调试后发现如下:it始终指向2的位置。这就是迭代器失效的另一种模式:因为数据挪动,导致外部指针指向错乱。
ps: 迭代器失效的第一种模式:函数内扩容,导致野指针。
为了解决上述问题,也一并解决insert中扩容后外部迭代器失效问题,一个方案如下:
Ⅰ、对insert
函数,模仿库中带上iterator
返回值;
Ⅱ、对原先的二倍插入循环,需要更新it
指向的新位置,旨在解决扩容后外部迭代器失效问题。
iterator insert(iterator pos, const T& val)
{
assert(pos <= _finish && pos >= _start);
//扩容检查
if (_finish == _end_of_storage)
{
//保存二者指针差距
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
//扩容后更新pos指向
pos = len + _start;
}
//数据挪动
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
//插入val值
*pos = val;
++_finish;
return pos;
}
void test_vector5()
{
std::vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//v.push_back(5);
//在所有偶数前插入该偶数的2倍
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
it=v.insert(it, *it * 2);
++it;
}
++it;
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
演示结果:
3.5.3、vector::erase
1)、erase模拟实现1.0
void erase(iterator pos)
{
assert(pos < _finish && pos >= _start);
iterator end = pos + 1;
while (end < _finish)
{
*(end - 1) = *end;
++end;
}
--_finish;
}
2)、erase是否会导致迭代器失效?
①主要看编译器如何实现erase函数,不排除有些编译器以时间换空间进行缩容:
if (size() < capacity()/2)
{
// 缩容 -- 以时间换空间
}
②其它案例演示:删除vector中的偶数
使用代码如下:
void erase(iterator pos)
{
assert(pos < _finish && pos >= _start);
iterator end = pos + 1;
while (end < _finish)
{
*(end - 1) = *end;
++end;
}
--_finish;
}
void test_vector4()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//v.push_back(5);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
//删除所有偶数
auto it = v.begin();
while (it != v.end())
{
if(*it % 2 == 0)
{
v.erase(it);
}
++it;
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
现象如下:
3)、erase模拟实现2.0
iterator erase(iterator pos)
{
assert(pos < _finish && pos >= _start);
iterator end = pos + 1;
while (end < _finish)
{
*(end - 1) = *end;
++end;
}
--_finish;
//if (size() < capacity()/2)
//{
// // 缩容 -- 以时间换空间
//}
return pos;
}
基于2.0版
本的erase
我们再来修改上述 2) 中的题目:
void test_vector4()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//v.push_back(5);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
//删除所有偶数
auto it = v.begin();
while (it != v.end())
{
if(*it % 2 == 0)
{
it=v.erase(it);
}
else {
++it;
}
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
3.5.5、细节问题:不同编译器下的迭代器失效
需要注意的是,上述我们对迭代器失效的问题演示,其结果是未定义的,因为针对不同平台其STL底层实现并不一致。
即,STL只是一个规范,其细节如何实现不做要求。
VS:PJ版。
g++:SGI版。
3.6、vector::resize
1)、库函数中声明回顾
2)、模拟实现
根据上述可知,resize
面临三种情况:
Ⅰ、当n>capacity
:扩容+使用val初始化;
Ⅱ、当size<n<capacity
:使用val初始化;
Ⅲ、当n<size
:删除多余数据
模拟实现如下:
void resize(size_t n, const T& val=T())
{
if (n > capacity())
{
reserve(n);
}
if (n > size())//两种情况:n>capacity、size<n<capacity
{
//只需要初始化即可
while (_finish < _start + n)
{
push_back(val);
++_finish;
}
}
else
{
_finish = _start + n;
}
}
演示验证一:
void test_vector11()
{
//resize常用场景:在生成对象后开辟空间
vector<int>v;
v.resize(5);//验证默认缺省值
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
v.resize(10, 2);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
演示验证二:
void test_vector11()
{
vector<int> v1;
v1.reserve(10);
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
v1.resize(8,8);//由大到小,而值只有5个,会添3个值
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
}
3.7、vector::front、vector::back
1)、库函数中声明回顾
2)、模拟实现
T& front()
{
assert(size() > 0);
return *_start;
}
T& back()
{
assert(size() > 0);
return *(_finish - 1);
}
4、拷贝构造与赋值:vector的深拷贝问题
4.1、深浅拷贝说明
1)、知识回顾
在类和对象章节,我们曾说明:拷贝构造对于内置类型完成浅拷贝/值拷贝,对于自定义类型则会调用它对应的拷贝构造。
2)、vector拷贝构造分析
vector的成员变量是内置类型,故编译器默认生成的拷贝构造函数完成的是浅拷贝。
PS:typedef T* iterator;
、此处尽管iterator
是类模板,且T*
会存在自定义类型的指针,但其仍旧是内置类型。
private:
iterator _start;//起始
iterator _finish;//结束
iterator _end_of_storage;//容量空间
以如下代码进行拷贝构造:
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
vector<int> v2(v);
for (auto e : v2)
{
cout << e << " ";
}
cout << endl;
浅拷贝带来的两个问题:
Ⅰ、析构两次
Ⅱ、一个对象的修改,会影响另一个对象
4.2、vector拷贝构造演示
4.2.1、写法一:自己开辟空间,自己拷贝数据
vector(const vector<T>& v)
{
_start = new T[v.size()];//此处也可以开辟v.capacity()大小的空间,各有各的优缺点
memcpy(_start, v._start, sizeof(T)*v.size());//照搬数据
_finish = _start + v.size();
_end_of_storage = _start + v.size();//此处this._finish的大小根据上述我们开辟空间时的选择而变动
}
4.2.2、写法二:复用
vector(const vector<T>& v)
:_start(nullptr)
,_finish(nullptr)
,_end_of_storage(nullptr)
{
reserve(v.size());
for (const auto& e : v)
{
push_back(e);//this.push_back()
}
}
4.2.3、使用迭代器区间构造构造函数
1)、vector构造函数:使用迭代器区间构造1.0
涉及问题:
Ⅰ、能否双模板嵌套式使用?
Ⅱ、为什么需要新定义一个模板InputIterator
,而不使用原先的Iterator
?
template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
while (first != last)
{
push_bakc(*first);
++first;
}
}
void test_vector7()
{
string str("hello world");
vector<int> v(str.begin(), str.end());//使用迭代器区间构造
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
上述代码是否会存在什么问题?
回答:_start
、_finish
、_end_of_storage
没有初始化,在有些编译器下其是随机值,那么reserve
开辟空间时,此处非空就会拷贝数据、释放空间、存在越界问题。
2)、vector构造函数:使用迭代器区间构造2.0
_start
、_finish
、_end_of_storage
初始化为空。
//使用迭代区间的构造函数:含类模板
template <class InputIterator>
vector(InputIterator first, InputIterator last)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
while (first != last)
{
push_back(*first);
++first;
}
}
4.2.4、写法三:复用4.2.3、vector:: swap
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v.__end_of_storage);
}
vector(const vector<T>& v)
:_start(nullptr)
,_finish(nullptr)
,_end_of_storage(nullptr)
{
vector<T> tmp(v.begin(), v.end());
swap(tmp);
}
4.2.5、构造函数:n个val值
1)、模拟实现及细节解析
vector(size_t n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
reserve(n);
for (size_t i = 0; i < n; ++i)
{
push_back(val);
}
}
对const T& val = T()
,实际上这个函数使用了半缺省参数,其缺省值是T()
,一个T类型的匿名对象。
Ⅰ、假若T()
是自定义类型,则调用自定义类型的默认构造(事实上内置类型也有模板参数)
Ⅱ、假若T()
是内置类型,因C++中模板的出现,也拥有对应的默认构造函数,此处以int举例。
void test_vector9()
{
int i=11;
int j = int();
int k(10);
cout << "i:" << i << endl;
cout << "j:" << j << endl;
cout << "k:" << k << endl;
}
2)、演示
void test_vector10()
{
vector<int>v1(10);//验证默认缺省值
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
vector<int*>v2(5);
for (auto e : v2)
{
cout << e << " ";
}
cout << endl;
}
3)、一个错误说明
vector<int>v1(10,1);//验证默认缺省值
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
原因解释:类型匹配。
4.3、vector赋值:operator=
//赋值v1=v2
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
4.4、二维数组下深浅拷贝问题
1)、问题引入
在vector(一)中,我们曾写过杨辉三角:其涉及到了vector<vector<int>>
嵌套使用。
class Solution {
public:
vector<vector<int>> generate(int numRows) {
vector<vector<int>> vv;//定义一个vector<vector<int>>类型的数据
vv.resize(numRows);//第一次开辟空间:numRows,表示总行数(整体大小)
for(size_t i=0;i<numRows;i++)//对每行预处理:空间大小、边界数值
{
vv[i].resize(i+1,0);//第二次开辟空间,表示初始化杨辉三角的每行大小
vv[i].front()=vv[i].back()=1;//杨辉三vv.size()角每行首尾数据为1
//vv[i].resize(i+1,1);//上述代码也可以合并为一行实现
}
for(size_t i=2;i<vv.size();i++)//对每行的中间数据做处理:第i行第j个元素=第i-1行第j=1个元素+第i-1行第j个元素
{
for(size_t j=1;j<i;j++)
{
vv[i][j]=vv[i-1][j-1]+vv[i-1][j];
}
}
return vv;
}
};
vector<vector<int>> ret = Solution().generate(5);
在使用std中的vector时,这段代码成功运行。而将其放入我们自己实现的vector中,则会发现运行失败。
为什么我们自己的模拟实现的vector会失败呢?
Ⅰ、对vector<vector<int>> generate(int numRows)
,如果我们不传值返回,运行成功,而传值返回运行失败。需要注意的是,此处传值返回涉及自定义类型,有深浅拷贝问题。
Ⅱ、基于此我们调试发现:外层的vector深拷贝成功(值一致、地址空间不一致),而内存的vector居然是浅拷贝。
以上是现象,现在来分析情况:
①自定义类型传值返回,中间生成一个临时变量,涉及深浅拷贝问题。
②拷贝构造我们模拟实现了两类,一类是传统写法,使用了memcpy,由上述图二可知,memcpy是浅拷贝,那么就涉及到同一空间析构两次的问题。修改方法如下:
vector(const vector<T>& v)//拷贝构造传统写法
{
_start = new T[v.size()];//此处也可以开辟v.capacity()大小的空间,各有各的优缺点
//memcpy(_start, v._start, sizeof(T)*v.size());//照搬数据
for (size_t i = 0; i < sz; i++)//照搬数据
{
_start[i] = v._start[i];
}
_finish = _start + v.size();
_end_of_storage = _start + v.size();//此处this._finish的大小根据上述我们开辟空间时的选择而变动
}
③假若使用的是现代写法,在我们写的两个以swap为交换的拷贝构造,都没问题。此处出现问题的是扩容。原先我们写的扩容函数中用了memcpy,同样是浅拷贝导致。修改方法如下:
void reserve(size_t n)
{
if (n > capacity())//满足该条件才进行扩容
{
size_t sz = size();//因为后续重新确定指向关系时需要知道size值
T* tmp = new T[n];
if (_start)//说明原先空间有数据,
{
//memcpy(tmp, _start, sizeof(T) * sz);//需要挪动
for (size_t i = 0; i < sz; i++)//需要挪动
{
tmp[i] = _start[i];
//*(tmp + i) = *(_start + i);
}
delete[] _start;//释放旧空间
}
//重新确定指向关系
_start = tmp;
_finish = _start + sz;
//_finish = _start + size();//如果是在这里获取size值,则在原先空间有数据的情况下,_start已经被delete
_end_of_storage = _start + n;
}
}