本文主要介绍vector的常见接口的模拟实现

文章目录

vector中常用类成员
二、vector的底层结构
三、vector的默认成员函数
- 构造函数1—空构造
- 构造函数2—迭代器区间构造
- 拷贝构造函数
- 赋值运算符重载
- 析构函数
四、迭代器相关的函数
- 迭代器的分类
- 迭代器对应的STL容器分类
- 迭代器失效问题
- 迭代器相关的函数
- 迭代器失效问题总结
五、vector中容量大小相关的函数
- size()函数
- capacity()函数
- empty()函数
六、vector中扩容相关的函数
- reserve()函数
- 使用memcpy浅拷贝问题！！！
- resize()函数
七、vector的增加数据相关的函数
- push_back( )
- insert()函数
- 八、vector的删除数据相关的函数
- pop_back()函数
- erase()函数
九、vector的查找数据相关的函数
- operator[ ]下标查找
十、其他函数
- swap()函数
十一、理解杨辉三角问题

vector中常用类成员

我们就用这三个私有成员来模拟实现我们的vector

namespace mwq//自定义命名空间与标准库中的以区别开来
{
	template<class T>//类模板
	class vector
	{
	public:
		typedef T* iterator;                            //类型指针
		typedef const T* const_iterator;
		vector();                                       //构造函数1
		
		template<class InputIterator>;//用一段迭代器区间去初始化，为了支持任意类型，用到了模板
		vector(InputIterator first, InputIterator last);//构造函数2

		vector(const vector<T>& v);                     //拷贝构造函数

		vector<T>& operator=(vector v);                 //赋值运算符重载

		~vector();                                      //析构函数

		//迭代器相关的函数
		iterator begin();
		const_iterator begin() const;
		iterator end();
		const_iterator end()const;


		//容量大小相关的函数
		size_t size()const;
		size_t capacity()const;
		bool empty();


		//扩容相关的函数
		void reserve(size_t n);
		void resize(size_t n, const T& val = T());

		//插入数据相关的函数
		iterator insert(iterator pos, const T& x);//在pos位置之前插入数据x
		void push_back(const T& x);               //尾插


		//删除数据相关的函数
		void pop_back();
		iterator erase(iterator pos);


		//下标访问相关的函数
		T& operator[](size_t i);
		const T& operator[](size_t i)const;

		//其他函数
		void Swap(vector<T>& v);

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

二、vector的底层结构

我们就用这三个私有成员来模拟实现我们的vector

iterator _start;//开始位置的指针
iterator _finish;//结束的下一个位置的指针
iterator _endofstorage;//最大容量的下一个位置的指针

在这里插入图片描述

三、vector的默认成员函数

构造函数1—空构造

vector()
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{}

构造函数2—迭代器区间构造

//用一段迭代器区间去初始化，为了支持任意类型，用到了模板
template<class InputIterator>
vector(InputIterator first, InputIterator last)
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	while (first != last)
	{
		push_back(*first);
		++first;
	}
}

拷贝构造函数

写法一：传统写法

//v1(v2)
//传统写法
//错误：当T为自定义类型时，会出现浅拷贝（因为使memcpy）！！！
vector(const vector<T>& v)
{
	_start = new T[v.capacity()];
	//memcpy(_start,v._start,sizeof(T)*v.size());//浅拷贝

	//深拷贝
	for (size_t i = 0; i < v.size(); ++i)
	{
		_start[i] = v._start[i]; //对于内置类型会调用他的赋值运算符重载
	}
	_finish = _start + v.size();
	_endofstorage = _start + v.capacity();
	
}

注意：上述的new出来一块空间，所以不需要写初始化列表。

写法二：现代写法（更推荐）

// vv1.swap(vv2)
//现代写法
vector(const vector<T>& v)
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{

	//（深拷贝）
	vector<T> tmp(v.begin(), v.end());//利用迭代器区间进行初始化tmp
	Swap(tmp);//交换this对象和tmp对象里面的值（直接交换指针了）
}

赋值运算符重载

写法一：传统写法

//v1=v2
//传统写法
vector<T>& operator=(const vector<T>& v)
{
	//自定义类型。在开空间，进行深拷贝
	if (this != &v) //防止自己给自己赋值
	{
		delete[] _start; //释放原来的空间
		_start = new T[v.capacity()]; //新开辟一块和容器v大小相同的空间
		for (size_t i = 0; i < v.size(); i++) //将容器v当中的数据一个个拷贝过来
		{
			_start[i] = v[i];
		}
		_finish = _start + v.size(); //更新_finish
		_endofstorage = _start + v.capacity(); //更新_endofstorage
	}
	return *this; //支持连续赋值，返回引用
}

写法二：现代写法(更加推荐)

vector<T>& operator=(vector v) //v是形参，拷贝构造出来的一个对象
{
	Swap(v);
	return *this;//为了支持连续赋值，返回引用
}

析构函数

//析构
~vector()
{
	delete[] _start;
	_start = _finish = _endofstorage = nullptr;
}
//全部置空

四、迭代器相关的函数

迭代器的分类

在这里插入图片描述
每一种迭代器都有着命名的规范，我们可以通过英文见名知意。
每一个迭代器越往上，权限就越小，我们可以把下面的迭代器看做父类，越往上的迭代器就是子类，它们有着父类的相关操作，但是我们传入迭代器时，只能传入权限大于等于当前迭代器的类型,例如我们reverse函数，需要传入双向迭代器，它可以传双向、随机，但是不能传权限比他小的迭代器，否则就会报错

通过查看文档我们可以看到一些函数需要传入迭代器类型：
在这里插入图片描述

迭代器对应的STL容器分类

在这里插入图片描述
举个例子：

int main()
{
	vector<int> v1;
	v1.push_back(1);
	v1.push_back(4);
	v1.push_back(3);
	v1.push_back(6);
	sort(v1.begin(), v1.end());//正确使用

	list<int> lt;
	lt.push_back(1);
	lt.push_back(3);
	lt.push_back(2);
	lt.push_back(4);
	sort(lt.begin(),lt.end());//这里会报错
	return 0;
}

list使用的是双向迭代器，sort要求传入随机迭代器，权限被缩小了，这是错误的使用。（随机使用双向）

迭代器失效问题

问题引出：

void insert(iterator pos, const T& x)
{
	assert(pos >= _start && pos <= _finish);//暴力检查
	if (_finish == _endofstorage)//检查是否需要扩容
	{
		reserve(capacity() == 0 ? 4 : capacity() * 2);
	}
	//插入x
	iterator end = _finish;
	while (end>pos)
	{
		*end = *(end-1);//前一个挪到后一个位置
		--end;
	}
	*pos = x;
	++_finish;
}
//测试
void test()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	vector<int>::iterator it = find(v.begin(), v.end(), 2);//找到值为2的位置
	if (it != v.end())
	{	// 如果insert中发生了扩容，那么会导致it指向空间被释放
		// it本质就是一个野指针，这种问题，我们就叫迭代器失效
		v.insert(it, 20);
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
}

在这里插入图片描述
怎么造成迭代器失效的呢？
原因：插入数据扩容的时候，我们定义了一个pos位置和end位置两个迭代器，新空间中，没有pos位置，但是原来的就空间还有个pos迭代器，任然指向一个已经被返还给操作系统的空间，但是最后居然*pos，解引用插入数据了，这显然是个野指针问题，存在着内存泄漏的风险。

改正解决迭代器失效的办法：在使用前，对迭代器重新进行赋值即可，我们需要更新一下扩容后的新的pos位置，并且我们在外部传参时，形参的改变不会影响实参，所以我们要传insert的pos位置的返回值，我们才能真正的删除pos位置的数据

//在pos位置之前插入数据x
iterator insert(iterator pos, const T& x)
{
	assert(pos >= _start);//暴力检查
	assert(pos <= _finish);
	if (_finish == _endofstorage)//检查是否需要扩容
	{
		//扩容会导致pos位置迭代器失效，所以需要更新一下新位置的pos
		size_t len = pos - _start;//记录一下pos距离_start位置的长度
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;//更新一下扩容后的pos
	}

	//插入x
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;

	return pos;//返回新空间pos位置，因为形参的改变不会影响实参
}

同样erase中也存在着迭代器失效的问题

void erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator begin = pos + 1;//pos的下一个位置记作begin
	while (begin < _finish)
	{
		*(begin - 1) = *begin;//数据从后往前覆盖
		++begin;
	}

	--_finish;//数据个数减一，finish也减一
}
void test()
{
	// 三种场景去测试
	// 1 2 3 4 5 -> 正常
	// 1 2 3 4   -> 崩溃
	// 1 2 4 5   -> 没删除完
	vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(4);
	v1.push_back(5);
	//v1.push_back(5);
	// 要求删除v1所有的偶数
	vector<int>::iterator it = v1.begin();
	while (it != v1.end())
	{
		if (*it % 2 == 0)
		{
			v1.erase(it);
		}

		++it;
	}
	}

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}

在这里插入图片描述
这里最大的问题就是，erase(it)后，it的意义已经变了，就是迭代器失效了，直接++it可能不导致一些意料之外的结果，如果是连续的偶数，会直接跳过后一个偶数，导致后一个偶数没有被删除掉。

正确的erase函数：

iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator begin = pos + 1;//pos的下一个位置记作begin
	while (begin < _finish)
	{
		*(begin - 1) = *begin;//数据从后往前覆盖
		++begin;
	}

	--_finish;//数据个数减一，finish也减一

	return pos;//传pos位置的迭代器，防止迭代器失效
}
void test()
{
	// 三种场景去测试
	// 1 2 3 4 5 -> 正常
	// 1 2 3 4   -> 崩溃(因为删除4后，it>_finish)
	// 1 2 4 5   -> 没删除完
	vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(4);
	v1.push_back(5);
	vector<int>::iterator it = v1.begin();
	while (it != v1.end())
	{
		if (*it % 2 == 0)
		{
			it = v1.erase(it);//传it位置的返回值，更新pos位置，这样就不会导致迭代器失效的问题了
		}
		else
		{
			++it;
		}
	}

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}

迭代器相关的函数

其实vector中的迭代器就是原生类型的指针，只不过是经过typedef的

typedef T* iterator;
typedef const T* const_iterator;

begin()和end()函数

iterator begin()
{
	return _start;
}
iterator end()
{
	return _finish;
}

const版本的begin()和end()函数

const_iterator begin()const
{
	return _start;
}
const_iterator end()const
{
	return _finish;
}

迭代器失效问题总结

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生态指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。

对于vector可能会导致其迭代器失效的操作有：

会引起其底层空间改变的操作，都有可能是迭代器失效，比如：resize、reserve、insert、assign、push_back等。
指定位置元素的删除操作–erase
erase删除pos位置元素后，pos位置之后的元素会往前搬移，没有导致底层空间的改变，理论上讲迭代器不应该会失效，但是：如果pos刚好是最后一个元素，删完之后pos刚好是end的位置，而end位置是没有元素的，那么pos就失效了。因此删除vector中任意位置上元素时，vs就认为该位置迭代器失效
了
注意：Linux下，g++编译器对迭代器失效的检测并不是非常严格，处理也没有vs下极端
与vector类似，string在插入+扩容操作+erase之后，迭代器也会失效

迭代器失效解决办法：在使用前，对迭代器重新赋值即可

五、vector中容量大小相关的函数

我们这里就可以利用C语言学到的，两个指针的差值就是两个指针指向间的元素个数

size()函数

size_t size()const
{
	return _finish - _start; //返回容器当中有效数据的个数
}

capacity()函数

size_t capacity()const
{
	return _endofstorage - _start; //返回当前容器的最大容量
}

empty()函数

bool empty()const
{
	return _start == _finish;
}

六、vector中扩容相关的函数

reserve()函数

void reserve(size_t n)
{
	if (n > capacity())
	{
		//扩容
		size_t sz = size();
		T* tmp = new T[n];//新开一段空间
		if (_start)
		{
			//memcpy(tmp, _start, sizeof(T) * size());//memcpy是浅拷贝，数据是内置类型不影响，是自定义类型会崩溃
			
			//深拷贝
			for (size_t i = 0;i < sz; ++i)
			{
				temp[i] = _start[i]; //调用赋值运算符重载
			}
			delete[] _start;//释放掉原来的空间
		}
		_start = tmp;//交换指针指向
		//扩完容以后_finsih  _endodstorage也要处理一下
		//要把原来的size保存一下
		//_finish = _start + size();//size=finish-start start已经被更新了
		_finish = _start + sz;
		_endofstorage = _start + n;
	}
}

使用memcpy浅拷贝问题！！！

我们这里如果vector中存入的是string等自定义类型，使用memcpy进行拷贝，会出现什么问题呢？

int main()
{
//演示拷贝构造-对于内置类型，没问题，但是，对于自定义类型，由于memcpy是浅拷贝，当析构的时候程序会发生崩溃,所以所有写memcpy的地方都需要转换为深拷贝
//注意：当我们不写析构函数时，程序不会崩溃，因为vector<>里面村的是一个一个指针，指针指向了一个字符串，
//指针是内置类型，编译器对于内置类型不做处理，其实这是内存泄漏

//注意：我们这里虽然没有写运算符重载也能过，是因为我们使用的是std::string，在拷贝构造调用赋值运算符重载时，他会去找std库里面的找string的赋值运算符重载
	mwq::vector <string> v;
	v.push_back("11111111111111111");
	v.push_back("11111111111111111");
	v.push_back("11111111111111111");
	v.push_back("11111111111111111");
	
	//再插入元素导致扩容，就会崩溃
	v.push_back("111111111111111111");


	vector<std::string> v2(v1);
	for (auto e : v2)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

问题分析：

memcpy是内存的二进制格式拷贝，将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
如果拷贝的是内置类型的元素，memcpy即高效又不会出错，但如果拷贝的是自定义类型元素，并且自定义类型元素中涉及到资源管理时，就会出错，因为memcpy的拷贝实际是浅拷贝。
插入的字符串长一些的话，就会出现乱码

结论：如果对象中涉及到资源管理时，千万不能使用memcpy进行对象之间的拷贝，因为memcpy是浅拷贝，否则可能会引起内存泄漏甚至程序崩溃。
我们作出的改变就是不用memcpy，我们手动将数据一个一个的拷贝过去。我们能够间接调用string的赋值运算符重载，实现string的深拷贝。
出现乱码：VS下作了一个优化，当数据字长较小时(小于16时)，它会把数据存入一个char _Buf[16]的数组中，当数据长一点，它会把数据存入一个堆上开辟的大数组中char * _ptr中。

//代码修正
//memcpy(tmp, _start, sizeof(T) * size());//memcpy是浅拷贝
for (size_t i = 0; i < sz; ++i)
{
	//当T是int等内置类型，一个一个拷贝没有问题
	//当T是string等内置类型，会去调用它的深拷贝
	tmp[i] = _start[i];
}

resize()函数

我们这里需要考虑两种情况
第一种：
在这里插入图片描述
第二种：

void resize(size_t n, const T& val = T())// 给T()缺省值，int() 
{
	//分两种情况
	//第一种n<size
	//第二种n>capacity需要扩容
	if (n < size())
	{
		_finish = _start + n;
	}
	else
	{
		if (n > capacity())
		{
			reserve(n);
		}
		while (_finish != _start + n)
		{
			*_finish = val;
			++_finish;
		}
	}
}

七、vector的增加数据相关的函数

push_back( )

void push_back(const T& x)
{
	if (_finish == _endofstorage)
	{
	   	//复用reserve函数
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		//如果当前的capacity是0，扩到4，如果不是0，就扩2倍
	}
	*_finish = x;
	++_finish;
}

insert()函数

//在pos位置之前插入数据x
iterator insert(iterator pos, const T& x)
{
	assert(pos >= _start);//暴力检查
	assert(pos <= _finish);
	if (_finish == _endofstorage)//检查是否需要扩容
	{
		//扩容会导致pos位置迭代器失效，所以需要更新一下新位置的pos
		size_t len = pos - _start;//记录一下pos距离_start位置的长度
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;//更新一下扩容后的pos
	}

	//插入x
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;

	return pos;//返回新空间pos位置，因为形参的改变不会影响实参
}

八、vector的删除数据相关的函数

pop_back()函数

void pop_back()
{
	assert(_finish > _start);//暴力检查一下，防止越界
	--_finish;//将_finish减减，相当于就把尾上的数据删除了
}

erase()函数

iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator begin = pos + 1;//pos的下一个位置记作begin
	while (begin < _finish)
	{
		*(begin - 1) = *begin;//数据从后往前覆盖
		++begin;
	}

	--_finish;//数据个数减一，finish也减一

	return pos;//传pos位置的迭代器，防止迭代器失效
}

九、vector的查找数据相关的函数

operator[ ]下标查找

//普通版本
T& operator[](size_t i)
{
	assert(i < size());
	return _start[i];
}
//const版本
const T& operator[](size_t i)const
{
	assert(i < size());
	return _start[i];
}

十、其他函数

swap()函数

在这里插入图片描述

void Swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_endofstorage, v._endofstorage);
}

十一、理解杨辉三角问题

	//杨辉三角
	class Solution 
	{
	public:
		vector<vector<int>> generate(int numRows)
		{
			//开空间初始化
			vector<vector<int>> vv;
			vv.resize(numRows, vector<int>()); //里面初始化为匿名的对象
			for (size_t i = 0; i < vv.size(); ++i)
			{
				vv[i].resize(i + 1, 0);
				vv[i][0] = 1;
				vv[i][vv[i].size() - 1] = 1;
			}

			for (size_t i = 0; i < vv.size(); ++i)
			{
				//遍历每一个vector<int>赋值
				for (size_t j = 0; j < vv[i].size(); ++j)
				{
					if (vv[i][j] == 0)
					{
						vv[i][j] = vv[i - 1][j] + vv[i - 1][j - 1];
					}
				}
			}
			return vv;
		}
	};

	//演示拷贝构造-如果没有写赋值运算符重载，对于杨辉三角问题还是出错，因为拷贝构造调用了赋值运算符重重载，我们没有写vector的赋值运算发重载
	void test10()
	{
		vector<vector<int>> ret = Solution().generate(5);
		for (size_t i = 0; i < ret.size(); ++i)
		{
			for (size_t j = 0; j < ret[i].size(); ++j)
			{
				cout << ret[i][j] << " ";
			}
			cout << endl;
		}
	}