【探索C++中的顺序表】手动实现vector容器

news2026/4/2 23:59:53

在这里插入图片描述

🚀write in front🚀
📜所属专栏：初阶数据结构
🛰️博客主页：睿睿的博客主页
🛰️代码仓库：🎉VS2022_C语言仓库
🎡您的点赞、关注、收藏、评论，是对我最大的激励和支持！！！
关注我，关注我，关注我，你们将会看到更多的优质内容！！

在这里插入图片描述

文章目录

前言
一.vector和string的区别：
二.vector的使用：
三.vector的模拟实现：
- 1.vector的成员变量：
- 2.vector的迭代器问题（重点）：
- - insert()函数：
  - erase()函数：
  - insert的迭代器失效：
  - erase的迭代器失效：
  - string的迭代器失效：
- 3.vector深浅拷贝问题：
- 4.vector构造函数问题：
总结
总结

前言

在学习完string之后，我们来开始vector的学习，其实vector的各个函数和string是非常类似的，所以我们就着重讲讲vector的易错点就行了。

一.vector和string的区别：

vector是可变大小数组的序列容器，可以存储任意相同类型的元素。而string是专门用来存储字符串的。当然，我们不能用vector<char>来代替string，因为string存在着’\0’的问题，并且string的有些函数是专门针对字符串的，而vector没有。

二.vector的使用：

在这里参考文档就可以了:vector使用介绍
当然对于二维数组，我们就不得不说vector的优势了。在学习c语言时，对于二维数组，我们每一行每一列的大小的空间都是定死的，而如果我们使用vector<vector<int>>就可以灵活使用。
在这里插入图片描述
在看完vector的使用文档我们就可以明白里面的原理：

三.vector的模拟实现：

在这里我们就就讲讲和string不同的地方即可，其他地方和string都是类似的。

1.vector的成员变量：

通过查看strl的vector（stl的原代码实现）实现我们可以看出，vector的成员变量和string的是不太一样的：
在这里插入图片描述
由此可见，vector的成员变量是通过三个指针来实现的。他们分别指向数组的开头，数组的有效尾部和数组的容量尾部。

2.vector的迭代器问题（重点）：

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生态指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，然而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。

insert()函数：

iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start && pos <= _finish);

			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;

				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);

				// 解决pos迭代器失效问题
				pos = _start + len;
			}

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;

			return pos;
		}

erase()函数：

iterator erase(iterator pos)
		{
			assert(pos >= _start && pos < _finish);

			iterator it = pos + 1;
			while (it != _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;

			return pos;
		}

insert的迭代器失效：

会引起其底层空间改变的操作，都有可能是迭代器失效，比如：resize、reserve、insert、assign、push_back等。
如果我们使用以下代码就会发现出错：

		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);
		v1.push_back(5);
		v1.push_back(5);
		v1.push_back(5);
		auto pos=v1.begin();
		v1.insert(pos);
		v1.insert(pos+1);

这里迭代器失效的原因想必大家都知道，在扩容之后，成员变量的三个指针指向的空间发生了改变，此时我们pos就变成了一个野指针。所以此时我们的迭代器失效了。

erase的迭代器失效：

erase删除pos位置元素后，pos位置之后的元素会往前搬移，没有导致底层空间的改变，理论上讲迭代器不应该会失效，但是：如果pos刚好是最后一个元素，删完之后pos刚好是end的位置，而end位置是没有元素的，那么pos就失效了。

vs编译器为了防止这些现象的发生，就对迭代器进行了极端处理：在insert或erase使用了迭代器对象之后，不能在访问这个迭代器，vs认为他是失效，访问是未定义。

然而，在Linux的g++下面不存在这样的强制检查，有时候使用也是对的，但是这样的话就不符合代码的可移植性了。

这就是为什么我们在模拟实现的时候会返回一个迭代器，就是为了给这个迭代器重新赋值：

```cpp
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);
		v1.push_back(5);
		v1.push_back(5);
		v1.push_back(5);
		auto pos=v1.begin();
		pos=v1.insert(pos);
		pos=v1.insert(pos+1);

这样就不会出错了。

string的迭代器失效：

与vector类似，string在插入+扩容操作+erase之后，迭代器也会失效

总结一下，为了防止迭代器失效，在使用迭代器前，对迭代器重新赋值即可.

3.vector深浅拷贝问题：

假设模拟实现的vector中的reserve接口中，使用memcpy进行的拷贝，以下代码会发生什么问题？

		vector<string> v1;
		v1.push_back("edd");
		v1.push_back("werewedf");
		v1.push_back("sddeedf");
		v1.push_back("sdwdf");
		v1.push_back("Sdfef");

我们先来复习一下memcpy的性质：

memcpy是内存的二进制格式拷贝，将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
如果拷贝的是自定义类型的元素，memcpy既高效又不会出错，但如果拷贝的是自定义类型元素，并且自定义类型元素中涉及到资源管理时，就会出错，因为memcpy的拷贝实际是浅拷贝。

由此可见，在reserve里面如果使用memcpy函数，在vector这个类型里面，此时的复制就是浅拷贝。由于两个string指向同一个空间，在析构函数释放的时候就会出现问题。
在这里插入图片描述

那么我们怎么解决这个问题呢？
在这里插入图片描述
因为不同的类不一样，我们不可能对于string单独写一个，list之类的也存在浅拷贝问题，所以我们直接使用string类的赋值重载来实现string对象的深拷贝：

4.vector构造函数问题：

同学们在看vector构造函数的时候可能会看到这里：
在这里插入图片描述
随后便想自己模拟实现一下,但是这里的迭代器类型和模板类的迭代器类型可能不一样，比如当我们用string类来初始化vector的时候。

	string str("你干嘛哈哈");
	vector<char>(str.begin(),str.end());
	//在这里迭代器不同。

所以我们要通过模板类里面在套模板来实现：

template<class InputIterator>
		vector(InputIterator first, InputIterator last)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}