从C语言到C++_15(vector的模拟实现)+迭代器失效问题

news2024/12/24 21:52:59

目录

1. vector的基本框架

1.1 构造析构和容量

1.2 push_back,reserve和operator[ ]

2. vector的迭代器

2.1 四个基本迭代器

2.2 迭代器区间初始化

2.3 迭代器的分类

3. vector的其它接口函数

3.1 修改后的reserve

3.2 resize

3.3 pop_back

4.  insert和erase迭代器失效问题

4.1 insert

4.2 erase

5. vector 深拷贝

5.1 拷贝构造

5.2 赋值 operator=

6. 两道选择题

6.1 下面程序的输出结果正确的是( )

6.2 下面关于迭代器失效的描述哪个是错误的( )(多选)

完整代码:

vector.h

Test.c

本篇完。


1. vector的基本框架

STL的源代码整体考虑的东西比较多,还要考虑和其他地方的结合,因此整体的设计是比较复杂的。基于这一系列原因,我们会以简单的形式去实现其核心框架接口,方便去学习 vector。我们可以先看一看STL源代码的整体框架,一些要实现的接口函数不会实现的时候才去看看细节。现在自己看源码还不太好,且看不懂,跟着这篇博客看就挺好的(自夸+1)

以下是基于《STL源码剖析》用到的vector的部分源码:

 其中最重要的就是三个私有成员 start 、finish 和 end_of_storage。

想想模拟代码的实现,为了和库中的 vector 进行区分,我们这里依然用命名空间包含起来。

我们这里造一个 vector 的类模板去适应各种类型,我们用 typedef 将 T* 重命名为 iterator。

1.1 构造析构和容量

经过前面string的学习和上面的源码,直接放vector.h :

#pragma once

#include<iostream>
#include<assert.h>
using namespace std;

namespace rtx
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{}
		~vector()
		{
			delete[] _start;
			_start = _finish = _end_of_storage = nullptr;
		}

		size_t size() const
		{
			return _finish - _start;
		}
		size_t capacity() const
		{
			return _end_of_storage - _start;
		}

	private:
		iterator _start;
		iterator _fnish;
		iterator _end_of_storage;
	};
}

1.2 push_back,reserve和operator[ ]

我们这里先实现一个简单的 push_back,以便于我们能先把 vector 跑起来。我们的 push_back 没有空间配置器,我们就用 new 去替代它。

尾插需要做哪些事?

1:检查是否需要增容

需要增容,就先增容后再插入数据;不需要增容,就直接插入数据。

我们先去思考,如何判断是否需要增容 ——

我们之前的判断方式是 size == capacity 的时候需要增容问题是,这次我们没有定义 _size 和 _capacity,取而代之的是 _start 、 _finish 和_end_of_storage的形式。

想想: 当 _finish  ==  _end_of_storage时,不就说明容量不够了吗?

2:如果需要增容

前面已经知道,vector是有reserve接口的,增容我们先实现reserve:

如果要增容:

① 开一块带有新容量的空间存到 tmp 中。

② 再把原空间的数据拷贝到新空间。(还能用memcpy吗,我们先用着)

③ 并释放原有的旧空间

④ 最后将 _start 、_finish  和 _end_of_storage指向新的空间。

值得注意的是,最后一步如果先将 _start 指向 tmp 后,再计算 _finish 时,

此时不能现场算 size() ,现场算会出问题,因为 _start 已经被更新成 tmp 了,

如果不想改变顺序,还是想按 _start、_finish 和 _eos 的顺序赋值,

我们可以提前把 size() 算好,存到一个变量中。

此外,真 vector 这里扩容是要调空间配置器的,开空间和初始化是分开的。

我们这里的实现也没有空间配置器,对于空间配置器的知识我们放到后面再说,

我们目前的重点不是空间配置器,重点是 vector。

至于新容量给多少,我们还是按照自己的习惯,首次给4默认扩2倍的方式去增容。

reserve代码:

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t sz = size();
				T* tmp = new T[n];
				if(_start)
				{
					memcpy(tmp, _start, sizeof(T) * sz);
					delete[] _start;
				}
				_start = tmp;
				_finish = tmp + sz;
				_end_of_storage = tmp + n;
			}
		}

3:插入数据

查增容和增容都已经分析完了,最后就只剩一个插入了,插入是最简单的,

因为_finish指向的是最后一个元素的下一个位置,我们直接让要插入的元素赋值给_finish,

然后++_finish就行了。push_back代码:

		void reserve(size_t n)
		{
			if (n > capacity)
			{
				size_t sz = size();
				T* tmp = new T[n];
				if(_strat)
				{
					memcpy(tmp, _start, sizeof(T) * sz);
					delete[] _start;
				}
				_strat = tmp;
				_finish = tmp + sz;
				_end_of_storage = tmp + n;
			}
		}

为了方便测试尾插的效果,我们先来实现一下 operator[] ,利用 "下标+方括号" 的方式遍历。

 这有两个接口,我们一起实现了:

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return *(_start + pos);
		}
		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return *(_start + pos);
		}

T:由于我们不知道返回值类型,所以给 T。

T&:引用返回减少拷贝。

const是给const对象用的:这里 cosnt 修饰 T 和 this,是为了限制写。

测试一下:(vector.h:)

#pragma once

#include<iostream>
#include<assert.h>
using namespace std;

namespace rtx
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{}
		~vector()
		{
			delete[] _start;
			_start = _finish = _end_of_storage = nullptr;
		}

		size_t size() const
		{
			return _finish - _start;
		}
		size_t capacity() const
		{
			return _end_of_storage - _start;
		}

		void push_back(const T& x)
		{
			if (_finish == _end_of_storage)
			{
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}
			*_finish = x;
			++_finish;
		}
		void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t sz = size();
				T* tmp = new T[n];
				if (_start)
				{
					memcpy(tmp, _start, sizeof(T) * sz);
					delete[] _start;
				}
				_start = tmp;
				_finish = tmp + sz;
				_end_of_storage = tmp + n;
			}
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return *(_start + pos);
		}
		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return *(_start + pos);
		}

	private:
		iterator _start;
		iterator _finish;
		iterator _end_of_storage;
	};
}

Test.c:

#include "vector.h"

namespace rtx
{
	void Test1()
	{
		vector<int> v;
		cout << v.size() << " " << v.capacity() << endl;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		cout << v.size() << " " << v.capacity() << endl;
		v.push_back(5);
		cout << v.size() << " " << v.capacity() << endl;

		for (size_t i = 0; i < v.size();++i)
		{
			cout << v[i] << " ";

		}
		cout << endl;
	}
}

int main()
{
	rtx::Test1();

	return 0;
}

2. vector的迭代器

2.1 四个基本迭代器

vector 的迭代器是一个原生指针:

template<class T>
class vector 
{
public:
	typedef T* iterator;
	typedef const T* const_iterator;

前面源码看到,begin() 和 end() ,直接分别返回 _start 和 _finish 即可,

const 类型的迭代器,即可读不可写。在实现的时候用 const 修饰即可:

 测试迭代器的效果:(范围for也能用了)

	void Test2()
	{
		vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);

		for (size_t i = 0; i < v.size();++i)
		{
			++v[i];
			cout << v[i] << " ";
		}
		cout << endl;

		vector<int>::iterator it = v.begin();
		while (it != v.end())
		{
			--(*it);
			cout << *it << " ";
			++it;
		}
		cout << endl;

		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;
	}

2.2 迭代器区间初始化

 上一篇说到vector是支持迭代器区间初始化的:

拷贝构造放在后面再讲,先实现迭代器区间初始化:

因为传过来的迭代器可以是任意的,所以这又是一个模板:
(一个类模板的成员函数,又可以是一个函数模板):

	void Test2()
	{
		vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);

		for (size_t i = 0; i < v.size();++i)
		{
			++v[i];
			cout << v[i] << " ";
		}
		cout << endl;

		vector<int>::iterator it = v.begin();
		while (it != v.end())
		{
			--(*it);
			cout << *it << " ";
			++it;
		}
		cout << endl;

		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;

		string s("hello world");
		vector<int> v1(s.begin(), s.end());// 存了ASCII码
		for (const auto& e : v1)
		{
			cout << e << " ";
		}
		cout << endl;
	}

 为什么这里要叫 InputIterator?不用它行不行?

想要知道这个问题,我们先讲解一下迭代器的分类。

2.3 迭代器的分类

迭代器可以分为这么几类:
① 输入 / 输出迭代器:input_iterator  /  output_iterator
特点:单步向前迭代,不可写 / 单步向前迭代,可写,无对应类型

② 单向迭代器:forward_iterator
特点:满足以上所有功能,并且能 ++ 
(不能 - -没有 rbegin / rend)
<forward_list>         (C++11)
<unordered_map>  (C++11)
<unordered_set>    (C++11)

③ 双向迭代器:bidirectional_iterator
特点:满足以上功能,并且能 ++,还能 - -
<list>
<map>
<set>


④ 随机迭代器:randomaccess_iterator
特点:满足以上所有功能,能 ++ 能 - -,还能 + 和 -  
<vector>
<deque>

它们本质上是一个继承关系:下面是子类,上面是父类。

子类都是一个父类,因为它满足父类的所有特征。

也就是说,虽然在语法上它是个模板,允许你传任意类型的迭代器,

但是在更深层次上存在着更进一步的限制 ——

 它要求你传随机迭代器,你就不能用双向迭代器。因为只有随机迭代器才能满足随机迭代器的所有操作。换言之,你不能用功能比它指定的迭代器少的迭代器。(可以理解为权限的放大)

它要求你用双向迭代器,你就不能用单向迭代器,因为单项迭代器不能满足所有双向迭代器的操作。但是你可以用比它功能多的迭代器,比如随机迭代器,因为随机迭代器也能满足双向迭代器的操作。因为随机迭代器是双向迭代器的子类,它满足父类(双向迭代器)的所有功能。(可以理解为权限的缩小) 

我们弄明白了这些,我们再回到刚才提的问题 —为什么这里要叫 InputIterator?

首先,InputIterator 是输入迭代器,这么写是为了满足命名规范。

可以不用,我们可以传单向迭代器、双向迭代器,也可以传随机迭代器。

因为这些迭代器都满足输入迭代器的所有功能。
 

3. vector的其它接口函数

3.1 修改后的reserve

我们刚才实现了 reserve,reserve 搬元素的时候也是 memcpy去进行拷贝的,又让 push_back 复用了 reserve, 其实这里存在一个非常严重的问题!

现在给出一个测试用例:

	void Test3()
	{
		vector<string> v;      // 在vector里放string
		v.push_back("1");
		v.push_back("2");
		v.push_back("3");
		v.push_back("4");
		v.push_back("5");
		v.push_back("6");
		v.push_back("7");
		v.push_back("8");
		v.push_back("9");

		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;
	}

 这里发现程序崩掉了。

为什么会这样?原因在于我们在扩容和深拷贝时,用了一个 memcpy!

push_back 调用 reserve 扩容时就会出问题,根本原因是 memcpy 是浅拷贝。

问题分析:

memcpy 是内存的二进制格式拷贝,

将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。

如果拷贝的是自定义类型的元素,memcpy 既高效又不会出错,

但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,

就会出错,因为memcpy的拷贝实际是浅拷贝。

(这里新的三个指针还是指向原来的空间,然后原来的空间又被释放了)

所以:如果对象中涉及到资源管理时,不能使用 memcpy 进行对象之间的拷贝,我们手动去拷:

修改后的 reserve:

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t sz = size();
				T* tmp = new T[n];
				if(_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz); 浅拷贝,不行

					for (size_t i = 0; i < sz; i++)// 如果T是int,一个一个拷贝没问题
					{
						tmp[i] = _start[i];// 如果T是string等自定义问题,一个一个拷贝调用的是T的深拷贝,也不会出问题。
					}
					delete[] _start;
				}
				_start = tmp;
				_finish = tmp + sz;
				_end_of_storage = tmp + n;
			}
		}

 成功运行:

3.2 resize

 vector 的 resize 如果不给第二个参数,默认给的是其对应类型的缺省值作为 "填充值"。

由于这里我们不知道具体类型是什么,这里缺省值我们使用匿名对象 T() ,

此外因为匿名对象的生命周期仅在当前一行,这里必须要用 const 引用匿名对象,

可以理解为延长其生命周期:

		void resize(size_t n, const T& val = T())
		{
			if (n > capacity())
			{
				reserve(n);
			}
			if (n > size())
			{
				while (_finish != _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
			else
			{
				_finish = _start + n;
			}
		}

3.3 pop_back

pop_back 很简单,只需要 - -finish 就可以了。

 但是需要考虑删完的情况,我们这里采用暴力的处理方式 —— 断言。

		void pop_back() 
		{
			assert(_finish > _start);
			--_finish;
		}

测试一下上面的函数:

	void Test3()
	{
		vector<string> v;      // 在vector里放string
		v.push_back("1");
		v.push_back("2");
		v.push_back("3");
		v.push_back("4");
		v.push_back("5");
		v.push_back("6");
		v.push_back("7");
		v.push_back("8");
		v.push_back("9");

		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;
		cout << v.size() << " " << v.capacity() << endl;

		v.resize(50,"x");
		cout << v.size() << " " << v.capacity() << endl;

		v.pop_back();
		v.pop_back();
		v.pop_back();
		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;
		cout << v.size() << " " << v.capacity() << endl;
	}
}

4.  insert和erase迭代器失效问题

什么是迭代器失效?

" 迭代器失效是一种现象,由特定操作引发,这些特定操作对容器进行操作,使得迭代器不指向容器内的任何元素,或者使得迭代器指向的容器元素发生了改变。"

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,

或者是对指针进行了封装,比如:vector 的迭代器就是原生态指针 T* 。

因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,

而使用一块已经被释放的空间,造成的后果是程序崩溃,

即,如果继续使用已经失效的迭代器,程序可能会出现崩溃。

4.1 insert

插入可分为四个步骤:① 检查 pos 是否越界   ② 检查是否需要扩容  ③ 移动数据   ④ 插入数据

		void insert(iterator pos, const T& val)
		{
			assert(pos >= _start);// ①检查pos是否越界
			assert(pos <= _finish);

			if (_finish == _end_of_storage)// ②检查是否需要扩容
			{
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}

			iterator right = _finish - 1;// ③移动数据
			while (right >= pos)
			{
				*(right + 1) = *right;
				--right;
			}

			*pos = val;// ④插入数据
			++_finish;
		}

测试:在2的位置前插入一个20

	void Test4()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		vector<int>::iterator pos = find(v1.begin(), v1.end(), 2);
		if (pos != v1.end()) 
		{
			v1.insert(pos, 20);
		}
		for (const auto& e : v1)
		{
			cout << e << " "; 
		}
		cout << endl;
	}

 继续在2的位置前插入一个20:

    void Test4()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		vector<int>::iterator pos = find(v1.begin(), v1.end(), 2);
		if (pos != v1.end()) 
		{
			v1.insert(pos, 20);
		}
		for (const auto& e : v1)
		{
			cout << e << " "; 
		}
		cout << endl;

		pos = find(v1.begin(), v1.end(), 2);
		if (pos != v1.end())
		{
			v1.insert(pos, 20);
		}
		for (const auto& e : v1)
		{
			cout << e << " "; 
		}
		cout << endl;
	}

 是什么问题出现了随机值?机智的童鞋已经想到:

迭代器失效问题。扩容导致的 pos 失效,我们的 insert 没有去处理这个问题。

如果发生扩容,我们的 pos 是不是应该去更新一下?:

		void insert(interator pos, const T& val)
		{
			assert(pos >= _start);// ①检查pos是否越界
			assert(pos <= _finish);

			if (_finish == _end_of_storage)// ②检查是否需要扩容
			{
				size_t len = pos - _start;// 记录一下pos到_start的距离
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;// 迭代器失效问题,扩容后pos还是指向原来的空间,更新一下pos,
			}

			interator right = _finish - 1;// ③移动数据
			while (right >= pos)
			{
				*(right + 1) = *right;
				--right;
			}

			*pos = val;// ④插入数据
			++_finish;
		}

但是外面的 pos(实参) 还是失效的,这里是传值,pos(形参) 是 pos(实参) 的临时拷贝。 

如果 insert 中发生了扩容,那么会导致 pos(实参)指向空间被释放。

pos(实参) 本身就是一个野指针,这种问题我们称之为 —— 迭代器失效 

如何解决这里的迭代器失效问题?传引用?

传引用当然时不好的,如果我传给你一个begin呢,传引用不能彻底解决所有问题。

我们来看看巨佬是如何解决这一问题的:

是通过返回值去拿的,返回新插入的迭代器。

如果迭代器失效了,你想拿另一个迭代器去代替,就可以通过返回值去拿一下:

		iterator insert(iterator pos, const T& val)
		{
			assert(pos >= _start);// ①检查pos是否越界
			assert(pos <= _finish);

			if (_finish == _end_of_storage)// ②检查是否需要扩容
			{
				size_t len = pos - _start;// 记录一下pos到_start的距离
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;// 迭代器失效问题,扩容后pos还是指向原来的空间,更新一下pos,
				//而且形参不会影响实参,传引用的话begin等就传不了,所以用返回解决
			}

			iterator right = _finish - 1;// ③移动数据
			while (right >= pos)
			{
				*(right + 1) = *right;
				--right;
			}

			*pos = val;// ④插入数据
			++_finish;
			return pos;
		}
	void Test4()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		vector<int>::iterator pos = find(v1.begin(), v1.end(), 2);
		if (pos != v1.end()) 
		{
			v1.insert(pos, 20);
		}
		for (const auto& e : v1)
		{
			cout << e << " "; 
		}
		cout << endl;

		pos = find(v1.begin(), v1.end(), 2);
		if (pos != v1.end())
		{
			v1.insert(pos, 20);
		}
		for (const auto& e : v1)
		{
			cout << e << " "; 
		}
		cout << endl;
	}

4.2 erase

erase代码比insert简单,就是挪动数据,是这样写吗?:

		void erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);// 不能<= 因为_finish指向的是最后一个数据的下一个

			iterator left = pos + 1;
			while (left < _finish)
			{
				*(left - 1) = *left;
				++left;
			}
			--_finish;
		}

erase 有没有迭代器失效的问题?

删除会导致 pos 失效吗?

我们用三种场景去测试:①  1 2 3 4 5  (正常,是个巧合)

	void Test4_erase()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);
		vector<int>::iterator pos = v1.begin();// 删除v1所有的偶数
		while (pos != v1.end()) 
		{
			if (*pos % 2 == 0) 
			{
				v1.erase(pos);
			}
			pos++;
		}
		for (auto e : v1) 
		{
			cout << e << " ";
		}
		cout << endl;
	}

②  1 2 3 4  (崩溃)

	void Test4_erase()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		//v1.push_back(5);
		vector<int>::iterator pos = v1.begin();// 删除v1所有的偶数
		while (pos != v1.end()) 
		{
			if (*pos % 2 == 0) 
			{
				v1.erase(pos);
			}
			pos++;
		}
		for (auto e : v1) 
		{
			cout << e << " ";
		}
		cout << endl;
	}

 ③  1 2 4 5  (结果不对,没删除完)

	void Test4_erase()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		//v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);
		vector<int>::iterator pos = v1.begin();// 删除v1所有的偶数
		while (pos != v1.end()) 
		{
			if (*pos % 2 == 0) 
			{
				v1.erase(pos);
			}
			pos++;
		}
		for (auto e : v1) 
		{
			cout << e << " ";
		}
		cout << endl;
	}

 erase(pos) 以后,pos 指向的意义已经变了,直接 pos++ 可能会导致一些意料之外的结果。

对于情况 ③:比如连续的偶数,导致后一个偶数没有判断,导致没有删掉。

再其次,erase 的删除有些 vector 版本的实现,不排除它会缩容。

			//if (size() < capacity()/2)
			//{
			//	// 缩容 -- 以时间换空间(虽然基本不会这么用了)
			//}

如果是这样,erase(pos) 以后,pos 也可能会是野指针,跟 insert 类似。

(SGI 和 PJ 版本 vector 都不会缩容)

对于情况 ②:如果最后一个数据是偶数,会导致 erase 以后,pos 意义变了。

再 ++ 一下,导致 pos 和 end 错过结束判断,出现越界问题。

而情况 ①: 之所以没有翻车,是因为被删除的偶数后面恰巧跟的是奇数,运气好逃过了一劫。

导致上述三种问题的本质:erase(pos) 以后,pos 的意义变了,再去 pos++ 是不对的。

为了解决这个问题,erase 是这么说明的:

规定erase返回删除位置下一个位置迭代器,改进 erase:

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);// 不能<= 因为_finish指向的是最后一个数据的下一个

			iterator left = pos + 1;
			while (left < _finish)
			{
				*(left - 1) = *left;
				++left;
			}
			--_finish;
			return pos;//此时pos就是删除位置下一个位置迭代器
		}

简单测一下第三个情况:(第二个情况也成功了)

	void Test4_erase()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);
		vector<int>::iterator pos = v1.begin();// 删除v1所有的偶数
		while (pos != v1.end()) 
		{
			if (*pos % 2 == 0) 
			{
				pos = v1.erase(pos);
			}
			else
			{
				pos++;
			}
		}
		for (auto e : v1) 
		{
			cout << e << " ";
		}
		cout << endl;
	}

对于 vector 可能会导致其迭代器失效的操作有:

① 会引起其底层空间改变的操作,都有可能存在迭代器失效。

比如:resize、reverse、insert、assign、push_back 等。

② 指定位置元素的删除操作:erase

erase 删除 pos 位置元素后,pos 位置之后的元素就会往前搬移,

没有导致底层空间的改变,理论上讲迭代器不应该会失效。

但是 pos 刚好是最后一个元素,删完之后 pos 刚好在 end 的位置,

而 end 位置是没有元素的,那么 pos 就失效了。

因此删除 vector 中任意位置元素时,VS 就认为该位置迭代器失效了。

还有就是我们刚才讲解的奇偶数,删除 pos 位置的数据,导致 pos 迭代器失效。

当然,vector 迭代器的失效主要发生在 insert 和 erase。vector 的其他接口基本不碰迭代器,自然也就不涉及这些问题。

迭代器失效解决方法:在使用前,对迭代器重新赋值即可。

 string 的 insert 和 erase 迭代器是否会失效?string 有没有迭代器失效?

当然会,只要使用迭代器的容器,都可能会涉及迭代器失效。

只是 string 一般很少涉及迭代器失效,因为它 insert 和 erase 时主要用下标。

5. vector 深拷贝

5.1 拷贝构造

可以使用传统写法,也可以使用现代写法,看看传统写法:全都自己干,

		vector(const vector<T>& v)
		{
			reserve(v.capacity());
			for (const auto& e : v)
			{
				push_back(e);
			}
		}

老老实实开空间,老老实实拷数据。

因为我们已经实现好了 reserve,所以我们这里可以直接调用 reserve 去开空间。

注意这里不能使用 memcpy,这个我们前面已经强调过了。

现代写法:找工具人帮忙干活:— 让迭代器区间当工具人:

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_end_of_storage, v._end_of_storage);
		}

		vector(const vector<T>& v)// 现代写法
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			vector<T> tmp(v.begin(), v.end());
			swap(tmp);
		}

有感觉现代写法比传统写法难?还要写swap和迭代器区间初始化?

但是这两个接口本来就是vector里面的,只是顺便实现了现代写法,简单测下: 

	void Tess5() 
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);

		vector<int> v2(v1);
		for (const auto& e : v2)
		{
			cout << e << " ";
		}
		cout << endl;
	}

5.2 赋值 operator=

传统写法就是把 v2 赋值给 v1,自己把 v1 释放了,再去深拷贝出 v2 一样大的空间……

太麻烦了,直接用现代写法,只要有了拷贝构造,赋值都可以用现代写法。

并且,这里还可以利用 "传参调用拷贝构造" 这一特性,做到真正的 "压榨" 工具人。

所以我们去掉 const 和引用传参,为的是让形参去充当临时变量 tmp ——

		vector<T>& operator=(vector<T> v)// 现代写法
		{
			swap(v);
			return *this;
		}

想要 v1 跟 v3 有一样大的空间一样大的值,我们让传参的时候就顺便把这件事给办了。

现在 v 手上就有 v3 了,然后再用 swap 函数夺取 v 的劳动成果,最后返回 *this 就大功告成了。

这里 v1 不仅把 v 从 v3 得到的东西,还让 v 帮忙把垃圾丢了(释放空间) ——

简单测下:

		vector<T>& operator=(vector<T> v)// 现代写法
		{
			swap(v);
			return *this;
		}

6. 两道选择题

6.1 下面程序的输出结果正确的是( )

#include <iostream>
#include <vector>
using namespace std;

int main()
{
	int ar[] = { 1,2,3,4,0,5,6,7,8,9 };
	int n = sizeof(ar) / sizeof(int);
	vector<int> v(ar, ar + n);
	vector<int>::iterator it = v.begin();
	while (it != v.end())
	{
		if (*it != 0)
			cout << *it;
		else
			v.erase(it);
		it++;
	}
	return 0;
}

A.程序运行崩溃

B.1 2 3 4 5 0 6 7 8 9

C.1 2 3 4 5 6 7 8 9

D.1 2 3 4 6 7 8 9

6.2 下面关于迭代器失效的描述哪个是错误的( )(多选)

A.vector的插入操作一定会导致迭代器失效

B.vector的插入操作有可能不会导致迭代器失效

C.vector的删除操作只会导致指向被删除元素及后面的迭代器失效

D.vector的删除操作只会导致指向被删除元素的迭代器失效

答案:

6.1 A

分析:当迭代器的值为0时,此时会进行删除,删除后如果迭代器不重新赋值,会导致原来的迭代器失效,此时针对一个已经失效的迭代器在进行++,会导致程序崩溃>

6.2 AD

A.vector的插入操作如果导致底层空间重新开辟,则迭代器就会失效。如果空间足够,不扩容时,迭代器不一定失效,比如push_back尾插,元素插入到空间末尾,在不扩容时不会对迭代器产生影响

B.参考A的解释。

C.vector删除,当前元素肯定失效,后面元素会牵扯到移动数据,因此删除元素后面的迭代器也会失效

D. vector的删除操作不光会导致指向被删除元素的迭代器失效,删除元素后面的迭代器也会失效

完整代码:

vector.h

#pragma once

#include<iostream>
#include<assert.h>
#include<string>
using namespace std;

namespace rtx
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{}
		~vector()
		{
			delete[] _start;
			_start = _finish = _end_of_storage = nullptr;
		}

		size_t size() const
		{
			return _finish - _start;
		}
		size_t capacity() const
		{
			return _end_of_storage - _start;
		}

		void push_back(const T& x)
		{
			//if (_finish == _end_of_storage)
			//{
			//	reserve(capacity() == 0 ? 4 : capacity() * 2);
			//}
			//*_finish = x;
			//++_finish;
			insert(end(), x);
		}
		void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t sz = size();
				T* tmp = new T[n];
				if(_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz); //浅拷贝,不行

					for (size_t i = 0; i < sz; i++)// 如果T是int,一个一个拷贝没问题
					{
						tmp[i] = _start[i];// 如果T是string等自定义问题,一个一个拷贝调用的是T的深拷贝,也不会出问题。
					}
					delete[] _start;
				}
				_start = tmp;
				_finish = tmp + sz;
				_end_of_storage = tmp + n;
			}
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return *(_start + pos);
		}
		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return *(_start + pos);
		}

		iterator begin()
		{
			return _start;
		}
		iterator end()
		{
			return _finish;
		}
		const_iterator begin() const
		{
			return _start;
		}
		const_iterator end() const
		{
			return _finish;
		}

		template<class InputInterator>
		vector(InputInterator first, InputInterator last)
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}

		void resize(size_t n, const T& val = T())
		{
			if (n > capacity())
			{
				reserve(n);
			}
			if (n > size())
			{
				while (_finish != _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
			else
			{
				_finish = _start + n;
			}
		}

		void pop_back() 
		{
			assert(_finish > _start);
			--_finish;
		}

		iterator insert(iterator pos, const T& val)
		{
			assert(pos >= _start);// ①检查pos是否越界
			assert(pos <= _finish);

			if (_finish == _end_of_storage)// ②检查是否需要扩容
			{
				size_t len = pos - _start;// 记录一下pos到_start的距离
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;// 迭代器失效问题,扩容后pos还是指向原来的空间,更新一下pos,
				//而且形参不会影响实参,传引用的话begin等就传不了,所以用返回解决
			}

			iterator right = _finish - 1;// ③移动数据
			while (right >= pos)
			{
				*(right + 1) = *right;
				--right;
			}

			*pos = val;// ④插入数据
			++_finish;
			return pos;
		}

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);// 不能<= 因为_finish指向的是最后一个数据的下一个

			iterator left = pos + 1;
			while (left < _finish)
			{
				*(left - 1) = *left;
				++left;
			}
			--_finish;
			return pos;//此时pos就是删除位置下一个位置迭代器
		}

		//vector(const vector<T>& v)// 传统写法
		//{
		//	reserve(v.capacity());
		//	// memcpy(_start, v._start, v.size() * sizeof(T));  // 会翻车
		//	for (const auto& e : v)
		//	{
		//		push_back(e);
		//	}
		//}
		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_end_of_storage, v._end_of_storage);
		}

		vector(const vector<T>& v)// 现代写法
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			vector<T> tmp(v.begin(), v.end());
			swap(tmp);
		}

		vector<T>& operator=(vector<T> v)// 现代写法
		{
			swap(v);
			return *this;
		}

	private:
		iterator _start;
		iterator _finish;
		iterator _end_of_storage;
	};
}

Test.c

#include "vector.h"

namespace rtx
{
	void Test1()
	{
		vector<int> v;
		cout << v.size() << " " << v.capacity() << endl;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		cout << v.size() << " " << v.capacity() << endl;
		v.push_back(5);
		cout << v.size() << " " << v.capacity() << endl;

		for (size_t i = 0; i < v.size();++i)
		{
			cout << v[i] << " ";

		}
		cout << endl;
	}

	void Test2()
	{
		vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);

		for (size_t i = 0; i < v.size();++i)
		{
			++v[i];
			cout << v[i] << " ";
		}
		cout << endl;

		vector<int>::iterator it = v.begin();
		while (it != v.end())
		{
			--(*it);
			cout << *it << " ";
			++it;
		}
		cout << endl;

		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;

		string s("hello world");
		vector<int> v1(s.begin(), s.end());// 存了ASCII码
		for (const auto& e : v1)
		{
			cout << e << " ";
		}
		cout << endl;
	}

	void Test3()
	{
		vector<string> v;      // 在vector里放string
		v.push_back("1");
		v.push_back("2");
		v.push_back("3");
		v.push_back("4");
		v.push_back("5");
		v.push_back("6");
		v.push_back("7");
		v.push_back("8");
		v.push_back("9");

		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;
		cout << v.size() << " " << v.capacity() << endl;

		v.resize(50,"x");
		cout << v.size() << " " << v.capacity() << endl;

		v.pop_back();
		v.pop_back();
		v.pop_back();
		for (const auto& e : v)
		{
			cout << e << " ";
		}
		cout << endl;
		cout << v.size() << " " << v.capacity() << endl;
	}

	void Test4()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		vector<int>::iterator pos = find(v1.begin(), v1.end(), 2);
		if (pos != v1.end()) 
		{
			v1.insert(pos, 20);
		}
		for (const auto& e : v1)
		{
			cout << e << " "; 
		}
		cout << endl;

		pos = find(v1.begin(), v1.end(), 2);
		if (pos != v1.end())
		{
			v1.insert(pos, 20);
		}
		for (const auto& e : v1)
		{
			cout << e << " "; 
		}
		cout << endl;
	}

	void Test4_erase()
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);
		vector<int>::iterator pos = v1.begin();// 删除v1所有的偶数
		while (pos != v1.end()) 
		{
			if (*pos % 2 == 0) 
			{
				pos = v1.erase(pos);
			}
			else
			{
				pos++;
			}
		}
		for (auto e : v1) 
		{
			cout << e << " ";
		}
		cout << endl;
	}

	void Tess5() 
	{
		vector<int> v1;
		v1.push_back(1);
		v1.push_back(2);
		v1.push_back(3);
		v1.push_back(4);
		v1.push_back(5);

		vector<int> v2(v1);
		for (const auto& e : v2)
		{
			cout << e << " ";
		}
		cout << endl;

		vector<int> v3;
		v3 = v2;
		for (auto e : v2)
		{
			cout << e << " ";
		}
		cout << endl;
	}
}

int main()
{
	rtx::Tess5();

	return 0;
}

本篇完。

下一部分:list的接口函数介绍,list模拟实现,再后面就是栈和队列。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/604080.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Android】Jadx动态调试应用

【Android】Jadx动态调试应用 1. 前言 Jadx已支持动态调试APP&#xff0c;但一直没试过&#xff0c;从逆向角度尝试走一遍流程并熟悉&#xff0c;方便日后翻阅。 2. 相关知识 2.1 动态调试原理 动态调试的原理可以概括为以下几个步骤&#xff1a; 启动应用程序进程&#x…

[数据挖掘02] pandas的分配和聚合函数(1)

一 说明 窗口函数是什么&#xff1f;窗口函数是时间序列的局部属性处理函数&#xff0c;比如&#xff0c;一维卷积滤波、移动平均、指数平均本篇我们将针对pandas对象的窗口函数展开讨论&#xff0c;并以示例展示他们的概念实质。 二 窗口函数、分组函数&#xff08; GroupBy …

2023年18个最佳的ChatGPT AI插件

​关注文章下方公众号&#xff0c;可免费获取AIGC最新学习资料 导读&#xff1a;ChatGPT已经将人工智能提升到了一个新的高度。ChatGPT 4不仅是聊天机器人&#xff0c;还可以很好地与第三方插件配合使用。我们挑选出了2023年目前18款最佳的插件来介绍给您。 本文字数&#xff…

【运维知识进阶篇】Ansible Jinja2模板详解

哈喽大家好&#xff0c;我是koten&#xff0c;本篇文章给大家介绍jinja2模板&#xff0c;这是python的全功能模板引擎。在Ansible中&#xff0c;通常会使用jinja2模板来修改被管理主机的配置文件&#xff08;saltstack中也会用到&#xff09; Ansible中使用的jinja2模板其实就…

【软件测试】软件测试管理

软件测试管理 软件测试环境测试环境的要素测试环境管理员 软件测试计划⭐测试计划目标测试计划主题测试计划制订过程定义工作进度的过程测试策略 软件缺陷(bug)管理缺陷的主要属性如何报告缺陷⭐如何跟踪缺陷缺陷度量 软件配置管理&#xff08;SCM&#xff09;软件配置管理的基…

计算机网络传输层1.0

功能 传输层提供进程到进程的逻辑通信 复用和分用 传输层对收到的报文进行差错检测 TCP/UDP 提供进程到进程的逻辑通信 网络层是提供主机间逻辑通信 从网络层来看&#xff0c;通信双方为两台主机&#xff0c;IP数据包首部给出两台主机的IP地址 而实际上的两台主机通信时两台…

Makefile路径处理:执行路径、绝对路径与相对路径的处理

问题描述 最近编写了一个 编译设备树 的 Makefile&#xff0c;遇到了使用 make -f xx/Makefile&#xff0c;执行路径变了&#xff0c;造成 Makefile 里面的一些操作路径不正确&#xff0c;无法执行 获取当前目录 make 内置的 $(CURDIR)&#xff0c;可以把当前路径的全路径打印…

Three.js--》实现图片转3D效果展示

目录 项目搭建 初始化three.js基础代码 加载图片纹理 设置着色器 今天简单实现一个three.js的小Demo&#xff0c;加强自己对three知识的掌握与学习&#xff0c;只有在项目中才能灵活将所学知识运用起来&#xff0c;话不多说直接开始。 项目搭建 本案例还是借助框架书写th…

逻辑推理与集合

逻辑推理与集合是同一个过程的不同展示方式&#xff0c;这两者具有不同的特点。 逻辑推理通常是一种思维过程、语言文本的形式。 而集合则很容易采用一种可视化的方式进行展示&#xff0c;并且集合很容易进行交集、并集、补集、差集等计算。 把语言的逻辑推理过程转换为集合…

0602-指针和数组

数组名 数组名是一个地址常量&#xff0c;不允许赋值。它表示数组首元素的地址。 指针操作数组元素 指针访问数组 指针类型变量\常量1等同于指针保存的内存地址sizeof(指针指向的数据类型)。 2个相同类型的指针相减&#xff0c;得到的结果是2个指针的偏移量。其中偏移单位…

STL模型转有限元网格

随着计算机图形学、硬件和3D打印技术的发展&#xff0c;基于曲面三角网格的图形渲染及其文件格式越来越流行。 在有限元分析&#xff08;FEA&#xff09;中&#xff0c;工程师有时会得到基于三角形网格的几何文件&#xff08;如STL文件等&#xff09;并进行后续分析。 由于曲面…

华为OD机试真题 Java 实现【检查是否存在满足条件的数字组合】【2022Q4 100分】

一、题目描述 给定一个正整数数组&#xff0c;检查数组中是否存在满足规则的数字组合 规则&#xff1a;A B 2C 二、输入描述 第一行输出数组的元素个数。 接下来一行输出所有数组元素&#xff0c;用空格隔开。 三、输出描述 如果存在满足要求的数&#xff0c;在同一行…

【MySQL】不允许你不会SQL语句之DDL

目录 前言&#xff1a; 一.DDL数据库语句 1.1语句讲解 1.2总结 二.DDL表语句 2.1语句讲解 2.2总结 三.DDL字段语句 3.1语句讲解 3.2总结 四.MySQL数据类型 五.结尾 前言&#xff1a; 在从零到一入门MySQL一篇中&#xff0c;我们对数据库已经有了一定的了解&#xf…

Linux 设备树手动反编译 dtb 生成 源文件dts

验证平台 win10 64 位 VMware Workstation Pro 16 ubuntu 20.04 dtc 工具&#xff1a; 来自 linux-6.3.5 中的 scripts/dtc/ 安装 dtc 工具 其实可以通过安装 dtc 软件包&#xff0c;但不建议这么做&#xff0c;最好通过编译Linux 最新的内核&#xff0c;获取这个 dtc 工具…

利用Web Serial API实现Vue与单片机串口通信

一、Web Serial API介绍 Web Serial API 是一项 Web 技术&#xff0c;用于在浏览器中访问串行端口设备&#xff08;如 Arduino、传感器等&#xff09;并与之通信。它提供了一组 JavaScript 接口&#xff0c;使得 Web 应用程序可以通过 USB 串行端口连接到硬件设备&#xff0c;并…

华为OD机试真题 Java 实现【报数游戏】【2022Q4 100分】

一、题目描述 100个人围成一圈&#xff0c;每个人有一个编码&#xff0c;编号从1开始到100。他们从1开始依次报数&#xff0c;报到为M的人自动退出圈圈&#xff0c;然后下一个人接着从1开始报数&#xff0c;直到剩余的人数小于M。请问最后剩余的人在原先的编号为多少&#xff…

【JavaSE】Java基础语法(四十五):TCP UDP 全解

文章目录 1. TCP发送数据2. TCP接收数据【应用】3. TCP程序练习4. TCP程序文件上传练习【应用】5. UDP发送数据6. UDP接收数据【应用】7. UDP通信程序练习【应用】8. UDP三种通讯方式 1. TCP发送数据 Java中的TCP通信 Java对基于TCP协议的的网络提供了良好的封装&#xff0c;使…

chatgpt赋能python:Python删除文件目录

Python删除文件目录 Python是一种高级编程语言&#xff0c;广泛应用于开发各种类型的应用程序。Python的许多功能使其成为开发者的首选编程语言之一。在这篇文章中&#xff0c;我们将讨论如何使用Python删除文件和目录。 文件和目录的区别 在开始之前&#xff0c;让我们了解…

16_Linux内核启动流程

目录 链接脚本vmlinux.Ids Linux内核入口stext mmap_switched函数 start_kernel函数 rest_init函数 init进程 链接脚本vmlinux.Ids 要分析Linux启动流程,同样需要先编译一下Linux源码,因为有很多文件是需要编译才会生成的。首先分析Linux内核的连接脚本文件arch/arm/kem…

【Python】Python系列教程-- Python3 字符串(十一)

文章目录 前言Python3 字符串Python 访问字符串中的值Python 字符串更新Python 转义字符Python 字符串运算符Python 字符串格式化Python三引号f-stringUnicode 字符串Python 的字符串内建函数 前言 往期回顾&#xff1a; Python系列教程–Python3介绍&#xff08;一&#xff…