✨ Blog’s 主页: 白乐天_ξ( ✿>◡❛)
🌈 个人Motto:他强任他强,清风拂山冈!
🔥 所属专栏:C++深入学习笔记
💫 欢迎来到我的学习笔记!
一、迭代器失效的概念
- 迭代器的作用与本质
- 迭代器的主要作用是让算法无需关心底层数据结构,其底层实际为指针或对指针的封装。在
vector
中,迭代器本质上就是原生态指针T*
(通过typedef
定义为iterator
,常量迭代器为const_iterator
)。
namespace Harper
{
template<class T>
class vector
{
public:
// 迭代器的你故意
typedef T* iterator;
typedef const T* const_iterator;
// 其他成员函数和变量的定义
//...
};
}
- 迭代器失效的本质
- 迭代器失效即迭代器底层对应指针所指向的空间被销毁,继续使用这种已释放空间的迭代器会导致程序崩溃,具体表现为:
- 迭代器本质是指针,所以迭代器失效就是指针失效。
- 指针失效意味着指针指向的空间非法,如指向已被释放的空间或者越界访问。
二、导致迭代器失效的操作
- 扩容相关操作
- 如
resize
、reserve
、insert
、assign
、push_back
等可能引起扩容的操作,都可能导致迭代器失效(由野指针引起)。下面是push_back
为例的 :
void push_back(const T& value)
{
if (_finish == _end_of_storage)
{
size_t newcapacity = capacity() == 0? 4 : capacity() * 2;
reserve(newcapacity);
}
*_finish = value;
++_finish;
}
- 在这个过程中,如果有其他迭代器指向原来的
vector
空间,那么在扩容后这些迭代器就可能失效。
- 指定位置的插入与删除操作
- 像
insert
、erase
这类指定位置的操作,可能使迭代器指向的位置意义发生改变,从而导致迭代器失效。
三、避免迭代器失效的方法
3.1 insert
函数的迭代器失效问题及解决
3.1.1 扩容导致野指针的情况
-
问题描述:给出
insert
的初始版本代码,在测试中发现,例如先push_back
尾插一定数量元素后调用insert
可能出现随机值问题(如尾插4个元素后调用insert
出现随机值,尾插5个调用insert
无此问题)。这是因为pos
未更新,扩容时_start
和_finish
更新,而pos
仍指向旧空间,旧空间释放后pos
成为野指针,后续*pos = x
操作非法访问野指针。 -
解决方法:计算扩容前
pos
与_start
的相对距离n
,扩容后让pos = _start + n
,使pos
始终指向正确位置。修改后的insert
函数如下:
void insert(iterator pos, const T& x)
{
//检测参数合法性
assert(pos >= _start && pos <= _finish);
/*扩容以后pos就失效了,需要更新一下*/
if (_finish == _end_of_stoage)
{
size_t n = pos - _start;
size_t newcapcacity = capacity() == 0? 4 : capacity() * 2;
reserve(newcapcacity);
pos = _start + n;
}
//挪动数据
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *(end);
end--;
}
//把值插进去
*pos = x;
_finish++;
}
3.1.2 迭代器指向位置意义改变的情况
-
问题描述:以在所有偶数前插入
2
为例,在测试代码中发现会发生断言错误。当insert
插入可能扩容时,原空间数据拷贝到新空间,旧空间变为野指针,而外部迭代器it
一直指向旧空间,遍历it
时会非法访问野指针导致失效;即使不扩容,it
指向位置意义改变,会导致程序重复插入元素。 -
解决方法:给
insert
函数加上返回值(返回指向新插入元素的位置),调用时让迭代器接收insert
的返回值。修改后的insert
函数如下:
iterator insert(iterator pos, const T& x)
{
//检测参数合法性
assert(pos >= _start && pos <= _finish);
//检测是否需要扩容
/*扩容以后pos就失效了,需要更新一下*/
if (_finish == _end_of_stoage)
{
size_t n = pos - _start;
size_t newcapcacity = capacity() == 0? 4 : capacity() * 2;
reserve(newcapcacity);
pos = _start + n;
}
//挪动数据
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *(end);
end--;
}
//把值插进去
*pos = x;
_finish++;
return pos;
}
测试函数:
// 测试函数
void testinsert()
{
my_vector::vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
v1.push_back(6);
my_vector::vector<int>::iterator it = v1.begin();
while (it!= v1.end())
{
if (*it % 2 == 0)
{
it = v1.insert(it, 20);
}
++it;
}
for (auto num : v1)
{
std::cout << num << " ";
}
std::cout << std::endl;
}
3.2 erase
函数的迭代器失效问题及解决
-
问题描述
- 给出
erase
的初始版本代码,erase
的失效多为迭代器指向的位置意义发生改变或不在有效访问数据范围内。测试中发现,如删除vector
中的元素后再访问或修改已删除元素的下一个元素可能出现问题(如尾插 4 个数字后删除特定元素,后续访问修改该元素下一个元素可能出错;删除所有偶数的测试中也会出现类似问题)。
- 给出
-
解决方法
- 给
erase
函数加上返回值(返回指向新插入元素的位置),调用时让迭代器接收erase
的返回值。修改后的erase
函数如下:
- 给
iterator erase(iterator pos)
{
//检查合法性
assert(pos >= _start && pos < _finish);
//从pos + 1的位置开始往前覆盖,即可完成删除pos位置的值
iterator it = pos + 1;
while (it < _finish)
{
*(it - 1) = *it;
it++;
}
_finish--;
return pos;
}
四、迭代器失效总结
vector
迭代器失效主要有两种情况:
- 扩容、缩容导致野指针式失效。
- 迭代器指向的位置意义改变。
注意,系统越界机制检查不一定能检测到迭代器失效问题,编译实现的检查机制相对更可靠。