【C++】vector模拟实现过程中值得注意的点

news2024/11/19 17:25:42

👀樊梓慕:个人主页

 🎥个人专栏:《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C++》《Linux》《算法》

🌝每一个不曾起舞的日子,都是对生命的辜负


前言

本篇文章旨在记录博主在模拟实现vector容器中遇到的一些问题,都是一些需要注意的细节问题,希望与大家共勉。


欢迎大家📂收藏📂以便未来做题时可以快速找到思路,巧妙的方法可以事半功倍。

=========================================================================

GITEE相关代码:🌟fanfei_c的仓库🌟

=========================================================================


1.迭代器失效问题

迭代器失效可以大致总结为:

        之前我们说迭代器的底层可以理解为指针,那么迭代器失效其实就是『 底层指针的指向发生了改变,而迭代器没有』,这就会导致使用迭代器时报错或者出现错误数据。

并且迭代器失效一般具有下面的特点:

  • 一般发生在需要扩容时,比如resize、reserve、insert、assign、push_back;
  • 解决方案一般为将迭代器重新赋值,所以我们查看STL-vector的底层源码会发现insert等函数实现时会有返回值,这个返回值就是让我们在使用时,将迭代器重新赋值用的(博主也模拟实现了下供大家参考);

问题剖析(以reserve和insert举例说明)

void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t old = size();
        T* tmp = new T[n];
        if (_start)
        {
            //memcpy(tmp, _start, old * sizeof(T));
            //delete[] _start;

            for (size_t i = 0; i < old; i++)//解决方案
            {
                tmp[i] = _start[i];
            }
            delete[] _start;
        }
        _start = tmp;
        _finish = _start + old;
        _endOfStorage = _start + n;
    }
}

        可以看到我注释掉的代码,在最开始可能你会利用memcpy来简化代码,一步到位非常方便,但这就引发了一些意想不到的后果:『 迭代器失效』。 

假设vector中存储的为string类:

        用memcpy会导致:如果调用了reserve函数,执行到memcpy,memcpy实际为一种『 浅拷贝行为』


『 delete[]会调用析构然后释放空间』

        执行过memcpy后,如果执行delete[] _start就会调用析构函数,然后string的析构导致_ str成为野指针, 进而导致vector的迭代器_start失效。

        同样这个问题到insert的模拟实现处也存在,因为利用了memmove,比如:

iterator insert(iterator pos, const T& x)
{
    assert(pos >= _start && pos <= _finish);

    if (_finish == _endOfStorage)
    {
        size_t len = pos - _start;//保存长度
        size_t newCapacity = capacity() == 0 ? 4 : 2 * capacity();
        reserve(newCapacity);
        pos = _start + len;//扩容后更新pos的位置,否则pos依旧指向被释放的旧空间
    }
    //memmove(pos + 1, pos, (_finish - pos) * sizeof(T));

    iterator end = _finish - 1;//解决方案
    while (end > pos)
    {
        *(end + 1) = *end;
        --end;
    }
    *pos = x;
    ++_finish;
    return pos;
}

解决memcpy、memmove浅拷贝行为导致迭代器失效的问题:

  • 如代码所示,利用重载的赋值操作符就可以避免这一问题,因为赋值是一种『 深拷贝行为』。

以上是模拟实现过程中解决的迭代器时效问题。

那么在应用中,我们可以利用erase、insert的返回值将迭代器重新赋值,防止迭代器失效。

it = s.begin();
while (it != s.end())
{
    it = s.erase(it);
    // 按照下面方式写,运行时程序会崩溃,因为erase(it)之后
    // it位置的迭代器就失效了
    // s.erase(it);
    ++it;
}

另一种解决方案是可以利用『 引用计数』的方式,这里我就不多赘述了,不了解的小伙伴可以自行百度。


2.构造函数重载导致歧义(迭代器区间构造)

迭代器区间构造是一种十分精妙的构造方式,它可以将任意类型(只要支持迭代器)初始化给vector,参数只需要传递两个迭代器即可,比如:

template <class InputIterator>//泛型迭代器
vector(InputIterator first, InputIterator last)
{
    while (first != last)
    {
        push_back(*first);
        ++first;
    }
}
void test_vector()
{
    vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);
    v1.push_back(4);
    v1.push_back(5);
    //同类型构造
    vector<int> v2(v1.begin(), v1.end());
    for (auto e : v2)
    {
        cout << e << " ";
    }
    cout << endl;

    list<int> lt;
    lt.push_back(10);
    lt.push_back(20);
    lt.push_back(30);
    lt.push_back(40);
    //不同类型构造
    vector<int> v3(lt.begin(), lt.end());
    for (auto e : v3)
    {
        cout << e << " ";
    }
    cout << endl;
    //甚至是数组
    int a[] = { 100, 200, 300 };//底层物理空间连续,天然的迭代器-指针
    vector<int> v4(a, a+3);     //指向连续物理地址空间的指针就是天然的迭代器,符合迭代器要求
    for (auto e : v4)
    {
        cout << e << " ";
    }
    cout << endl;
}

但vector中有某类构造函数是这样的:

vector(size_t n, const T& val = T())//将容器初始化为n个val
{
    resize(n, val);
}

如果你写了这样的代码:

void test_vector()
{
    vector<string> v1(5, "1111");//ok
    for (auto e : v1)
    {
        cout << e << " ";
    }
    cout << endl;

    vector<int> v2(5, 1);//err
    for (auto e : v2)
    {
        cout << e << " ";
    }
    cout << endl;
}

这就会引发报错:


问题剖析 

原因就是你的程序可能没有按你的本意走,你的本意是想『 将v2初始化为5个1』。

可是编译器会将5和1识别为迭代器,因为5和1的类型相同,不需要发生类型转换。

为什么不会识别为(size_t n,const T& val = T())呢,很明显编译器也不想发生类型转换,size_t为unsigned char,另一个参数为const T&(这里为int),需要发生类型转转换才可以匹配。

所以为了解决这一问题,我们需要再额外重载一个:

vector(size_t n, const T& val = T())//将容器初始化为n个val
{
    resize(n, val);
}
vector(int n, const T& val = T())//为了解决两个参数都为int,会自动匹配迭代器区间初始化函数导致报错
{
    resize(n, val);
}

虽然看起来好像不太高级,但是实际上STL也是这么做的。 


3.vector模拟实现源码

template<class T>
class vector
{
public:
    //Vector的迭代器是一个原生指针
    typedef T* iterator;
    typedef const T* const_iterator;
    iterator begin()
    {
        return _start;
    }
    iterator end()
    {
        return _finish;
    }
    const_iterator begin() const
    {
        return _start;
    }
    const_iterator end() const
    {
        return _finish;
    }

    // construct and destroy
    vector()
    {}

    vector(const vector<T>& v)
    {
        //传统写法
        /*_start = new T(v.capacity());
        memcpy(_start, v._start, v.size() * sizeof(T));
        _finish = _start + v.size();
        _endOfStorage = _start + v.capacity();*/

        //现代写法
        reserve(v.capacity());
        for (const auto& e : v)
        {
            push_back(e);
        }
    }

    //迭代器区间初始化    “泛型”
    //可以穿任意类型的迭代器初始化
    template <class InputIterator>
    vector(InputIterator first, InputIterator last)
    {
        while (first != last)
        {
            push_back(*first);
            ++first;
        }
    }

    vector(size_t n, const T& val = T())//如果传参两个int,会导致不匹配该函数而匹配迭代器区间初始化函数
    {
        resize(n, val);
    }

    vector(int n, const T& val = T())//为了解决两个参数都为int,会自动匹配迭代器区间初始化函数导致报错
    {
        resize(n, val);
    }

    vector<T>& operator= (vector<T> v)
    {
        swap(v);
        return *this;
    }
    ~vector()
    {
        if (_start)
        {
            delete[] _start;
            _start = _finish = _endOfStorage = nullptr;
        }
    }

    // capacity
    size_t size() const
    {
        return _finish - _start;
    }
    size_t capacity() const
    {
        return _endOfStorage - _start;
    }
    void reserve(size_t n)
    {
        if (n > capacity())
        {
            size_t old = size();
            T* tmp = new T[n];
            if (_start)
            {
                //memcpy(tmp, _start, old * sizeof(T));//用memcpy会导致模板为string类时,如果vector需要扩容,此时memcpy实际为一种“浅拷贝行为”,string成员_str会因为delete[] _start成为野指针
                //delete[] _start;//delete[]会调用析构然后释放空间
                //同样这个问题到insert的模拟实现处也存在,因为利用了memmove
                for (size_t i = 0; i < old; i++)//解决方案   另一种解决方案是可以利用“引用计数”
                {
                    tmp[i] = _start[i];
                }
                delete[] _start;
            }
            _start = tmp;
            _finish = _start + old;
            _endOfStorage = _start + n;
        }
    }
    void resize(size_t n, const T& val = T())
    {
        if (n > size())
        {
            if (n > capacity())
            {
                reserve(n);
                while (_finish < _start + n)
                {
                    *_finish = val;
                    ++_finish;
                }
            }
        }
        else
            _finish = _start + n;
    }

    ///access///
    T& operator[](size_t pos)
    {
        return _start + pos;
    }
    const T& operator[](size_t pos)const
    {
        return _start + pos;
    }

    ///modify/
    void push_back(const T& x)
    {
        //1.判断容量
        if (_finish == _endOfStorage)
        {
            reserve(capacity() == 0 ? 4 : 2 * capacity());
        }
        //2.尾插
        *_finish = x;
        ++_finish;
    }
    void pop_back()
    {
        assert(size() > 0);
        --_finish;
    }
    void swap(vector<T>& v)
    {
        std::swap(_start, v._start);
        std::swap(_finish, v._finish);
        std::swap(_endOfStorage, v._endOfStorage);
    }
    iterator insert(iterator pos, const T& x)
    {
        assert(pos >= _start && pos <= _finish);

        if (_finish == _endOfStorage)
        {
            size_t len = pos - _start;//保存长度
            size_t newCapacity = capacity() == 0 ? 4 : 2 * capacity();
            reserve(newCapacity);
            pos = _start + len;//扩容后更新pos的位置,否则pos依旧指向被释放的旧空间
        }
        //memmove(pos + 1, pos, (_finish - pos) * sizeof(T));//memmove是一种浅拷贝行为,可能会造成模板为string类时,野指针的问题

        iterator end = _finish - 1;
        while (end > pos)
        {
            *(end + 1) = *end;
            --end;
        }
        *pos = x;
        ++_finish;
        return pos;
    }

    iterator erase(iterator pos)//未测试
    {
        assert(size() > 0);
        assert(pos >= _start && pos < _finish);
        //memmove(pos , pos+1, (_finish - pos) * sizeof(T));//memmove是一种浅拷贝行为,可能会造成模板为string类时,野指针的问题

        iterator it = pos + 1;
        while (it < _finish)
        {
            *(it - 1) = *it;
            ++it;
        }
        --_finish;
        return pos;
    }
private:
    iterator _start = nullptr; // 指向数据块的开始
    iterator _finish = nullptr; // 指向有效数据的尾
    iterator _endOfStorage = nullptr; // 指向存储容量的尾
};

以上就是本篇文章的全部内容。

模拟实现的意义就是『 让我们更好的使用』,像迭代器失效、构造函数重载-迭代器区间构造导致歧义等问题,只有我们模拟实现过,才能更深切得体会到为什么STL库的设计者要这么写,这么写的意义是什么。


=========================================================================

如果你对该系列文章有兴趣的话,欢迎持续关注博主动态,博主会持续输出优质内容

🍎博主很需要大家的支持,你的支持是我创作的不竭动力🍎

🌟~ 点赞收藏+关注 ~🌟

=========================================================================

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1389673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux高级篇基础理论十二( 自动化运维工具Ansible )

♥️作者&#xff1a;小刘在C站 ♥️个人主页&#xff1a; 小刘主页 ♥️不能因为人生的道路坎坷,就使自己的身躯变得弯曲;不能因为生活的历程漫长,就使求索的 脚步迟缓。 ♥️学习两年总结出的运维经验&#xff0c;以及思科模拟器全套网络实验教程。专栏&#xff1a;云计算技…

分布式存储

1 存储基础 1.1 单机存储设备 DAS&#xff08;直接附加存储&#xff0c;是直接接到计算机打的主板总线上去的存储&#xff09; UDE、SATA、SCSI、SAS、USB接口的磁盘 所谓的接口就是一种存储设备驱动下的磁盘设备&#xff0c;提供块级别的存储 NAS&#xff08;网络附加存储…

通俗易懂实现功能强大的实战项目 springboot+java+vue+mysql 日常办公用品直售推荐系统

✍✍计算机编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡ Java实战 |…

投资自己,成就未来——社科院杜兰大学金融管理硕士项目

或许你一直在寻找一个能够提升自己、实现职业突破的机会。如果你对金融领域充满热情&#xff0c;并且渴望在这个竞争激烈的行业中脱颖而出&#xff0c;那么我要向你介绍一个绝佳的选择——中国社会科学院与美国杜兰大学金融管理硕士项目。 在这个高速发展的时代&#xff0c;投…

C语言调试大作战:与VS编译器共舞,上演一场“捉虫记”的艺术与科学

少年们好&#xff0c;我是博主那一脸阳光&#xff0c;我们接下来介绍C语言的调试和bug的分享。 引言&#xff1a; “如果你曾经在深夜与一串神秘莫测的C代码狭路相逢&#xff0c;彼此瞪大眼睛&#xff0c;犹如牛仔对决般紧张刺激&#xff1b;或者你曾试图驯服一段狂野不羁的循环…

C++入门案例——通讯录管理系统 控制台项目

前言 C入门案例——通讯录管理系统 & 控制台项目 目录 前言总体概览实体类设计显示页面和退出系统 添加联系人逻辑拆解相关代码 显示联系人逻辑拆解相关代码 根据名字删除联系人逻辑拆解相关代码 根据名字查找联系人逻辑拆解相关代码 修改联系人逻辑拆解相关代码 清空所有…

如何公网远程访问Axure RP制作的本地web页面【内网穿透】

文章目录 前言1.在AxureRP中生成HTML文件2.配置IIS服务3.添加防火墙安全策略4.使用cpolar内网穿透实现公网访问4.1 登录cpolar web ui管理界面4.2 启动website隧道4.3 获取公网URL地址4.4. 公网远程访问内网web站点4.5 配置固定二级子域名公网访问内网web站点4.5.1创建一条固定…

Angular系列教程之组件

文章目录 前言组件的基本概念组件与指令的关系在模板中使用组件总结 前言 在Angular中&#xff0c;组件是构建Web应用程序的核心单元。它们允许我们将UI划分为独立且可重用的部分&#xff0c;并通过数据绑定和事件处理等机制来实现交互性。本文将介绍Angular组件的基本概念&am…

2024大数据“打假”:什么才是真湖仓一体?

编者按&#xff1a;近年来&#xff0c;随着金融、制造、政务、交通、医疗等行业数字化转型深入&#xff0c;大量智慧应用涌现&#xff0c;使得构建强大的数据分析技术栈成为必须&#xff0c;也让“湖仓一体”成为热门词汇。但面对市场中各色各样的湖仓技术&#xff0c;众多行业…

【漏洞复现】Kubernetes PPROF内存泄漏漏洞(CVE-2019-11248)

Nx01 产品简介 Kubernetes&#xff08;简称K8S&#xff09;是Google在2014年开源的一个容器集群管理系统。它用于容器化应用程序的部署、扩展和管理&#xff0c;目标是让部署容器化应用简单且高效。 Nx02 漏洞描述 漏洞存在于Kubernetes的1.18.6版本之前&#xff0c;可能导致未…

某侠网js逆向wasm解析

本次目标地址如下&#xff0c;使用base64解密获得 aHR0cHM6Ly93d3cud2FpbWFveGlhLm5ldC9sb2dpbg 打开网址&#xff0c;本次的目标是登录接口&#xff0c;如下图 本文主要讲解wasm的解析&#xff0c;所以对其他参数不做逆向处理&#xff0c;本次由wasm加密的参数只有sign一个&a…

07 整合SSM的快速理解

1.1 第一问&#xff1a;SSM整合需要几个IoC容器&#xff1f; 两个容器 本质上说&#xff0c;整合就是将三层架构和框架核心API组件交给SpringIoC容器管理&#xff01; 一个容器可能就够了&#xff0c;但是我们常见的操作是创建两个IoC容器&#xff08;web容器和root容器&…

记一次小黄站渗透过程,实操!

前言 记录某一次无意点开的一个小网站的渗透过程&#xff0c;幸运的是搭建平台是phpstudy&#xff0c;cms是beecms&#xff0c;beecms有通用漏洞&#xff0c;然后去网上找了资料&#xff0c;成功getshell并获取服务器权限。 渗透过程 无意点开一个网站&#xff0c;发现网站比…

【操作系统】在阅读论文:OrcFS: Orchestrated file system for flash storage时需要补充的基础知

在阅读论文&#xff1a;OrcFS: Orchestrated file system for flash storage是需要补充的基础知识 这篇论文是为了解决软件层次之间的信息冗余问题 To minimize the disk traffic, the file system buffers the updates and then flushes them to the disk as a single unit, …

datawhale 大模型理论基础 引言

学习地址&#xff1a;大模型理论基础 一、什么是语言模型&#xff08;Language Model) 语言模型其实是一个概率模型&#xff0c;给每一个句子列表计算一个概率值&#xff1a; p(x1​,…,xL​) 例如&#xff1a; p(the, mouse, ate, the, cheese)0.02…

解决若依Vue3前后端分离---路由切换时显示白屏

解决若依Vue3前后端分离---路由切换时显示白屏 1.问题重述 解决基于Vue3若依前后端分离项目中出现的路由正常切换但是就是不显示数据的问题&#xff0c;也就是不发起网络请求的问题。 找到如下位置中AppMain.vue文件 将除了css中的代码进行替换成如下的代码。 <template&g…

Python数据分析案例34——IMDB电影评论情感分析(Transformer)

电影评论的情感分析 案例背景 很多同学对电影系列的数据都比较喜欢&#xff0c;那我就补充一下这个最经典的文本分类数据集&#xff0c;电影情感评论分析。用神经网络做。对国外的英文评论文本进行分类&#xff0c;看是正面还是负面情感。 数据集介绍 数据集&#xff1a;IMDb…

C# wpf 获取控件的刷新时机

文章目录 前言一、为何需要刷新时机&#xff1f;例子一、隐藏控件后截屏例子二、修改控件大小后做计算 二、如何实现&#xff1f;1.使用动画2.使用TaskCompletionSource 三、完整代码四、使用示例1、隐藏工具条截屏2、修改宽高后获取ActualWidth、ActualHeight 总结 前言 做wp…

Codeforces Round 920 (Div. 3) F题 根号分治,后缀和,后缀和的后缀和

Problem - F - Codeforces 我看的这位UP的视频讲解 &#xff1a; Codeforces Round 920 (Div. 3) F题 根号分治 详解_哔哩哔哩_bilibili 目录 题意&#xff1a; 思路&#xff1a; 后缀和的后缀和: 后缀和的后缀和的中间段如何求&#xff1a; ———— 根号分治: 核心…