【C++】vector的模拟实现 | 使用memcpy拷贝时的问题 | 实现深拷贝

news2025/1/13 8:04:29

目录

基本框架及接口

构造函数

无参构造

迭代器区间构造

初始化构造

析构函数

size() | capacity()

扩容的reserve()

使用memcpy拷贝的问题

改变大小的resize()

operator[]

迭代器的实现

vector的增删

尾插push_back()

尾删pop_back()

在指定位置插入insert()

在指定位置删除erase()

深拷贝的实现

拷贝构造函数

赋值operator=


上一篇我们说到了vector,它是一个类模板,能够容纳各种类型的对象作为其元素,并且可以动态地调整大小。可以理解为动态数组。

这篇我们就亲自实现一下 简易版的vector,这能大大加深我们对vector的理解!

而因为vector的实现和string有很多相似之处,所以实现过程中的一些细节便不再详述。

基本框架及接口

📁vector.h:

#pragma once
namespace jzy   //为了和STL库里的vector区分,我们就把它放进自定的命名空间里
{
    template<typename T>
    class vector
    {
    public:
        typedef T* iterator;   
        
    private:
        iterator _start;
        iterator _finish;     //finish表示最后一个位置的后一个位置
        iterator _end_of_storage;
    };
}

这里的三个成员变量,是参照了《STL源码剖析》,按照STL 3.0版本实现的。

 

这样的话,想要知道 _size或者 _capacity,就用成员变量相减的方式。

构造函数

无参构造

vector()
    :_start(nullptr)
    ,_finish(nullptr)
    , _end_of_storage(nullptr)
{}
 

迭代器区间构造

通过传迭代器的起、始区间(左闭右开)来构造。

vector(InputIterator first, InputIterator last)
        {
            InputIterator it = first;
            int num = 0;       //统计个数
            while (it != last)
            {
                it++;
                num++;
            }
​
            _start = new T[num];
            for (int i = 0; i < num; i++)
            {
                _start[i] = *first++;
            }
            _finish = _start + num;
            _end_of_storage = _start + num;
        }

初始化构造

构造的同时能将对象初始化,使之含n个val值。

 

vector(int n, const T& val = T())   //注意:这里不能给size_t!
        {
            _start = new T[n];
            for (int i = 0; i < n; i++)
            {
                _start[i] = val;
            }
            _finish = _start + n;
            _end_of_storage = _start + n;
        }

为什么n的类型不能是size_t?

如果是size_t,当传的两个参数都是int类型时,测试出的结果为:

void test7()
{
    vector<int> v1(5,1);  
    for (auto& e : v1)
    {
        cout << e << " ";
    }
}

 

原因:

我们知道,v1在匹配构造函数时,是根据参数的类型来匹配的。

size_t与int并不能很好地匹配,而InputIerator却可以匹配上int类型,因为InputIerator本身就是个模板,int无需转化就能匹配上。

所以v1调用的构造函数是 vector(InputIterator first, InputIterator last); ,

在这个函数里,要对int进行解引用,所以报错:非法的间接寻址。

析构函数

~vector()
{
    delete[] _start;
    _start = _finish = _end_of_storage = nullptr;
}

size() | capacity()

目前的三个成员变量不能直观地表示出 容量和大小,因此,我们需要亲自实现出来。

size_t size()
{
    return _finish - _start;   
}
​
size_t capacity()
{
    return _end_of_storage - _start;
}

扩容的reserve()

扩容的思路是:

先开新空间,再把数据都拷到新空间里去,然后释放旧空间,让指针指向新空间。

未经修正版的reserve:

void reserve(size_t n)
        {
            if (n > capacity())
            {
                size_t sz = size();
​
                T* tmp = new T[n];
                int a = size();
                if (_start)
                {
                    memcpy(tmp, _start, sz* sizeof(T)); 
                    delete[] _start;
                }
                _start = tmp;
                _finish = _start + sz;
                _end_of_storage = _start + n;
            }
        }

来测试下:

void test10()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
​
    for (auto& e : v)
    {
        cout << e << " ";
    }
    cout << endl;
}

 

看起来搞定了。但真的OK吗?

如果我们用自定义类型,如vector<string>来测试:

void test9()
{
    vector<string> v;
    v.push_back("happy");
    v.push_back("happy");
    v.push_back("happy");
    v.push_back("happy");
    v.push_back("happy");
​
    for (auto& e : v)
    {
        cout << e << " ";
    }
    cout << endl;
​
}

 

程序居然崩溃了!

其实,这都是memcpy惹的祸。

使用memcpy拷贝的问题

⭐memcpy只能进行浅拷贝,所以,如果是拷内置类型,那很乐于用memcpy。

如果是自定义类型 且 涉及资源管理的,就不能用memcpy了,不然可能会引起内存泄漏甚至程序崩溃。

现在来解释vector<string>用例崩溃的原因:

在调用push_back时,空间不够的话,push_back内部会调用reserve开空间,问题就出在这个reserve。来看看reserve是咋实现的:

void reserve(size_t n)
        {
            if (n > capacity())
            {
                size_t sz = size();
​
                T* tmp = new T[n];
                int a = size();
                if (_start)
                {
                    memcpy(tmp, _start, sz* sizeof(T));    //拷数据时用memcpy
                    delete[] _start;
                }
                _start = tmp;
                _finish = _start + sz;
                _end_of_storage = _start + n;
            }
        }

可以看到,reserve是调memcpy拷数据的,拷完就释放了_start。

虽然vector<string>实现了深拷贝,开了新空间,但是其中的成员 tmp没有被深拷贝,

tmp 的内容是由memcpy值拷贝来的,和_start指向同一块空间。

当_start被delete,那tmp的空间同样也被释放了。

所以说,如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,还是得自己老老实实地拷贝。

➡️修改后的reserve:

void reserve(size_t n)
        {
            if (n > capacity())
            {
                //开空间
                T* tmp = new T[n];
                //拷数据
                iterator begin = _start;
                int i = 0;
                while (begin != _finish)
                {
                    tmp[i++] = *begin++;
                }
                //释放、赋值
                delete[] _start;
                _start = tmp;
                _finish = tmp + i;
                _end_of_storage = tmp + n;
            }
        }

此时再测试:

改变大小的resize()

void resize(size_t n , T val = T())
        {
            if (n < size())
            {
                _finish = _end_of_storage = _start + n;
            }
            else
            {
                reserve(n);
                for (int i = size(); i < n; i++)
                {
                    _start[i] = val;
                }
                _finish = _start + n;
            }
        }

operator[]

T& operator[] (size_t pos) 
{
    assert(pos < size());
    return *(_start + pos);
}

迭代器的实现

普通迭代器的begin() | end():

typedef T* iterator;
iterator begin()
{
    return _start;
}
​
iterator end()
{
    return _finish;
}

const迭代器的begin() | end():

被const修饰以后,只能读,不能写。

typedef const T* const_iterator;
const_iterator begin() const
{
    return _start;
}
​
const_iterator end() const
{
    return _finish;
}

关于范围for:

只要实现了迭代器,那范围for不用特意去实现,就已经能用了:

void test1()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
​
    for (auto e : v)    //用范围for遍历
    {
        cout << e << " ";
    }
    cout << endl;
}

 

实际上范围for的底层原理 就是迭代器。它依靠begin()、end()来实现,且只认识begin()和end()。

假如我把begin()的名称改成Begin(),那迭代器照样能用,而范围for就用不了了:它不认识Begin()。。。

vector的增删

尾插push_back()

void push_back(const T& val)  
{
    //先考虑容量够不够
    if (size() == capacity())
    {
        reserve(capacity() == 0 ? 4 : 2 * capacity());
    }
​
    *_finish = val;
    _finish++;
}

这里要注意:形参得被const修饰,并且传引用过去。

传引用的话更省力,不然深拷贝代价大;有了const,形参才能接收常量字符串。

尾删pop_back()

void pop_back()
{
    assert(_start<_finish);
    _finish--;
}

在指定位置插入insert()

void insert(iterator pos, const T& val)
        {
            assert(pos >= _start);
            assert(pos <= _finish);
            //先考虑空间够不够
            if (_finish == _end_of_storage)
            {
                reserve(capacity() == 0 ? 4 : 2 * capacity());
            }
            //挪动数据
            iterator end = _finish - 1;
            while (end >= pos)
            {
                *(end + 1) = *end;
                end--;
            }
            //插入
            *pos = val;
            _finish++;
        }

这样写其实还不够,一旦涉及扩容就会出现问题。我们来测试一下:

void test2()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.pop_back();
    v.insert(v.begin(), 10);
    v.insert(v.begin(), 11);
    v.insert(v.begin(), 12);
​
    for (auto e : v)  
    {
        cout << e << " ";
    }
    cout << endl;
}

 

出现了随机值!

究其原因,其实是reserve扩容 那步出了疏漏,使迭代器pos失效了。

这就是迭代器失效问题

 

也就是说,在扩容后,迭代器pos需要被更新一下:让原本指向旧空间的pos,现在指向新空间的同样位置。

修改后:

void insert(iterator pos, const T& val)
        {
            int flag_pos = pos - _start;   //先记录下pos的相对位置,以便之后更新pos
​
            assert(pos >= _start);
            assert(pos <= _finish);
            //考虑空间够不够
            if (_finish == _end_of_storage)
            {
                reserve(capacity() == 0 ? 4 : 2 * capacity());
                pos = _start + flag_pos;     //根据刚刚记录的位置,更新pos
            }
​
            //挪动数据
            iterator end = _finish - 1;
            while (end >= pos)
            {
                *(end + 1) = *end;
                end--;
            }
            //插入
            *pos = val;
            _finish++;
        }

现在可以成功插入了:

拓展思考:若将v.begin()传给pos时,采用引用传参,可行吗?

void insert(iterator& pos, const T& val);

不可行。这个问题很考验我们在类和对象那块的基础知识。

我们来看看begin():

iterator begin()
        {
            return _start;
        }

它采用传值返回,返回的不是_start,而是它的拷贝出来的临时对象

临时对象是具有常性的,所以pos没法作它的别名,我们只能拷贝一份它,存进pos里。

在指定位置删除erase()

void erase(iterator pos)
        {
            assert(pos >= _start && pos < _finish );  //这里注意:不能<=_finish!因为它指向的是最后一个元素的后一个位置
            
            iterator begin = pos + 1;
            while (begin < _finish)
            {
                *(begin - 1) = *begin;
                begin++;
            }
            
            _finish--;
        }

但是!看似平静无澜的erase(),其实暗含隐患:erase也会有迭代器失效的问题。

现在我们用一个例子来展示出它的问题:现要求删除所有的偶数。

v分两组,分别是A:{1,2,3,4,5}; B:{1,2,3,4}。

A:

void test3()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
​
    vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        it++;
    }
    for (auto e : v)
    {
        cout << e << " ";
    }
    cout << endl;
}

 

删除成功了。但如果v中是1 2 3 4,就不行。

B:

void test3()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    ……
}  

程序崩溃了:

 

这是因为迭代器失效了,我们用图来说明原因:

 

而{1,2,3,4,5}仅仅是碰巧,被删的偶数后面正好跟着奇数,所以没有暴露错误。

那对于erase中迭代器失效的情况,写C++的大佬是怎么处理的呢?

处理的思路是:将返回值由void 改为iterator,返回删除后pos的位置。这样的话,删完后迭代器还是指向pos,就不会错过pos位置的比较。

修改后的erase:

iterator erase(iterator pos)
        {
            assert(pos >= _start && pos < _finish );  //这里注意:不能<=_finish!因为它指向的是最后一个元素的后一个位置
            
            iterator begin = pos + 1;
            while (begin < _finish)
            {
                *(begin - 1) = *begin;
                begin++;
            }
            
            _finish--;
            return pos;
        }

测试:

void test3()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
​
    //要求删除所有的偶数
    vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)   //用if else语句,删完以后迭代器仍停在pos位置,而不会自增
        {
            it = v.erase(it);
        }
        else 
        {
            it++;
        }
    }
    for (auto e : v)
    {
        cout << e << " ";
    }
    cout << endl;
}

深拷贝的实现

拷贝构造函数

如果我们用默认的拷贝构造函数,进行vector的浅拷贝的话:

void test4()
{
    vector<int> v1;
    vector<int> v2(v1);
}

 

这是因为,浅拷贝仅能复制值,而不能复制一份同样的空间。

这样v1、v2就指向了同一块空间,析构v1、v2时,同一块空间被析构了两次,所以程序崩溃了。

所以,我们要手动实现vector的拷贝构造,实现深拷贝。

➡️Way1 传统写法:老老实实地开空间、拷数据。

vector(vector<T>& v)
            :_start(new T[v.capacity()])
            , _finish(_start + v.size())
            , _end_of_storage(_start + v.capacity())
        {
            memcpy(_start, v._start, sizeof(T) * v.size());
        }

➡️Way2 现代写法:本质是复用现成的代码,“构造新对象+将自己和新对象进行swap”。

vector(const vector<T>& v)   
            :_start(nullptr)
            , _finish(nullptr)
            , _end_of_storage(nullptr)
        {
            vector<T> tmp(v.begin(), v.end());
            swap(_start, tmp._start);
            swap(_finish, tmp._finish);
            swap(_end_of_storage, tmp._end_of_storage);
        }

赋值operator=

vector<T>& operator=(vector<T> v)    //因为是传值传参,v就已经是实参的拷贝了,所以不需要再构造tmp
        {
            swap(_start, v._start);
            swap(_finish, v._finish);
            swap(_end_of_storage, v._end_of_storage);
            return *this;
        }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1065547.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【prism】prism 框架代码

前言 这个是针对整个专栏的一个示例程序,应用了专栏里讲的一些知识点,他是一个小而美的Prism的框架代码,一个模板,方便大家去扩展一个prism工程。 下面是一些代码片段,最后我给出整个工程的下载链接~~~ 代码片段 主界面代码 <Window x:Class="PrismTest.View…

企业加密软件哪个最好用?

天锐绿盾是一款专业的企业级加密软件&#xff0c;提供专业版、行业增强版和旗舰版&#xff0c;分别针对不同的用户需求。 PC访问地址&#xff1a; 首页 天锐绿盾专业版主要面向企事业单位的通用需求&#xff0c;以"让防泄密的管理更简单有效"为核心理念&#xff0c;…

ipv6跟ipv4如何通讯

IPv6的128位地址通常写成8组&#xff0c;每组为四个十六进制数的形式。比如:AD80:0000:0000:0000:ABAA:0000:00C2:0002 是一个合法的IPv6地址。这个地址比较长&#xff0c;看起来不方便也不易于书写。零压缩法可以用来缩减其长度。如果几个连续段位的值都是0&#xff0c;那么这…

从本地到全球:跨境电商的壮丽崛起

跨境电商&#xff0c;作为数字时代的商业现象&#xff0c;正在以惊人的速度改变着全球贸易的面貌。它不仅仅是一种商业模式&#xff0c;更是一场无国界的革命&#xff0c;使商业不再受限于地理位置&#xff0c;而是全面融入全球市场。 本文将深入探讨跨境电商的崛起&#xff0…

Ansys Speos | 将Rayfile光源转换为面光源

概览 本文将讲述如何rayfile转换为面光源&#xff0c;Rayfile光源文件包含有限数量的光线&#xff0c;表面光源有无限量的光线&#xff0c;这使得表面源对于使用逆模拟&#xff0c;得到清晰可视化仿真特别有用。 表面光源均匀地从几何形状表面的每个点发射光&#xff0c;这种简…

Ansys Optics Launcher 提升客户体验

概述 为了改善用户体验&#xff0c;Ansys Optics 团队开发了一个新的一站式启动应用程序&#xff0c;简化了工作流程并提高了效率。随着Ansys 2023 R2的最新更新&#xff0c;Ansys Optics Launcher 现已安装在Ansys Speos, Ansys Lumerical和Ansys Zemax OpticStudio中。作为一…

DVWA -xss

什么是XSS 跨站点脚本(Cross Site Scripting,XSS)是指客户端代码注入攻击&#xff0c;攻击者可以在合法网站或Web应用程序中执行恶意脚本。当wb应用程序在其生成的输出中使用未经验证或未编码的用户输入时&#xff0c;就会发生XSS。 跨站脚本攻击&#xff0c;XSS(Cross Site S…

Docker之Dockerfile搭建lnmp

目录 一、搭建nginx ​编辑 二、搭建Mysql&#xff08;简略版&#xff09; 三、搭建PHP 五、补充 主机名ip地址主要软件mysql2192.168.11.22Docker 代码示例 systemctl stop firewalld systemctl disable firewalld setenforce 0docker network create --subnet172.18.…

C#封装、继承和多态的用法详解

大家好&#xff0c;今天我们将来详细探讨一下C#中封装、继承和多态的用法。作为C#的三大面向对象的特性&#xff0c;这些概念对于程序员来说非常重要&#xff0c;因此我们将对每个特性进行详细的说明&#xff0c;并提供相应的示例代码。 目录 1. 封装&#xff08;Encapsulati…

009:获取20日均线数据

再《005》中我们获得了K线数据&#xff0c;现在我们要把他的20日均线数据也获取出来。然后通过计算后&#xff0c;保存在新的一列中&#xff1a; import pandas as pd import tkinter as tk from tkinter import filedialog import ospathdef open_file():global pathpath fi…

基于Springboot的漫画网站springboot022

大家好✌&#xff01;我是CZ淡陌。一名专注以理论为基础实战为主的技术博主&#xff0c;将再这里为大家分享优质的实战项目&#xff0c;本人在Java毕业设计领域有多年的经验&#xff0c;陆续会更新更多优质的Java实战项目&#xff0c;希望你能有所收获&#xff0c;少走一些弯路…

代码随想录 Day13 二叉树 LeetCode T104 二叉树的最大深度 T111 二叉树的最小深度 T222完全二叉树的节点个数

以下题解的更详细思路来自于:代码随想录 (programmercarl.com) 前言 二叉树的高度与深度 这里先补充一下二叉树深度和高度的概念 高度:二叉树中任意一个节点到叶子结点的距离 深度:二叉树中任意一个节点到根节点的距离 下面给出一个图便于理解 获取高度与深度的遍历方式 高度:…

python scanpy spatial空转全流程

Spatial mapping of cell types across the mouse brain (1/3) - estimating reference expression signatures of cell types — cell2location documentation Spatial mapping of cell types across the mouse brain (2/3) - cell2location — cell2location documentation #…

文件扫描模块

文章目录 前言文件扫描模块设计初级扫描方案一实现单线程扫描整合扫描步骤 设计初级扫描方案二周期性扫描 总结 前言 我们这个模块考虑的是数据库里面的内容从哪里获取。 获取完成后&#xff0c;这时候,我们就需要把目录里面文件/子文件都获取出来,并存入数据库。 文件扫描模…

Flask-[项目]-搭建短网址系统:flask实现短网址系统,短网址系统,构建短网址系统

一、项目下载地址 https://gitee.com/liuhaizhang/short-url-systemhttps://gitee.com/liuhaizhang/short-url-system 二、项目搭建 2.1、基本环境安装 1、安装好mysql数据库 2、安装好redis数据 3、安装好python解释器 2.2、项目依赖安装 1、切换到python解释器环境中 …

MES管理系统在制造业中的应用及其核心构成

在制造业的信息化进程中&#xff0c;车间级的信息化一直是其薄弱环节。为了提升车间的自动化水平&#xff0c;发展MES数字化技术成为了有效的途径。MES管理系统强调车间级的过程集成、控制和监控&#xff0c;合理地配置和组织所有资源&#xff0c;以满足车间的信息化需求。它提…

5G商企专网,助力打造城市生命线“安徽样板”

为扎实抓好重点领域安全监管&#xff0c;防范各类生产突发事故发生&#xff0c;近年来&#xff0c;安徽芜湖启动了城市生命线工程项目&#xff0c;致力于打造城市生命线“安徽样板”。 项目建设如火如荼&#xff0c;一些难题也不断涌现。比如&#xff0c;为提升城市安全保障能…

浅谈电动汽车智能充电桩及运营管理云解决方案

贾丽丽 安科瑞电气股份有限公司 上海嘉定 201801 摘要&#xff1a;电动汽车采用了电力作为发动能源&#xff0c;但是同样存在很大缺陷,即续航能力方面存在较大不足。因此如何利用现代技术进行电动汽车的智 能充电便十分重要。在电动汽车智能充 电的研究过程中需要用到的技术有…

Kubernetes概述架构与工作流程简述

文章目录 Kubernetes概述Kubernetes优势Kubernetes 集群组件控制平面组件Node 组件 Kubernetes工作流程下期预告 Kubernetes概述 Kubernetes 是一个可移植、可扩展的开源平台&#xff0c;用于管理容器化的工作负载和服务&#xff0c;可促进声明式配置和自动化。 Kubernetes 拥…

pyppeteer 基本用法和案例

特点 自带chromium 不用自己下载也可以下载&#xff0c;比较省事.比selenium好用 可异步调用 简介 一. pyppeteer介绍 Puppeteer是谷歌出品的一款基于Node.js开发的一款工具&#xff0c;主要是用来操纵Chrome浏览器的 API&#xff0c;通过Javascript代码来操纵Chrome浏览器&am…