【C++修炼之路】vector 模拟实现

news2024/12/23 22:53:22

👑作者主页:@安 度 因
🏠学习社区:StackFrame
📖专栏链接:C++修炼之路

文章目录

  • 一、读源码
  • 二、成员变量
  • 三、默认成员函数
    • 1、构造
    • 2、析构
    • 3、拷贝构造
    • 4、赋值重载
  • 四、访问
    • 1、[ ] 重载
    • 2、迭代器
  • 五、容量
    • 1、capacity
    • 2、size
    • 3、reserve
    • 4、resize
  • 六、增删查改
    • 1、insert
    • 2、erase
    • 3、push_back
    • 4、pop_back

如果无聊的话,就来逛逛 我的博客栈 吧! 🌹

一、读源码

以下代码取自 stl30 的 stl_vector.h ,以下分析均在不更改并发布源码的前提条件下进行。

class vector {
public:
 // ...
protected:
  typedef simple_alloc<value_type, Alloc> data_allocator;
  iterator start;
  iterator finish;
  iterator end_of_storage;
  void insert_aux(iterator position, const T& x);
  void deallocate() {
    if (start) data_allocator::deallocate(start, end_of_storage - start);
  }

vector 的成员替换为迭代器:start, finish, end_of_storage

构造:

vector() : start(0), finish(0), end_of_storage(0) {}
vector(size_type n, const T& value) { fill_initialize(n, value); }
vector(int n, const T& value) { fill_initialize(n, value); }
vector(long n, const T& value) { fill_initialize(n, value); }
explicit vector(size_type n) { fill_initialize(n, T()); }

了解成员函数功能

void reserve(size_type n) {
    if (capacity() < n) {
        const size_type old_size = size();
        iterator tmp = allocate_and_copy(n, start, finish);
        destroy(start, finish);
        deallocate();
        start = tmp;
        finish = tmp + old_size;
        end_of_storage = start + n;
    }
}

void push_back(const T& x) {
    if (finish != end_of_storage) {
        construct(finish, x);
        ++finish;
    }
    else
        insert_aux(end(), x);
}


reserve

start = tmp;
finish = tmp + old_size;
end_of_storage = start + n;

这部分其实就是扩容的步骤,start 为起始位置,finish 加上了原先的 old_sizeend_of_storage 加上扩容后的容量 n

push_back

很明显 finish != end_of_storage 意思为空间如果够,则插入元素,并将 ++finsh ,将 size 位置偏移。

综上,得到成员的关系图:

image-20230715162126046

vector 是根据 template <class T, class Alloc = alloc> 类模板实现的,其中 Alloc 其实就是 空间配置器:Alloctor,空间配置器只负责开辟空间,但不关注空间的初始化,所以需要 定位 new 表达式 来对空间进行初始化:

template <class T>
    inline void destroy(T* pointer) {
    pointer->~T();
}

template <class T1, class T2>
    inline void construct(T1* p, const T2& value) {
    new (p) T1(value);
}

stl 选用空间配置器,会让效率更高,但是由于不使用 new, delete 操作符,对空间上的值进行赋值可能会释放随机值导致崩溃,所以空间上值的处理和释放就需要用定位 new 了。

二、成员变量

看了源码,仿着源码开始造轮子。

template<class T>
class vector
{
    private:
    iterator _start; 
    iterator _finish;
    iterator _endofstorage;
    // iterator _start = nullptr; // 可以给缺省值,可以减少初始化列表初始化
    // iterator _finish = nullptr;
    // iterator _endofstorage = nullptr;
};

三、默认成员函数

1、构造

无参构造

vector()
    :_start(nullptr)
        , _finish(nullptr)
        , _endofstorage(nullptr)
    {}

迭代器区间构造

template<class InputIterator>
    vector(InputIterator start, InputIterator last)
    :_start(nullptr)
        ,_finish(nullptr)
        ,_endofstorage(nullptr)
    {
        while (start != last)
        {
            push_back(*start);
            ++start;
        }
    }

初始化列表初始化成员变量,不初始化编译器可能帮助初始化,但是最好不要依赖编译器。

类模板中,可以嵌套使用模板,通过模板可以使用其他类型的迭代器初始化。

n个值构造

// 复用 resize
vector(size_t n, const T& val = T()) // 不初始化会有随机值
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	resize(n, val);
}

// n 个 val 构造
vector(size_t n, const T& val = T())
    :_start(nullptr)
        , _finish(nullptr)
        , _endofstorage(nullptr)
    {
        reserve(n); // n 个 val 初始化
        for (size_t i = 0; i < n; i++)
        {
            push_back(val);
        }
    }

缺省参数 val 若不提供值,则 T() 为各个类型的默认构造:

为了兼容自定义类型初始化需要调用构造函数,模板对内置类型进行了升级,对内置类型增加了默认构造函数。

内置类型的默认构造函数不显示显现,当不给值时:int() ,编译器会隐式处理默认值,如 int 为 0,bool 为 false 等。

通过这种方式,对于任意类型,都能保证对对象的初始化。

当然由于多个构造函数的存在,当使用 n 个值构造函数时,会出现如下形式:vector<int>(10, 1)由于迭代器区间的构造函数的参数为模板,当调用为两个 int 的参数时,就会匹配迭代器区间的构造函数,此刻 InputIterator start, InputIterator last 会被实例化为两个 int 。

这种情况是根据 调用 n 个值构造函数的参数类型决定的 ,若 vector<int>(10u, 1) 就不会出错,因为类型已经对应了,第二个参数只能实例化为 int ;vector<string>(10, "11111") 只能对两个参数实例化为 intstring

根据源码中的办法,可以针对 int 类型写函数重载:

vector(int n, const T& val = T())
    :_start(nullptr)
        , _finish(nullptr)
        , _endofstorage(nullptr)
    {
        reserve(n); // n 个 val 初始化
        for (size_t i = 0; i < n; i++)
        {
            push_back(val);
        }
    }

2、析构

~vector()
{
    if (_start)
    {
        delete[] _start;
        _start = _finish = _endofstorage = nullptr;
    }
}

3、拷贝构造

自己负责空间的开辟和释放

vector(const vector<T>& v)
{
    _start = new T[v.size()]; // size 和 capacity 都可以
    // memcpy(_start, v._start, sizeof(T) * v.size()); // 内置类型可以,自定义类型不可以
    for (size_t i = 0; i < v.size(); i++)
    {
        _start[i] = v._start[i]; // 借助赋值重载进行深拷贝
    }
    _finish = _start + v.size();
    _endofstorage = _start + v.size();
}

memcpy 在vector中存在自定义类型的拷贝时,会造成浅拷贝,例如 vector<vector<int>

image-20230715171849124

vector<vector<int>> copy 的 _start 指向的 vector<int> 类型的数组上的成员的 _start 和原先的对象指向的空间相同,当析构时,对空间析构后,空间上为随机值,再次析构就会报错。

所以,针对vector上自定义类型数据 的拷贝需要利用循环,调用赋值重载来进行深拷贝 ,这样对于自定义类型,就会调用类型本身的赋值重载,以达到深拷贝的目的。

push_back 进行拷贝构造

vector(const vector<T>& v)
    :_start(nullptr)
        ,_finish(nullptr)
        ,_endofstorage(nullptr)
    {
        reserve(v.size()); // 先初始化,再开空间
        for (const auto& e : v) // const auto& & 为了提高效率,加上 const 是因为参数给的是 const vector<T>& v,无法被修改
        {
            push_back(e);
        }
    }

此处使用 & 可以提高效率,也无需担心是否浅拷贝,因为 push_back 接口中,具有帮助拷贝类型完成深拷贝的接口。

借助构造完成拷贝构造

void swap(vector<T>& v)
{
    std::swap(_start, v._start);
    std::swap(_finish, v._finish);
    std::swap(_endofstorage, v._endofstorage);
}

vector(const vector<T>& v)
    :_start(nullptr)
        , _finish(nullptr)
        , _endofstorage(nullptr)
    {
        vector<T> tmp(v.begin(), v.end()); // 迭代器区间构造
        swap(tmp);
    }

4、赋值重载

vector<T>& operator=(vector<T> tmp)
{
    swap(tmp);
    return *this;
}

传参时调用拷贝构造,随后将 *this 和 tmp 交换

四、访问

1、[ ] 重载

T& operator[](size_t pos)
{
    assert(pos < size());

    return _start[pos];
}

const T& operator[](size_t pos) const
{
    assert(pos < size());

    return _start[pos];
}

2、迭代器

vector 的迭代器是原生指针:

typedef T* iterator;
typedef const T* const_iterator;

iterator begin()
{
    return _start;
}

iterator end()
{
    return _finish;
}

const_iterator begin() const
{
    return _start;
}

const_iterator end() const
{
    return _finish;
}

五、容量

1、capacity

size_t capacity() const
{
    return _endofstorage - _start;
}

2、size

size_t size() const
{
    return _finish - _start;
}

3、reserve

void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t sz = size(); // 先拷贝,否则计算 _finish 时,最后结果仍为上一次结果
        T* tmp = new T[n];
        if (_start)
        {
            // memcpy(tmp, _start, sz * sizeof(T)); // 当 vector<vector<int>> 时,深拷贝
            for (size_t i = 0; i < sz; i++)
            {
                tmp[i] = _start[i]; // 借助赋值重载进行深拷贝
            }
            delete[] _start;
        }

        _start = tmp;
        _finish = _start + sz; // 由于 _start 改变,所以 _finish 也需要改变
        _endofstorage = _start + n;
    }
}

reserve 有两个问题:

(1)finish 指向空间错误

当 reserve 后,原先空间被释放,若 _finish = _start + size()size() = _finish - _start ,将其带入计算,此刻 _finish 并没有改变指向。

尤其是第一次扩容,如果按照上面的写法,_finish 在扩容后仍然是 nullptr

image-20230715190302243

所以,需要提前拷贝 size() ,并在扩容后计算 _finish = _start + sz

(2)memcpy 拷贝自定义类型浅拷贝

道理和拷贝构造的原理相同,在扩容后,需要拷贝数据到新的空间,当对于 vector<vector<int> 类型拷贝时,需要使用深拷贝。所以也需要使用循环,利用赋值重载进行深拷贝。

4、resize

三种情况:

  1. n < size,删除数据
  2. n >= size && n <= capacity,填充数据
  3. n > capacity,扩容,填充数据
void resize(size_t n, const T& val = T())
{
    if (n > capacity())
    {
        reserve(n);
    }

    // 如果 n 大于原本的 size()
    if (n > size())
    {
        // _start +n 为最后 _finish 应在位置
        while (_finish < _start + n)
        {
            *_finish = val;
            ++_finish;
        }
    }
    else
    {
        _finish = _start + n; // 否则删除数据
    }
}

六、增删查改

1、insert

iterator insert(iterator pos, const T& x)
{
    assert(pos >= _start && pos <= _finish);

    if (_finish == _endofstorage)
    {
        size_t len = pos - _start; // 记录原先 pos 的长短

        size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newcapacity);

        // 解决pos迭代器失效问题
        pos = _start + len; // 让开始位置加上 len
    }

    iterator end = _finish - 1; // 不用移动 \0
    while (end >= pos)
    {
        *(end + 1) = *end;
        --end;
    }

    *pos = x; // 调用 string 的赋值重载,完成深拷贝
    ++_finish;

    return pos;
}

当容量满后,需要扩容,当扩容后就会引起 内部迭代器失效

由于扩容,pos 指向的位置是释放的空间,所以,当往后修改 pos 位置时,就会访问到已经被析构的空间,造成程序错误。

image-20230715191144636

所以需要记录 pos 的位置:size_t len = pos - start,在扩容后,将 pos = _start + len 。此刻 pos 位置才是正确的。

同理,外部迭代器也会失效,当进行插入元素后,原先的迭代器位置可能失效了(扩容指向新空间),这时对这个迭代器操作可能会出错。

image-20230715192510785

扩容后,it 仍然指向被释放的空间,所以在 insert 后需要用返回值接收:

image-20230715192621979

所以,stl 规定,insert 后要返回 pos 位置的迭代器,并且在外面接收,尽量避免外部迭代器失效。

2、erase

iterator erase(iterator pos)
{
    assert(pos >= _start && pos < _finish); // pos != _finish
    iterator begin = pos + 1;
    while (begin < _finish)
    {
        *(begin - 1) = *begin;
        ++begin;
    }
    --_finish;

    return pos;
}

当前 erase 的实现不会引起内部迭代器失效,但是可能会引起外部迭代器失效,以防万一,所以返回删除的下一个位置,即 pos

针对 vs 和 linux 下迭代器失效做一下总结

在 vs 下,只要迭代器失效,均会报错(强制检查),需要接收返回值;在 linux 下,原理和这里实现差不多,有的会报错,有的数据错误,有的正确。为了保证程序在平台间的可移植性,建议在使用迭代器后,统一接收返回值,避免出现错误。

若在 insert 或 erase 后,不接收返回值,不要访问迭代器,我们认为它失效,访问结果是未定义。

3、push_back

void push_back(const T& x)
{
    //if (_finish == _endofstorage)
    //{
    //	size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
    //	reserve(newcapacity);
    //}

     不是定位 new ,所以可以直接赋值
    //*_finish = x;
    //++_finish;

    insert(end(), x);
}

4、pop_back

void pop_back()
{
    assert(_finish > _start);
    --_finish;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/757783.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Profibus DP主站转Modbus TCP网关profibus从站地址范围

远创智控YC-DPM-TCP网关。这款产品在Profibus总线侧实现了主站功能&#xff0c;在以太网侧实现了ModbusTcp服务器功能&#xff0c;为我们的工业自动化网络带来了全新的可能。 远创智控YC-DPM-TCP网关是如何实现这些功能的呢&#xff1f;首先&#xff0c;让我们来看看它的Profib…

Oracle解析JSON字符串

Oracle解析JSON字符串 假设某个字段存储的JSON字符串&#xff0c;我们不想查出来后通过一些常见的编程语言处理&#xff08;JSON.parse()或者是JSONObject.parseObject()等&#xff09;&#xff0c;想直接在数据库上处理&#xff0c;又该如何书写呢&#xff1f; 其实在ORACLE中…

算法06-搜索算法-广度优先搜索

文章目录 参考&#xff1a;总结大纲要求搜索算法-广度优先搜索迷宫问题问题迷宫的存储迷宫的移动搜索方式代码实现 图的广度优先遍历题目描述用邻接矩阵表示图 搜索算法-广度优先搜索 参考&#xff1a; 【算法设计】用C类和队列实现图搜索的广度优先遍历算法 C/C 之 广度优先…

梯度下降(Gradient Descent)

基本思想 梯度下降是一个用来求函数最小值的算法&#xff0c;本次&#xff0c;我们将使用梯度下降算法来求出代价函数的最小值。 梯度下降背后的思想是&#xff1a;开始时我们随机选择一个参数的组合&#xff0c;计算代价函数&#xff0c;然后我们寻找下一个能让代价函数值下降…

Linux:squid透明代理

在传统代理上进行修改并添加网卡 这次不使用手动代理&#xff0c;而是把网关搞成代理 在下面这个链接里的文章实验下进行修改 Linux&#xff1a;squid传统代理_鲍海超-GNUBHCkalitarro的博客-CSDN博客 完成以后不用再win10上去配置&#xff0c;代理的那一步&#xff0c;然后…

Python(十二)常见的数据类型

❤️ 专栏简介&#xff1a;本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中&#xff0c;我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 &#xff1a;本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…

TabLayout+ViewPager实现滚动页面

目录 一、TabLayout介绍 二、TabLayout的常用属性和方法 常用属性&#xff1a; 常用方法&#xff1a; 三、适配器介绍 &#xff08;一&#xff09;、PagerAdapter介绍&#xff1a; &#xff08;二&#xff09;、FragmentPagerAdapter介绍&#xff1a; &#xff08;三&am…

习题 1.26

我们先来看看题目要求&#xff0c;题目住说将 square 调用换成了&#xff08;* x x),结果导致执行时间变慢。 根据以前学过的内容&#xff0c;我们知道 在做显示乘法的时候&#xff0c;是直接进行计算的&#xff0c;而在做函数调用的时候&#xff0c;是先进行表达式展开的&…

【MySQL】常见函数使用(二)

&#x1f697;MySQL学习第二站~ &#x1f6a9;本文已收录至专栏&#xff1a;数据库学习之旅 ❤️文末附全文思维导图&#xff0c;感谢各位点赞收藏支持~ 就如同许多编程语言中的API一样&#xff0c;MySQL中的函数同样是官方给我们封装好的&#xff0c;可以直接调用的一段代码。…

ZooKeeper ZAB

文章首发地址 在接收到一个写请求操作后&#xff0c;追随者会将请求转发给群首&#xff0c;群首将探索性地执行该请求&#xff0c;并将执行结果以事务的方式对状态更新进行广播。一个事务中包含服务器需要执行变更的确切操作&#xff0c;当事务提交时&#xff0c;服务器就会将这…

dp算法篇Day7

"抱紧你的我&#xff0c;比国王富有~" 31、最长定差子序列 (1) 题目解析 从题目来看还是很容易理解的&#xff0c;就是找寻数组中构成差值相等的子序列。 (2) 算法原理 class Solution { public:int longestSubsequence(vector<int>& arr, int difference…

多模态系列论文--ALBEF 详细解析

ALBEF来自于Align before Fuse&#xff0c;作者团队全自来自于Salesforce Research。 论文地址&#xff1a;Align before Fuse: Vision and Language Representation Learning with Momentum Distillation 论文代码&#xff1a;ALBEF 1 摘要 最近图像文本的大规模的特征学习非…

AI Chat 设计模式:7. 单例模式

本文是该系列的第七篇&#xff0c;采用问答式的方式展开&#xff0c;问题由我提出&#xff0c;答案由 Chat AI 作出&#xff0c;灰色背景的文字则主要是我的旁白和思考。 问题列表 Q.1 简单介绍一下单例模式A.1Q.2 详细说说饿汉式&#xff0c;并使用 c 举例A.2Q.3 好&#xff…

【半监督医学图像分割 2022 IJCAI】UGPCL

文章目录 【半监督医学图像分割 2022 IJCAI】UGPCL摘要1. 介绍2. 相关工作2.1 半监督医学图像分割2.2 对比学习2.3 不确定度估计 3. 方法3.1 解码器间的一致性学习3.2 不确定性引导的对比学习3.3 等变对比损失 4. 实验4.1 实验设置4.2 定量实验4.3 消融实验 5. 结论 【半监督医…

引爆用户流量,打造热门小红书创业项目

引爆用户流量&#xff0c;打造热门小红书创业项目 在当今互联网时代&#xff0c;创业者们不断寻求新的商机和盈利模式。而小红书作为一个以分享购物心得、美妆、旅行等内容为主的社交平台&#xff0c;成为了众多创业者关注的焦点。如何通过小红书引爆用户流量&#xff0c;并打造…

【框架篇】使用注解存储对象

使用注解存储对象 之前我们存储Bean时&#xff0c;需要在spring-config 中添加一行 bean注册内容才行&#xff0c;如下图所示&#xff1a; 问题引入&#xff1a;如果想在Spring 中能够更简单的进行对象的存储和读取&#xff0c;该怎么办呢&#xff1f; 问题解答&#xff1a;实…

Python应用实例(一)外星人入侵(十)

外星人入侵&#xff08;十&#xff09; 1.记分1.1 显示得分1.2 创建记分牌1.3 在外星人被消灭时更新得分1.4 重置得分1.5 将消灭的每个外星人都计入得分1.6 提高分数1.7 舍入得分1.8 最高得分1.9 显示等级1.10 显示余下的飞船数 1.记分 下面来实现一个记分系统&#xff0c;以实…

动态规划01背包之1049 最后一块石头的重量 II(第11道)

题目&#xff1a; 有一堆石头&#xff0c;用整数数组 stones 表示。其中 stones[i] 表示第 i 块石头的重量。 每一回合&#xff0c;从中选出任意两块石头&#xff0c;然后将它们一起粉碎。假设石头的重量分别为 x 和 y&#xff0c;且 。那么粉碎的可能结果如下&#xff1a; …

4029: 网格行走

题目内容 在一个 n n n \times n nn 的网格上行走&#xff0c;从 ( 1 , 1 ) (1, 1) (1,1) 走到 ( n , n ) (n, n) (n,n)。每次只能向下走一步或向右走一步。 每个点 ( i , j ) (i, j) (i,j) 有权值 a i , j a_{i, j} ai,j​&#xff0c;给定一个数 x x x&#xff0c;求…

电机驱动系列(1)--例程下载演示

电机驱动系列&#xff08;1&#xff09; 使用设备连线实操感想 使用设备 硬件&#xff1a;野火骄阳板–STM32F407IGT6&#xff0c;野火无刷电机驱动板&#xff0c;PMSM电机软件&#xff1a;MCSDK&#xff0c;STM32CubeMX&#xff0c;Keil5软件安装注意事项&#xff1a;MCSDK-F…