C++笔记---vector

1. vector的介绍

vector其实就是我们所熟知的顺序表，但其是作为STL中的一个类模板而存在。

也就是说，vector是可以用来存储任意类型数据的顺序表，既可以是内置类型，也可以是自定义类型，或是STL中的其他容器。

vector的使用方式与string基本相似，但其接口相对于string来说要简洁地多，也与之后会介绍地各种STL的类模板跟为接近。

具体以vector - C++ Reference为准，本文为该文档的一个简单总结与标注。

2. vector的重要接口

以下表格中的函数都不是官方库中的函数原型，而是为了方便学习和理解而进行了简化的。

2.1 默认成员函数

2.1.1 构造函数

四种构造方式
(1) vector();	默认构造函数
(2) vector(size_t n, cosnt T& val = T());	构造并用val初始化前n个数据
(3) template <class InputIterator> vector(InputIterator first, InputIterator last);	用迭代器区间进行初始化
(4) vector(const vector& x);	拷贝构造

2.1.2 析构函数

释放掉容器内的资源。

2.1.3 赋值重载

分配新的数据到容器中，替代他本来的数据，并根据新数据修改其size和capacity（深拷贝）。

2.2 迭代器相关

begin	返回开始位置的迭代器
end	返回最后一个数据的下一个位置的迭代器
rbegin	用于逆向迭代
rend	用于逆向迭代
cbegin	用于const修饰的容器的迭代
cend	用于const修饰的容器的迭代
crbegin	用于const修饰的容器的逆向迭代
crend	用于const修饰的容器的逆向迭代

2.3 大小容量相关

size_t size() const;	返回数据个数
size_t max_size() const;	返回容量大小
void resize(size_t n, T val = T());	修改数据个数，若n<size则删除数据，若n>size则用val初始化多出来的数据
size_t capacity() const;	返回容量大小
bool empty() const;	判断容器是否为空
void reserve(size_t n);	确保capacity>=n，若capacity<n则扩容，若capacity>=n则无任何影响
void shrink_to_fit();	是capacity减小到size，以减少空间浪费

2.4 访问相关

(1) vector<T>& operator[](size_t n); (2) const vector<T>& operator[](size_t n) const;	使vector中的元素可像数组一样被访问
(1) vector<T>& at(size_t n); (2) const vector<T>& at(size_t n) const;	返回vector中下标为n的元素的引用
(1) vector<T>& front(); (2) const vector<T>& front() const;	返回vector中第一个元素的引用
(1) vector<T>& back(); (2) const vector<T>& back() const;	返回vector中最后一个元素的引用
(1) T* data(); (2) const T*data() const;	返回存储vector中元素的数组的地址

2.5 元素修改相关

(1) template<class InputIterator> void assign(InputIterator first, InputIterator last); (2) void assign(size_t n, const T& val);	给vector赋新的值，效果类似于重新构造这个vector
void push_back(const T& val);	在vector尾部插入一个元素
void pop_back();	删除vector尾部的一个元素
(1) iterator insert(iterator pos, const T& val); (2) void insert(iterator pos, size_t n, const T& val); (3) template <class InputIterator> void insert(iterator position, InputIterator first，InputIterator last);	在指定位置插入元素，效率低，非特殊情况不推荐使用
(1) iterator erase(iterator pos); (1) iterator erase(iterator first, iterator last);	删除指定位置的数据，效率低，非特殊情况不推荐使用
void swap(vector<T>& x);	交换两个vector的数据
void clear();	清空vector，使size变为0

3. vector不完全模拟实现示例

STL标准库中，vector包括三个成员变量：

_start	起始位置的迭代器
_finish	最后一个元素的下一个位置的迭代器
_end_of_storage	最大容量的下一个位置的迭代器

#pragma once
#include<iostream>
#include<assert.h>

namespace lbz
{
    template<class T>
    class vector
    {
    public:
        // Vector的迭代器是一个原生指针
        typedef T* iterator;

        typedef const T* const_iterator;

        iterator begin()
        {
            return _start;
        }

        iterator end()
        {
            return _finish;
        }

        const_iterator cbegin() const
        {
            return _start;
        }

        const_iterator cend() const
        {
            return _finish;
        }



        // construct and destroy
        // 可以不写初始化列表
        vector()
            :_start(nullptr)
            ,_finish(nullptr)
            ,_end_of_storage(nullptr)
        {}

        // C++11强制生成默认构造
        // vector() = default;

        vector(int n, const T& value = T())
        {
            reserve(n);
            while (n--)
            {
                push_back(value);
            }
        }

        vector(size_t n, const T& value = T())
        {
            reserve(n);
            while (n--)
            {
                push_back(value);
            }
        }

        template<class InputIterator>
        vector(InputIterator first, InputIterator last)
        {
            while (first != last)
            {
                push_back(*first);
                first++;
            }
        }

        /*vector(const vector<T>& v)
        {
            vector<T> tmp(v.cbegin(), v.cend());
            swap(tmp);
        }*/

        vector(const vector<T>& v)
        {
            reserve(v.size());
            auto it = v.cbegin();
            while (it != v.cend())
            {
                push_back(*it);
                it++;
            }
        }

        vector<T>& operator= (vector<T> v)
        {
            swap(v);
            return *this;
        }

        ~vector()
        {
            if(_start)
                delete[] _start;

            _start = nullptr;
            _finish = nullptr;
            _end_of_storage = nullptr;
        }

         // capacity

        size_t size() const
        {
            return (_finish - _start);
        }

        size_t capacity() const
        {
            return (_end_of_storage - _start);
        }

        /*void reserve(size_t n)
        {
            size_t old_size = size();
            size_t old_capacity = capacity();
            if (n > old_capacity)
            {
                while (n > old_capacity)
                {
                    old_capacity = old_capacity == 0 ? 4 : old_capacity * 2;
                }
                T* tmp = new T[old_capacity];

                //元素有动态资源时，memcpy存在问题
                memcpy(tmp, _start, sizeof(T) * old_size);
                delete[] _start;
                _start = tmp;
                _finish = _start + old_size;
                _end_of_storage = _start + old_capacity;
            }
        }*/

        void reserve(size_t n)
        {
            size_t old_size = size();
            size_t old_capacity = capacity();
            if (n > old_capacity)
            {
                while (n > old_capacity)
                {
                    old_capacity = old_capacity == 0 ? 4 : old_capacity * 2;
                }
                T* tmp = new T[old_capacity];
                for (size_t i = 0; i < old_size; i++)
                {
                    tmp[i] = _start[i];
                }
                delete[] _start;
                _start = tmp;
                _finish = _start + old_size;
                _end_of_storage = _start + old_capacity;
            }
        }

        void resize(size_t n, const T& value = T())
        {
            if (n < size())
            {
                _finish = _start + n;
            }
            else
            {
                reserve(n);
                while (size() < n)
                {
                    push_back(value);
                }
            }
        }



        ///access///
        T& operator[](size_t pos)
        {
            assert(pos < size());
            return _start[pos];
        }

        const T& operator[](size_t pos)const
        {
            assert(pos < size());
            return _start[pos];
        }



        ///modify/

        void push_back(const T& x)
        {
            reserve(size() + 1);
            *_finish = x;
            _finish++;
        }

        void pop_back()
        {
            _finish--;
        }

        void swap(vector<T>& v)
        {
            std::swap(_start, v._start);
            std::swap(_finish, v._finish);
            std::swap(_end_of_storage, v._end_of_storage);
        }

        iterator insert(iterator pos, const T& x)
        {
            assert(pos >= begin() && pos < end());
            size_t old_pos = pos - _start;
            reserve(size() + 1);
            pos = _start + old_pos;
            //typename vector<int>::iterator end = end();
            auto end = this->end();
            while (end != pos)
            {
                *end = *(end - 1);
                end--;
            }
            *end = x;

            _finish++;

            return pos;
        }

        iterator erase(iterator pos)
        {
            assert(pos >= begin() && pos < end());
            iterator it = pos;
            while (it != end() - 1)
            {
                *it = *(it + 1);
                it++;
            }
            _finish--;
            return pos;
        }

    private:
        iterator _start = nullptr; // 指向数据块的开始

        iterator _finish = nullptr; // 指向有效数据的尾

        iterator _end_of_storage = nullptr; // 指向存储容量的尾
    };
}

4. 迭代器失效问题

顾名思义，就是迭代器失去访问容器中元素的能力。

导致迭代器失效发生的有两种情况：（1）底层空间改变，（2）指定位置元素删除(erase)

4.1 底层空间改变导致迭代器失效

会引起其底层空间改变的操作（扩容或者赋值），都有可能是迭代器失效，比如：resize、reserve、insert、assign、push_back等。

#include <iostream>
using namespace std;
#include <vector>
int main()
{
    vector<int> v{1,2,3,4,5,6};
    auto it = v.begin();

    // 将有效元素个数增加到100个，多出的位置使用8填充，操作期间底层会扩容
    // v.resize(100, 8);

    // reserve的作用就是改变扩容大小但不改变有效元素个数，操作期间可能会引起底层容量改变
    // v.reserve(100);

    // 插入元素期间，可能会引起扩容，而导致原空间被释放
    // v.insert(v.begin(), 0);
    // v.push_back(8);

    // 给vector重新赋值，可能会引起底层容量改变
    v.assign(100, 8);

    while(it != v.end())
    {
        cout<< *it << " " ;
        ++it;
    } 
    cout<<endl;
    return 0;
}

出错原因：

以上操作，都有可能会导致vector发生扩容，而vector只要发生扩容都是异地扩，并且vector的迭代器实质上是指针。

这意味着，一旦发生扩容，原本的空间就会被释放掉，_start，_finish，_end_of_storage会分别指向新空间。但此时，it仍旧指向旧空间，变成了一个野指针。

在对it迭代器操作时，实际操作的是一块已经被释放的空间，而引起代码运行时崩溃。

解决方式：在以上操作完成之后，如果想要继续通过迭代器操作vector中的元素，就需要给it重新赋值。

其中，insert函数会返回指向插入元素的迭代器（插入单个元素时）。

4.2 指定位置元素删除(erase)导致迭代器失效

#include <iostream>
using namespace std;
#include <vector>
int main()
{
    int a[] = { 1, 2, 3, 4 };
    vector<int> v(a, a + sizeof(a) / sizeof(int));

    // 使用find查找3所在位置的iterator
    vector<int>::iterator pos = find(v.begin(), v.end(), 3);

    // 删除pos位置的数据，导致pos迭代器失效。
    v.erase(pos);

    cout << *pos << endl; // 此处会导致非法访问
    return 0;
}

这里有人会说：删掉3之后pos不是指向4吗？

你说的对，但是假如被删除的是最后一个元素呢？假如此处不是vector（顺序表）而是list（链表）呢？假如迭代器的底层根本就不是指针呢？

如果是以上三种情况，被删除元素的迭代器还会被下一个元素继承吗？显然不会，那么此时对pos解引用就会导致非法访问。

由于STL的实现是希望用户能够忽略掉底层实现，那么关于这个问题最好是要做到所有容器统一，认为对pos的访问是非法访问。

解决方法：和insert类似，erase函数在删除数据之后，会返回被删除数据的下一个位置的迭代器，让pos重新接收一下即可。

4.3 其他

windows下，vs编译器对迭代器的检测十分严格，一旦发生对失效的迭代器解引用的操作就一定会报错。

Linux下，g++编译器对迭代器失效的检测并不是非常严格，处理也没有vs下极端。

前面讲到的string和vector存在相同的迭代器失效的问题，注意警惕。

5. 使用memcpy拷贝的问题

前面在string的实现中，我们在进行异地扩容时使用了memcpy将原本的数据拷贝到新空间中。

但是在这里，我们则采用了手动赋值的方式，这是为什么呢？

void reserve(size_t n)
{
    size_t old_size = size();
    size_t old_capacity = capacity();
    if (n > old_capacity)
    {
        while (n > old_capacity)
        {
            old_capacity = old_capacity == 0 ? 4 : old_capacity * 2;
        }
        T* tmp = new T[old_capacity];

        //元素有动态资源时，memcpy存在问题
        memcpy(tmp, _start, sizeof(T) * old_size);
        delete[] _start;
        _start = tmp;
        _finish = _start + old_size;
        _end_of_storage = _start + old_capacity;
    }
}

void reserve(size_t n)
{
    size_t old_size = size();
    size_t old_capacity = capacity();
    if (n > old_capacity)
    {
        while (n > old_capacity)
        {
            old_capacity = old_capacity == 0 ? 4 : old_capacity * 2;
        }
        T* tmp = new T[old_capacity];
        for (size_t i = 0; i < old_size; i++)
        {
            tmp[i] = _start[i];
        }
        delete[] _start;
        _start = tmp;
        _finish = _start + old_size;
        _end_of_storage = _start + old_capacity;
    }
}

我们设想下面这样的情况：

int main()
{
    lbz::vector<lbz::string> v;
    v.push_back("1111");
    v.push_back("2222");
    v.push_back("3333");
    
    reserve(5);

    return 0;
}

在三次push_back完成之后，v中存储了三个string类型的对象，他们的_str分别指向str1 = "1111"，str2 = "2222"，str3 = "3333"。

接着，我们对vector进行了扩容，如果我们采用memcpy进行拷贝，那么只能完成对三个string对象的浅拷贝，也就是tmp中的三个string对象的_str依然指向str1，str2和str3。

当我们delete[] _start时，三个string类型的对象调用对应的析构函数分别释放掉str1，str2和str3。

此时，tmp中三个string对象的_str就都成了野指针，如果对其访问，就会造成程序的崩溃。

结论：