引言:
北京时间:2023/2/19/8:48,昨天更新了有关进程状态的博客,然后在休息的时候,打开了腾讯视屏,然后看到了了一个电视剧,导致上头,从晚上6点看到了10点,把我宝贵的博客时间给搞没了,伤心,现在就让我们开始将功补过,把昨天就应该开始写的博客给补一补!加油,不怂,就是干!今天博客的内容非常简单,就是使用我们以前学过的知识,无论是类和对象、内存管理,还是string类中的函数使用,运用它们写一个较为完整的string类出来,也就是自己实现string类,写库里面的东西,想想还是挺激动的,就让我们带着这份激动,go go go!
string类的模拟实现
string类基本框架
首先开始学习之前,明白string类的底层就是一个字符数组而已,本质上我们在实现string类的过程中,也就是在补全之前学习中的一些不足,和一些重难点,当然最关键的可以复习之前的各种知识点,并且在复习的过程中更好的理解这些知识点的使用,把一小块一小块的知识给合并成一大块的知识,所以模拟实现string类是非常重要的。
步入正题,实现string类基本框架,如下代码:从代码入手,再做细节方面处理
以上就是一个string类的基本框架,大部分函数功能还没有实现,只是实现了基本的构造函数和析构函数以及一些细节方面的处理。
string类框架之后的地基
搞定了上述有关string类中的构造函数和析构函数,当然最重要的是类和对象的使用,我们可以说是有了一个string类的基本框架,也可以说是我们拥有了一个基本的类框架,所以现在就让我们走进string类,复习并使用更多的知识来实现这个STL中的经典字符类。
拷贝构造
在搞定了构造函数和析构函数,之后实现一个类最重要的莫过于是拷贝构造函数了,虽然拷贝构造函数和构造函数、析构函数一样,都是一个默认成员函数,但是懂的都懂,默认成员函数并不是万能的,准确的来说是编译器并不是万能的,这些默认成员函数大部分都只是对内置类型起作用,而我们自己实现的自定义类型就像是后娘养的,人家是爱答不理,并不能很好的把自定义类型进行相应的初始化,所以对这些后娘养的自定义类型,则需要我们自己来实现初始化,当然经典的初始化场景有在初始化列表初始化、给缺省值(但本质还是在初始化列表初始化)、调用拷贝构造函数初始化等,所以调用拷贝构造函数初始化是自定义类型初始化的一个好地方,我们现在就来复习巩固一下拷贝构造函数。(当然重点就是想要讲深浅拷贝问题)
如下图:
当然上述的前提是通过成员变量中有一个char* _str
的指针,涉及指针就涉及指针指向的空间,就涉及深拷贝问题,涉及深拷贝就涉及析构问题,这些看似无关,却紧密相连,这就是自我实现string类的好处,搞清各个知识点之间的关系和熟练掌握运用,所以以后写拷贝构造函数第一点就是考虑深浅拷贝问题。
const成员函数使用场景和运算符重载
从上图中我们可以发现,我们许多函数在实现的时候,都可以去调用那些已经自己实现好了的函数,或者库函数来实现一些新的功能,并且可以发现,只要使用const来修饰成员函数,只要我们对该函数不做改变数据的操作,这种方法是很好的,可以有效的避免权利放大问题,解决不必要的麻烦,可以让我们使用const对象调用函数的时候,变得更加的放心,程序变得更加的稳定。 并且注意: 我们在进行运算符重载时,进行字符串的比较,使用的是strcmp
函数,表明,此时我们比较的是该字符串的ASCII码值,而不是该字符串的大小和容量。
string类中迭代器的实现
从上图可以看出,范围for的本质就是迭代器,从迭代器可以实现语法糖来分析,足以看出迭代器身为STL六大天王之一不是浪得虚名的。并且此时注意: const修饰的迭代器,该迭代器对象是可以被改变的,只是该对象中指向的内容不可以被修改而已
扩容函数和字符、字符串插入函数
总了来说,字符和字符串插入删除函数大致上都是差不多的,细节方面处理到位就行,跟数据结构中的顺序表本质上是一样的,这里就不过多介绍。并且此时我们把字符插入这些函数实现之后,string类中的函数,也就完成了地基部分,此时我们完成了地基就可以开始盖房子了,由于时间关系,我们把盖房子部分留到下一篇博客。
具体代码如下: 包括测试部分(注释很全)
#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
#include<string>
#include<assert.h>
using namespace std;
namespace wwx
{
class String
{
public:
typedef char* iterator;//普通类型迭代器
typedef const char* const_iterator;//const类型迭代器(注意此时自己是可以修改的,只是解引用后的值是不可以修改的)
iterator begin()
{
return _str;//此时因为String本质上就是一个字符数组,所以_str就是首元素地址,就是第一个字符
}
iterator end()
{
return _str + _size;//这个就是最后一个字符(前提是要知道第一个字符的位置)
}
const_iterator begin()const
{
return _str;
}
const_iterator end()const
{
return _str + _size;
}
String(const char* str = " ")//或者写成"\0",反正这个位置只要可以让strlen算出一个0来就行了(全缺省构造函数)
: _size(strlen(str))
{
_capacity = _size == 0 ? 3 : _size;//_capacity为0第一种解决方法
_str = new char[_capacity + 1];
strcpy(_str, str);
}
String(const String& s)//注意:拷贝构造也是有初始化列表的(并且要回想起以前有关this指针的知识,此时*this就是s3,str就是s2)
:_size(s._size)
,_capacity(s._capacity)
{
//深拷贝(因为使用了指针,或者说因为有自己实现析构函数)
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
}//并且此时要记住,此时的拷贝构造除了利用*this指针以外,还有一个是使用赋值运算符(=)
String& operator=(const String& s)//区分赋值和拷贝构造,赋值是两个已经存在的对象,而拷贝构造是一个已经初始化的对象去初始化另一个要创建的对象
{
if (this != &s)//防止自己给自己赋值
{
//_size = s._size;
//_capacity = s._capacity;
//delete[]_str;//这种赋值方法,可以很好的避免被赋值空间太大或太小的问题,只是伴随着开空间的消耗而已
//_str = new char[s._capacity + 1];
//strcpy(_str, s._str);
//为了防止空间开辟失败把原来的空间中的数据给破坏,下面的写法就更好
char* tmp = new char[s._capacity + 1];//解决原理:先开空间,再销毁,再给给
strcpy(tmp, s._str);
delete[]_str;
_str = tmp;//此时因为指针指向的空间,本质是内置类型,所以会自己去调用拷贝构造函数,不需要调用我们自己实现的拷贝构造函数
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
~String()
{
delete[]_str;
_str = nullptr;
_size = _capacity = 0;
}
const char* c_str()
{
return _str;
}
char& operator[](size_t pos)//普通类型使用,下面的是给特殊的const类型函数使用
{
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos)const//后面位置上给了const前面就一定也要给一个const,因为此时加了const导致返回值的类型也变成了const类型
{
assert(pos < _size);
return _str[pos];
}
size_t size()const
{
return _size;
}//运算符重载
// 所以得出结论,只要是函数内部不进行数据修改的,我们就把const给加上
bool operator>(const String& s)const
{
return strcmp(_str, s._str) > 0;
}
bool operator==(const String& s)const
{
return strcmp(_str, s._str) == 0;
}
bool operator>=(const String& s)const
{
return *this > s || *this == s;
//return *this > s || s == *this;//此时就是简单的把赋值顺序调换一下,该代码就是有问题的,因为此时的s是const类型的,妥妥的权利放大
}
bool operator<(const String& s)const
{
return !(*this >= s);
}
bool operator<=(const String& s)const
{
return !(*this > s);
}
bool operator!=(const String& s)const
{
return !(*this == s);
}
void resize(size_t n, char ch = '\0')
{
int len = strlen(_str);
if (_capacity < n)
{
reserve(2 * n);
}
if (n < _size)
{
_size = n;
_str[_size] = '\0';
return;
}
_size = n;
for (int i = len; i < _size; i++)
{
_str[i] = ch;
}
_str[_size] = '\0';
}
void reserve(size_t n)//此时的这个n参数表示的就是n需要扩n个空间
{
char* tmp = new char[n + 1];//此时为了像上述一样,防止开辟失败,所以先开辟,再赋值(注意:capacity和字符个数的区别,capacity少1)
strcpy(tmp, _str);//此时就是注意:只要是在类里面的函数都是自带一个this指针的类对象
delete[]_str;
_str = tmp;
_capacity = n;//开空间跟_size是没有关系的,只有插入数据的时候才跟_size有关系
}
void push_back(char ch)//注意:有一个this指针,此时就是为了在这个this指针后面插入字符
{
if (_size == _capacity)//这种判断==的是需要多少扩多少(所以可以二倍二倍的扩)
{
//注意此时要配套使用,不可以使用realloc扩容
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;//string的本质就是一个字符数组
++_size;
_str[_size] = '\0';//此时就是因为插入字符之后,把原来的\0给搞没了,所以要重新给一个\0,不然就会导致无法计算strlen之类的问题
}
void append(const char* str)//注意此时这个函数是用来插入字符串的,不是上述用来插入字符的
{
size_t len = strlen(str);
if (_size + len > _capacity)//此时这个位置表示的就是插入len个字符(插入len个字符,刚好等于capacity可以,但是不可以超过)
{
//此时这种直接插入多个,就不可以2倍2倍的扩,需要一次性扩大一点
reserve(_size + len);
}
strcpy(_str + _size, str);//该拷贝,是因为可以直接把原来字符串中的\0给覆盖掉
//strcat(_str, str);//但是最好不要使用strcat,追加,目的是因为防止原字符串过长,\0不好找,因为strcat只有找到了\0才会进行追加
_size += len;
//字符串是不需要处理\0的,因为strcpy会拷贝\0
}
String& operator+=(char ch)
{
push_back(ch);
return *this;
}
String& operator+=(const char* str)
{
append(str);
return *this;
}//某个位置插入、某个位置删除
void insert(size_t pos, char ch)//某个位置插入字符
{
assert(pos <= _size);//防止传参的时候越界
if (_size + 1 > _capacity)//还是因为等于的时候是刚刚好满了,所以不怕,只有大于的时候才需要扩
{
reserve(2 * _capacity);
}
size_t end = _size;
while (end >= pos)
{
_str[end + 1] = _str[end];
--end;
}
_str[pos] = ch;
++_size;
}
void insert(size_t pos, const char* str)//某个位置插入字符串
{
assert(pos <= _size);
size_t len = strlen(str);
if (len == 0)
{
return;
}
if (_size + len > _capacity)
{
reserve(_capacity + len);
}//扩容完之后就是插入数据
size_t end = _size + len;
for (int i = end; i >= pos + len; --i)
{
_str[i] = _str[i - len - 1];
}
char c = _str[pos + len];
strcpy(_str + pos, str);
_str[pos + _size] = c;
_size += len;
_str[_size] = '\0';
}
void erase(size_t pos, size_t len = npos)
{
assert(pos>=0 && pos <= _size);
size_t end = _size;
while (end > pos)
{
_str[end - 1] = _str[end];
--end;
}
--_size;
}
private:
char* _str;
size_t _size;
size_t _capacity;
static size_t npos;//npos此时给一个静态成员变量,供给大家使用
//有一个特例,可以不需要在全局定义static,但是只针对于整形,就是加一个const
//static const size_t npos = -1;
//static const size_t N = 10;
//估计是为了可以这样使用:int _arr[N];
};
size_t String::npos = -1;
void Print(const String& s)
{
for (size_t i = 0; i < s.size(); ++i)
{
cout << s[i] << " ";//此时因为这个函数就是一个const修饰的函数,所以无论在函数内存调用运算符重载,还是别的函数,此时这些函数都需要有const属性,所以导致我们需要实现两个[]运算符重载,一个给普通类型使用,一个给const类型使用
}
cout << endl;
for (auto ch : s)//证明const属性的迭代器(所以需要把迭代器也给弄成两份,一份普通类型,一份const类型)
{
cout << ch << " ";
}
cout << endl;
}
void test_string1()
{
String s1;
String s2("hello world");
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
for (int i = 0; i < 10; i++)
{
s2[i]++;
}
String s3(s2);//拷贝构造(经典的指针指向同一块空间问题),涉及深拷贝
cout << s3.c_str() << endl;
cout << s2.c_str() << endl;
s3 = s2;//赋值要注意有自己给自己赋值的时候 s2 = s2;
cout << s3.c_str() << endl;
cout << s2.c_str() << endl;
}
void test_string2()//验证const修饰的函数需要使用具有const属性的函数
{
wwx::String s1("hello world");
for (size_t i = 0; i < s1.size(); ++i)//注意:此时访问的不是string类中的成员变量,访问的是计算size大小的公有函数
{
cout << ++s1[i] << " ";
}
cout << endl;
Print(s1);
}
void test_string3()//验证正向迭代器(反向迭代器先不学)
{
String s1("gdkkn vnqkc");
String::iterator it = s1.begin();//普通it类型
String::const_iterator it2 = s1.begin();//const类型的it
while (it != s1.end())
{
cout << ++(*it) << " ";//指针不仅可以读,而且可以写
++it;//虽然被const修饰,但是自己是可以修改的,例:++it是可以的++(*it)就是不可以的(总:自己可以修改,只是指向的内容不可以修改而已)
++it2;
//cout << ++(*it2) << " ";//const迭代器指向的内容不允许被修改
}
cout << endl;
for (auto ch : s1)//很好的证明了,范围for就是使用迭代器实现的(傻白甜)
{
cout << ch << " ";
}
cout << endl;
}
void test_string4()//验证运算符重载
{
string s1("hello world");
string s2("hello world");
string s3("xxxxxxxxxxx");
//比大小,此时比的是ASCII码值
cout << (s1 < s3) << endl;//涉及运算符的优先级,所以要加上()
cout << (s1 == s3) << endl;
cout << (s1 == s2) << endl;
cout << (s1 >= s3) << endl;
cout << (s1 > s3) << endl;
cout << (s1 != s2) << endl;
}
void test_string5()//验证字符和字符串追加
{
string s1("hello world");
s1.push_back(' ');//反正就是注意使用this指针就行(因为this指针代表的就是s1对象)
cout << s1.c_str() << endl;
s1.append("xxxxxxxxxxxxxxxx");
cout << s1.c_str() << endl;
s1 += "aaaaaaaaaaaaaaaaaa";
cout << s1.c_str() << endl;
}
void test_string6()
{
String s1("hello world");
s1.insert(6, 'm');
s1.insert(7, 'y');
s1.insert(8, ' ');//搞定了中间插入,此时要防止是在最头上插入等问题
cout << s1.c_str() << endl;
s1.insert(5, "bit");
cout << s1.c_str() << endl;
s1.erase(5, 3);
cout << s1.c_str() << endl;
}
}
以上就是string类地基部分代码,注释很全,注意:测试代码需要放到test.cpp文件中测试