目录
- 前言
- 1. string的基本结构
- 2. 构造函数、析构函数
- 2.1 构造函数的实现
- 2.1.1带参构造函数
- 2.2析构函数
- 2.3无参构造函数
- 2.4无参和带参构造函数合并
- 3. string的遍历
- 3.1 operator[ ]
- 3.2迭代器模拟实现 (简单实现)
- 3.3 const迭代器模拟实现
- 4. 数据的增删查改
- 4.1 reserve
- 4.2 push_back和append
- 4.3 +=
- 4.4 insert
- 4.5 erase
- 4.6 find
- 4.7 substr
- 5. 拷贝构造
- 5.1 浅拷贝默认拷贝构造
- 5.2 深拷贝拷贝构造函数
- 6. 源码(上部分)
- 6.1 string.h
- 6.2 test.cpp
- 7. 总结
前言
在上一篇文章中,我们详细介绍了string类一些常用接口的使用,那这篇文章,我们将对string进行一个模拟实现,帮助大家理解的更加深刻。
1. string的基本结构
在上篇文章中我们了解:
string的底层其实就是一个支持动态增长的字符数组。那确定它的结构,接下来我们就开始模拟实现它。
首先新建一个头文件string.h
,定义一个string类:
class string
{
public :
//成员函数
private :
char* _str;
size_t _size;
size_t _capacity;
};
这里string类的三个成员变量,一个字符指针
_str
指向开辟的动态数组,_size
标识有效数据个数,_capacity
记录容量的大小(不包含’\0’)。
但是因为标准库里已经有string类,为了避免冲突,我们需要定义一个命名空间,把我们自己实现的string类放到自己的命名空间里面。
namespace w
{
class string
{
public :
//成员函数
private :
char* _str;
size_t _size;
size_t _capacity;
};
}
2. 构造函数、析构函数
2.1 构造函数的实现
2.1.1带参构造函数
首先我们来模拟实现一个带参构造函数:
我们知道标准库里string类的构造函数有很多,这里我们只模拟实现最常用的:
在之前的文章中我们提到尽量使用初始化列表进行初始化,我们可以这样写:
但是这里你会发现程序报错了,因为如果像上图一样初始化,首先涉及到权限放大的问题(之前文章有讲过)char* str
被const
修饰,不能被修改,但是赋给_str
,_str
是char*
类型的,可以修改。其次用常量字符串去初始化也不能被修改。
那怎么办呢? 我们这里不直接传参而是开空间,用strcpy去进行拷贝:
string(const char* str)
:_str(new char[strlen(str)+1])
,_size(strlen(str))
,_capacity(strlen(str))
{
strcpy(_str, str);
}
顺便这里我们提供一个接口用来返回字符串:
const char* c_str()
{
return _str;
}
我们在创建一个
test.cpp
文件用来测试我们写的接口:
2.2析构函数
这里我们直接顺便给出析构函数:
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
2.3无参构造函数
我们有的时候还会遇到这样的场景:
所以这里需要我们去实现一个无参的构造函数。
假设这里的无参构造函数我们这样实现:
那这样真的可行吗?
如果这里_str
传空指针那么在刚刚实现的c_str
函数就会返回空程序,程序会崩溃。并且在标准库里的c_str
接口即使传空也是会有返回值的。
那这里应该怎么办呢? 我们可以这样写:
string()
:_str(new char[1])
,_size(0)
,_capacity(0)
{
_str[0] = '\0';
}
这里我们给
_str
开辟一个空间,然后给这块空间给上'\0'
。这样就不会出现上面的问题了。
2.4无参和带参构造函数合并
我们之前讲过无参和带参的可以用全缺省。
我们来看几种写法:
能这样写吗?答案是肯定不能这样写类型就不匹配,一个是字符一个是字符串。
能这样写吗? 答案是肯定不能。这样写strlen里的str
就是空串了。
其实应该这样写:
这里我们直接给一个空串,常量字符串末尾是默认有"\0"
的
3. string的遍历
3.1 operator[ ]
我们知道在标准库中可以通过下标去访问字符串中的某一个字符,下面我们来实现对
[]
的重载。
首先我们需要实现
size(
)接口:
接下来我们来实现一下
[]
的重载:
这里我们实现了两个版本普通版本对应普通对象,const版本对应const对象,且这两个函数构成函数重载。
下面我们来验证一下:
3.2迭代器模拟实现 (简单实现)
除了
[]
可以遍历访问string对象,我们还可以用迭代器进行访问。
那迭代器我们说了大家可以理解成一个像指针一样的东西,但是不一定是指针。
我们最开始介绍了STL有好几个版本,不同的版本实现可能是不一样的。
那其实vs下string的迭代器呢就不是使用指针实现的,而G++下使用的SGI版本是指针实现的。
那这里我们模拟实现就使用指针来实现:
下面我们来验证一下:
同样的我们还可以使用范围for进行遍历:
范围for的底层就是用的迭代器。
大家可以理解成范围for的语法其实就跟我们之前学过的宏有点类似,它会被替换成迭代器,相当于把*it赋值给ch。范围for的底层就是无脑替换。
3.3 const迭代器模拟实现
这里我们再实现const版本给const对象使用:
4. 数据的增删查改
首先我们来实现一下
push_back()
和append()
.这两个都是插入数据,既然插入数据那我们就必须考虑扩容的问题。
那这里如果扩容的话,我们一次扩多少呢?
对于push_back来说一次扩二倍没问题,但是append一次扩二倍有可能是不行的。
为什么?
如果当前的容量是10,现在追加一个长度为25的字符串,扩容到原来的两倍才
20,也是不够用的。
那这里我们通过string的另一个接口reserve,它可以改变容量为我们指定的大小,帮助我们扩容。
下面我们就先来实现一下reserve。
4.1 reserve
我们先来看一下reserve怎么实现:
这里当参数n的值小于_capacity
,如果不加这个if判断这里就会缩容。但是我们知道,库里的接口是不会缩容的。所以需要加上这个条件判断。
4.2 push_back和append
那接下来有了
reserve
我们继续来实现push_back
和append
。
push_back
这里我们直接选择两倍扩。
这里append
最少扩容到_size + len
.
下面我们来实现一下:
4.3 +=
我们虽然有push_back和append但是我们更喜欢用重载的
+=
。当然+=的底层也是可以用push_back和append实现的。
下面我们来实现一下:
4.4 insert
对于insert我们主要实现库里的这两个版本:
首先我们来实现一下在pos位置插入n个字符:
逻辑其实是比较简单的。首先判断一下,是否需要扩容,然后就插入数据,如果往中间插就需要挪动数据。
这样写有没有问题呢? 我们来测试一下:
好像没什么问题啊。真的没问题吗?
我们来看一种特殊情况:当
pos = 0
时插入数据:
程序这里挂了。那为什么呢?
这里当pos = 0
时,end等于0时还会进入循环,end再- -会变成多少? 是-1吗?
这里end的类型是szie_t,无符号整型,所以end为0后再- -并不是-1,而是整型最大值,发生越界,循环也没正常结束,所以程序崩了。
那怎么解决呢?把end改成int可行吗?
这里也是不可行的。end和pos比较,end变成int,但是pos是size_t类型,这里是会发生整型提升(C语言知识)。那我们应该如何解决呢?
这里解决方法有很多,我们采用其中一种利用我们之前文章中提到的npos解决:
我们再来测试一下:
刚才是插入一个字符,现在我们再来实现插入字符串的。那么逻辑和上面其实是一样的。只不过上面我们只需要挪出n个空间就可以了,那这里我们需要挪动数据腾出
strlen(str)
个空间。
下面我们来测试一下:
4.5 erase
那么接下来我们来实现一下erase,从pos位置删除len个字符:
对于
erase
首先第一种情况就是pos+len
小于字符串的长度,那我们需要把pos位置开始的后len个字符删掉,但是仍然保留后续字符。那这里就是挪动后面的数据,把需要删除的覆盖掉就行。
那其它情况就是len比较大,pos+len直接大于等于字符串的长度,那就把pos后面的全部删掉。或者没有传pos这个参数,缺省值npos,那也要把后面的全删,所以这两种情况可以统一处理。这里只需要把pos位置给成“\0”
就行了。
我们来测试一下:
当然为了和标准库里的一致我们这里也使用引用返回:
4.6 find
下面我们来实现一下
find
。find的实现其实很简单,遍历去找,找到了就返回下标,找不到就返回npos
。
当然find还支持从pos位置开始查找一个字符串:在这里我们复用C语言中的
strstr
去查找。
下面我们来测试一下:
4.7 substr
下面我们再来实现一下
substr
。它的逻辑也是很简单的。
这里稍微需要注意的是我们需要条件判断当截取的字串足够长,我们截取的长度就是
pos
位置一直到字符串的末尾。
5. 拷贝构造
我们现在先来写一段这样的代码:
这里有一个拷贝构造,s2是s1拷贝构造而来的。
5.1 浅拷贝默认拷贝构造
在之前类和对象的文章中,我们知道,拷贝构造函数我们自己不写编译器是会默认生成的,这里我们直接运行上面的代码:
这里程序出错发生了一个经典的浅拷贝的问题。在之前的文章中我们也有讲过若未显式定义,编译器会生成默认的拷贝构造函数。 默认的拷贝构造函数拷贝对象 按内存存储字节序完成拷贝,这种拷贝叫做浅拷贝,或者值拷贝。一旦涉及到资源申请时,则拷贝构造函数是一定要写的,否则就是浅拷贝,就会出现问题。
5.2 深拷贝拷贝构造函数
这里就需要我们自己去实现拷贝构造函数,完成深拷贝:
下面我们来测试一下:
6. 源码(上部分)
6.1 string.h
#include <iostream>
using namespace std;
namespace w
{
class string
{
public :
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
string(const char* str = "")
:_str(new char[strlen(str)+1])
,_size(strlen(str))
,_capacity(strlen(str))
{
strcpy(_str, str);
}
string(const string& s)
{
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
const char* c_str() const
{
return _str;
}
size_t size() const
{
return _size;
}
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
void reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void push_back(char ch)
{
if (_size == _capacity)
{
// 2倍扩容
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
void append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
// 至少扩容到_size + len
reserve(_size+len);
}
strcpy(_str + _size, str);
_size += len;
}
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string& operator+=(const char* str)
{
append(str);
return *this;
}
void insert(size_t pos, size_t n, char ch)
{
assert(pos <= _size);
if (_size +n > _capacity)
{
// 至少扩容到_size + len
reserve(_size + n);
}
// 添加注释最好
size_t end = _size;
while (end >= pos && end != npos)
{
_str[end + n] = _str[end];
--end;
}
for (size_t i = 0; i < n; i++)
{
_str[pos + i] = ch;
}
_size += n;
}
void insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
// 至少扩容到_size + len
reserve(_size + len);
}
// 添加注释最好
size_t end = _size;
while (end >= pos && end != npos)
{
_str[end + len] = _str[end];
--end;
}
for (size_t i = 0; i < len; i++)
{
_str[pos + i] = str[i];
}
_size += len;
}
string& erase(size_t pos, size_t len = npos)
{
assert(pos <= _size);
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
_str[_size] = '\0';
}
else
{
size_t end = pos + len;
while (end <= _size)
{
_str[pos++] = _str[end++];
}
_size -= len;
}
return *this;
}
size_t find(char ch, size_t pos = 0)
{
assert(pos < _size);
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t find(const char* str , size_t pos = 0)
{
assert(pos < _size);
const char* ptr = strstr(_str + pos, str);
if (ptr)
{
return ptr - _str;
}
else
{
return npos;
}
}
string substr(size_t pos = 0, size_t len = npos)
{
assert(pos < _size);
size_t n = len;
if (len == npos || pos + len > _size)
{
n = _size - pos;
}
string tmp;
tmp.reserve(n);
for (size_t i = pos; i < pos + n; i++)
{
tmp += _str[i];
}
return tmp;
}
private :
char* _str;
size_t _size;
size_t _capacity;
public:
const static size_t npos;
};
const size_t string::npos = -1;
}
6.2 test.cpp
#include "Mystring.h"
void test_string1()
{
w ::string s1("hello world");
cout << s1.c_str() << endl;
for (size_t i = 0; i < s1.size(); i++)
{
cout << s1[i] << " ";
}
cout << endl;
w ::string::iterator it = s1.begin();
while (it != s1.end())
{
cout << *it << " ";
++it;
}
cout <<endl;
for (auto ch : s1)
{
cout << ch <<" ";
}
cout <<endl;
}
void test_string2()
{
w::string s1("hello world");
cout << s1.c_str() << endl;
s1.push_back(' ');
s1.push_back('#');
s1.append("hello");
cout << s1.c_str() << endl;
w::string s2("hello world");
cout << s2.c_str() << endl;
s2 += ' ';
s2 += '#';
s2 += "hello code";
cout << s2.c_str() << endl;
}
void test_string3()
{
w::string s1("helloworld");
cout << s1.c_str() << endl;
s1.insert(5, 3, '#');
cout << s1.c_str() << endl;
s1.insert(0, 3, '#');
cout << s1.c_str() << endl;
w::string s2("helloworld");
s2.insert(5, "%%%%%");
cout << s2.c_str() << endl;
}
void test_string4()
{
w::string s1("helloworld");
cout << s1.c_str() << endl;
s1.erase(5, 3);
cout << s1.c_str() << endl;
s1.erase(5, 30);
cout << s1.c_str() << endl;
s1.erase(2);
cout << s1.c_str() << endl;
}
void test_string5()
{
w::string s1("helloworld");
cout << s1.find('w',2) << endl;
}
void test_string6()
{
w::string s1("hello world");
w::string s2(s1);
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
}
int main()
{
test_string6();
return 0;
}
7. 总结
文章篇幅有限,剩余内容将在下篇进行讲解。