我们在上一篇文章中详细地讲解了string类的各个常用功能成员函数的讲解,本文我们将对上文进行一个小收尾,然后开始实现string类的底层。
一、上一篇的收尾
1.find函数:顾名思义,它的功能是在字符串中找到目标字符并返回它的位置,一般来说如果只传我们要找的字符作为参数,它默认从头开始找,但我们也可以传第二个参数,就可以让其在指定位置之后找字符并返回位置了。与其相似的函数是rfind,它的功能是在字符串中倒着找该字符。
2.substr函数:在字符串中获取子字符串,其返回类型是string,需要传两个参数,即开始获取的位置和结束获取的位置。如果只传一个参数,那么他就会从开始位置一直获取直到字符串结尾。
3.operator+:把两个字符串相加的函数,在string类中,并没有把+的运算符重载写成成员函数,而是写成全局函数。其实是有意为之,我们来看下面这个场景。
截至10行代码之前,我们发现如果把+的函数写成成员函数也没什么问题,但其写成成员函数的作用就体现在第11行,因为如果我们写成成员函数必须要传this指针,而11行的是const char*类型。
4.字符串比较大小函数
在string类中已经对各种比较操作符进行了重载,我们直接使用即可,其本质是进行ASCII码的比较。
5.getline函数
在讲这个函数之前我们用一道题引入:
获取最后一个单词长度,那首先我们应该先获取最后一个单词是什么,也就是说只要获取最后一个单词前的 “ ”(空格符号)然后向后查找就好了。用rfind函数,思路就很简单了
但运行后我们发现不对
为什么呢?
其实,cin和c中的scanf都有一个特点,遇到空格或换行就结束。也就是说在测试用例中我们一旦输入ABSIB以后再输入空格就不会提取后面的T了。此时只提取一个长度为5的单词。那如何解决这个问题呢?getline函数帮你解决,他的特点就是遇到换行才截止。当然也可以传参自己提供你需要的分割符,getline函数的用法是,第一个参数传的是流提取的内容,第二个参数是你要把你输入的内容放在具体的类中(默认不传第三个参数,那就是把换行作为分割符了)对于上题,我们只需要把第7行换成 getline(cin,str);即可,这个办法就是想获取一行带空格的字符串的办法。
但是有时候我们想一次性输入多个数值,并想把每次的都打出来怎么办呢?下面的代码即可
他虽然遇到空格或换行会结束,但为什么读到空格不会结束,而读入换行会立即结束并打印呢?其实缓冲区读入数据的刷新标志是换行符,但空格是默认的分割符,他就会自动判断每次输入的数据并打印下来,接下来又遇到一个问题,这个程序怎么才能结束?他一直在等待输入并打印。有两种方法,1.ctrl c 2.ctrl z+换行。
6.整型和字符串之间的相互转换——to_string函数
不仅整型可转,char也可以。
接下来,我们就要底层实现string了
二、string类的底层实现
首先我们实现它的构造和析构函数,为了看起来更简洁,我们还是声明和定义分开写
这里又用到了我们之前讲的初始化列表的语法和new delete的用法,需要的朋友们自行前往复习哦。但我们发现这个构造函数在运行时效率有点低,3个strlen函数算同一个东西要算三遍,效率看起来不高,所以我们需要改善一下
但有时候我们进行初始化的时候会不传参,所以在这里可以写一个缺省值避免这种错误的发生。
接下来我们实现一下流提取功能的函数
在我们需要打印字符串的时候,只需要调用这个类中的函数即可。
下一个,字符串长度的函数 size和运算符重载[]
有了这两个函数以后,我们就可以实现字符串的遍历了,但是如果我们用范围for遍历也可行吗?结果是不可以的,范围for的底层涉及到了迭代器,所以我们需要再写函数来实现
现在有一个问题,在使用[]重载函数时,我无法对字符串的内容进行修改,因为是const char*类型,所以我们的[]重载还应该写一个const的版本
遍历部分的相关函数我们就实现的差不多了,接下来我们看看push_back 和append函数
这里首先要解决的就是扩容问题,我们不能再像以前那样满了就扩2倍,这对插入单个字符没什么,但是插入字符串就有很大的问题,如果我新插入的字符串比扩容后的还大就会产生问题,所以我们需要改变扩容的方式,对此我们用一个reserve函数解决。
下一个,运算符+=重载,由于涉及到单个字符和字符串,我们写两个函数进行函数重载,函数的思路也很简单,运用刚才的push_back和append即可。
下一个,insert和erase函数
我们先看插入单个字符版本的insert,首先判断是否需要扩容,然后我们发现end记录的是\0后一个的位置而不是\0,这是为了防止进行头插的时候发生越界(这里也可以讲pos进行int强转,这样end就记录的是_size了)接下来就是将pos之后的字符进行逐一后移,当循环完成的时候,此时直接把插入的字符放进pos位置即可,别忘了也要++_size。
接下来看插入字符串版本,首先解释一下while循环的条件为什么不是pos+len,如果循环条件是pos+len,那么当循环结束时,end就会停在pos+len,但此时pos位置的字符并没有后移,为了将所有的字符都向后移动,我们需要再向前一位。pos的意义是在字符串下标为pos的位置开始向后插入字符串。
接下来,find函数
找单个字符很简单,只要遍历并返回下标即可,传参pos是让在pos位置后的子字符串中查找目标字符,字符串查找也一样,在字符串查找函数中,我们用到了c中的strstr函数,他的返回值是相同字符串的开头的位置的指针,但是我们的find函数返回值是其下标,这里就用到了指针的减法运算的意义,只需要让这个指针减去字符串的首地址就得到了其中相差的字符数,也就得到了下标。
拷贝函数,注意这里的拷贝是深拷贝,那就用深拷贝的构造办法,先开空间再拷贝
赋值运算符重载函数
这里有个坑,无论是长的赋值到短的还是短的赋值到长的(长短指字符串的长度)都会出现越界等相关问题,所以我们的函数的思路是,先把我们要赋值的串开个空间拷贝一份,然后把需要拷贝的变量的空间先释放掉然后再指向刚才拷贝的空间。需要注意的是拷贝时需要给\0留一个空间哦。
当然这里的if条件就是判断是否自己给自己赋值,如果是这样的话,无疑多开辟了空间,麻烦了。
下一个,交换函数swap,这里又会有一个和上面类似开辟空间的问题,其实库里(std)已经给我们提供了swap函数,但这个函数用于交换string时代价非常的大,大在他需要一次拷贝构造,两次赋值构造,开辟的很多空间。我们需要搞一个简单的交换。即string提供的swap交换。
思路就是不直接交换两个对象,而是分别进行交换,提高了效率,而每个交换的过程需要库里的swap
因为这个函数只有一个参数,我们调用这个swap就不能像之前的那样传参了,需要,变量.swap(变量)。
下一个,获取子串substr函数
接下来我们看一下字符串比较系列的函数,与我们之前的日期类的比较同理,我们只要写出两个具体函数其他的直接复用即可。
下面是我们的流插入与流提取
这里clear函数的意义是把字符串原有的内容清空再进行流插入。
至此语法上的问题我们就都解决了,但是还有一个空间上的问题,我们如果输入一个特别长的字符串,他在进行流插入的过程中会不断进行+=扩容空间造成麻烦,我们需要解决这个问题。可以先创建一个临时数组,然后判断数组大小与字符串长度大小进行对比。
先开数组并把插入的字符串全放在数组中,如果空间足够直接把数组内容加到str中,不够就继续扩容再加。(当然不做这种优化问题也不大)
————————
至此,以上就是我们对于string底层实现的所有内容了。
我们回看上面的拷贝的模拟实现函数,其大致思路是自己开辟之前一样大的空间,然后把字符串strcpy过来,现在我们换个思路,把这些事都交给别人干(构造函数),最后我们用一个swap进行交换岂不是直接能获取目标字符串?于是,拷贝函数的实现有了另一种写法
本文结束,麻烦留下你宝贵的三连。