文章目录

STL简介
一.认识string
二.string中基本功能的使用
总结

STL简介

STL(standard template libaray-标准模板库)：是 C++ 标准库的重要组成部分，不仅是一个可复用的组件库，而且 是一个包罗数据结构与算法的软件框架。

STL 的版本

原始版本

Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本，本着开源精神，他们声明允许任何人任意运用、拷贝、修改、传播、商业使用这些代码，无需付费。唯一的条件就是也需要向原始版本一样做开源使用。 HP 版本--所有STL实现版本的始祖。

P. J. 版本

由P. J. Plauger开发，继承自HP版本，被Windows Visual C++采用，不能公开或修改，缺陷：可读性比较低，符号命名比较怪异。

RW 版本

由Rouge Wage公司开发，继承自HP版本，被C+ + Builder 采用，不能公开或修改，可读性一般。

SGI 版本

由Silicon Graphics Computer Systems，Inc公司开发，继承自HP版本。被GCC(Linux)采用，可移植性好，可公开、修改甚至贩卖，从命名风格和编程风格上看，阅读性非常高。

STL的六大组件

仿函数，空间配置器，算法，容器，迭代器，配接器。

STL的缺陷

1. STL库的更新太慢了。这个得严重吐槽，上一版靠谱是C++98，中间的C++03基本一些修订。C++11出来已经相隔了13年，STL才进一步更新。

2. STL现在都没有支持线程安全。并发环境下需要我们自己加锁。且锁的粒度是比较大的。

3. STL极度的追求效率，导致内部比较复杂。比如类型萃取，迭代器萃取。

4. STL的使用会有代码膨胀的问题，比如使用vector/vector/vector这样会生成多份代码，当然这是模板语法本身导致的。

一、认识string

通过官方文档我们得知，string的原型是basic_string的类模板。

我们发现wstring,u16string,u32string这些又是什么呢？string的本质是一个管理字符的顺序表只不过里面存的都是1个char类型的字符，而wstring里面存的是2字节的char，u16string也是2个字节，u32string是4个字节，为什么会有这么多的差异呢？因为我们有管理不同的字符数组的需求。在这里我们要了解ascll码，用ascll编码可以在计算机里面存储和显示英文信息，而在一开始的ascll码表中仅有128个值，用7个比特位就可以代表这128个值了，所以一开始的string中的字符仅为1个字节，如下图：

apple这个字符串存在char类型的数组中会消耗6个字节，多出来的1个字节用来存放\0，而字符a在ascll表中的值为97，内存中的16进制61转换过来就是97，所以字符确实是根据ascll的值在内存中一个一个存储的。而计算机不能只显示英文，如果只能显示英文计算机又如何卖到中国呢，所以为了显示其他国家的文字有人就发明了Unicode（万国码）能表示各个国家的文字，Unicode又分为utf-8,utf-16,uft-32,他们三个的区别是每个字符的字节数不同，比如utf-8的char就是1字节并且兼容ascll吗，utf-16用16个比特位也就是2个字节，utf-32则是4个字节表示一个字符。而string类就是因为这样的原因所以搞出了字节数不一样的模板。

总结：

1. 字符串是表示字符序列的类

2. 标准的字符串类提供了对此类对象的支持，其接口类似于标准字符容器的接口，但添加了专门用于操作单字节字符字符串的设计特性。

3. string类是使用char即作为它的字符类型，使用它的默认char_traits和分配器类型。

4. string类是basic_string模板类的一个实例，它使用char来实例化basic_string模板类，并用char_traits和allocator作为basic_string的默认参数。

5. 注意，这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列，这个类的所有成员(如长度或大小)以及它的迭代器，将仍然按照字节(而不是实际编码的字符)来操作。

总结：

1. string是表示字符串的字符串类

2. 该类的接口与常规容器的接口基本相同，再添加了一些专门用来操作string的常规操作。

3. string在底层实际是：basic_string模板类的别名，typedef basic_string<char, char_traits, allocator> string;

4. 不能操作多字节或者变长字符的序列。

在使用 string 类时，必须包含 #include 头文件以及 using namespace std;

二、string中基本功能的使用。

1.string的构造函数。

我们可以看到string的构造函数有7个不同的重载，第一个可以直接定义一个字符串，比如：

我们可以发现一个空字符串里面是有一个\0的。

第二个可以直接用字符串初始化：

第二个是我们使用最多也是最方便的。第三个：给定一个字符串从这个字符串的某个位置及这个位置后面的len个长度初始化，如下：

len这个参数给了缺省值，实际上如果我们不给len那么len默认就是npos，npos是size_t类型默认值是-1，我们都知道size_t类型是无符号整形，所以-1就是整形的最大值，也就是说如果你不写这个参数那么自动将从pos位置开始后的所有字符进行构造。

第四个：直接用字符串去构造。

这里发生了隐式类型转换，将const char* 转换为string，如果不想要编译器发生隐式类型转换我们可以在构造函数前面加上explicit，这点我们在前面的类和对象文章讲过。

第五个：给定一个字符串用它的前n个构造

第六个：用n个字符去构造

第七个：迭代器区间的构造：

下面我们先来看string容量部分的函数：

第一个：size代表字符串的长度，length与size一模一样。

那么为什么要设计一模一样的函数呢，这里是因为c++早期的历史遗留问题，在没有STL之前是用length计算长度，有了STL后要计算二叉树等再用长度这个名称就不合适了所以多加了一个函数size。

第二个：max_size

max_size就是字符串的最大长度，它的理想是整形的最大值但实际上没有这么大因为要看堆的大小，并且这个借口并没有什么很大的作用。

我们先讲第四个：capacity

capacity就是字符能存储多少个字节，在这里需要注意的是：capacity不包含\0也就是说如果字符串是：“hello”，那么capacity就是5不会再加上\0的一个字节大小。

第三个：resize

第一个作用：resize的作用是开空间并且初始化，并且resize会改变size和capacity的大小。

我们可以看到，s1的长度从11变成了50，空间从15变成了63，当然如果我们不主动初始化为某个字符会默认初始化为\0。

第二个作用：当resize的大小比原来字符串的capacity要小，那么resize就会将字符串中的字符缩减为resize的大小。

我们可以看到字符串只保留了前五个字符。

第五个：reserve 开空间，只改变capacity不改变size，并且不会初始化。

第六个：clear 清空字符串

可以看到字符串为空了。

第七个：empty 判断字符串是否为空

接下来我们看string中的modify接口：

这里我们就不按照顺序进行演示了，因为有些接口不按照顺序效果会更好。

push_back :尾插一个字符

append：尾插一个字符串

第3个重载：

这里也是有6个函数重载，实在太过冗余所以我们就演示经常使用的。

第2个重载，尾插一个字符串的从pos位置起的sublen个字符

第4个重载，尾插一个字符串的前n个

第1个重载：

当然以上的这些接口其实都不是很实用，最实用的是操作符重载中的+=符号。

可以看到+=符号实在是太方便了。

insert:插入字符串或者字符

下面演示一下如何使用：在第pos个位置插入一个string对象

在第pos个位置插入一个string对象的从subpos下标位置开始的sublen个字符

在第pos个位置插入一个字符串

在第pos个位置插入字符串的前n个。

当然我们是不推荐使用insert的，因为插入要往后挪数据，时间复杂度为O（N）。

有insert就会有erase，我们看一下erase接口：

从pos位置起删除len个字符：

len有缺省值，如果我们不传则从pos位置开始后面全删，如下：

接下来我们看一下replace接口：

replace的重载太多了并且冗余，我们会用一两个即可：

上图是从下标为pos的位置开始的len个字符串。

我们先一下find接口：

pos使用缺省值如果我们不写默认是0位置。

下面我们用find接口和replace接口做一道经典例题：将空格替换为%20

看到以上的代码我们还能在优化一下吗？答案是可以，我们每次查找完一个空格就没必要再重头开始查找了，我们从上一次的位置+3开始查找即可，为什么要+3不是+1呢？因为我们替换了%20是3个字符：

那么我们还能继续优化吗？大家还记得我们讲的reserve函数吗，我们可以提前开好空间避免在替换字符的过程中持续开空间浪费时间。

我们用另一种方法再做一次：

这次的效率很明显是高于上面那种方式的，当然这样的方式提前开好空间效率也会提升不少。

下面我们来看一下string中的字符串是如何扩容的：

int main()
{
	string s;
	size_t sz = s.capacity();
	cout << "making s grow:\n";
	cout << "capacity changed:" << sz << '\n';
	for (int i = 0; i < 100; i++)
	{
		s.push_back('c');
		if (sz != s.capacity())
		{
			sz = s.capacity();
			cout << "capacity changed:" << sz << '\n';
		}
	}
	return 0;
}