标准库中的string

字符串容量头文件：<string>

string本质上就是字符顺序表;

class string
{
private:
	char* str;
	size_t _size;
	size_t capacity;
};

1. string类对象的常见构造

(constructor) 函数名称	功能说明
string() （重点）	构造空的 string 类对象，即空字符串
*string(const char s)** （重点）	用 C-string 来构造 string 类对象
string(size_t n, char c)	string 类对象中包含 n 个字符 c
string(const string&s) （重点）	拷贝构造函数

无参：空的string

string s1;

带参：用一个常量字符串初始化string

string s1("hello world");

拷贝构造是深拷贝

string s3(s2);

2. string类对象的容量操作

C++为string提供了许多接口

函数名称	功能说明
size （重点）	返回字符串有效字符长度
length	返回字符串有效字符长度
capacity	返回空间总大小
empty （重点）	检测字符串释放为空串，是返回 true ，否则返回 false
clear （重点）	清空有效字符
reserve （重点）	为字符串预留空间（提前开辟）
resize （重点）	将有效字符的个数该成 n 个，多出的空间用字符 c 填充

size：

返回字符串的长度（以字节为单位）；
这是符合字符串内容的实际字节数，不一定等于其存储容量；（省去了"\0"）

int main()
{
	string s("hello world");
	cout << s.size() << endl;//11，不算"\0"
	return 0;
}

length：

和size基本一样，但是size能包含的内容更大；

max_size：

最大的size大小（不同容器，不同平台不同）；

capacity：

（容量：开的空间）

返回已分配存储的大小

返回当前为字符串分配的存储空间的大小，以字节为单位表示；
此容量不一定等于字符串长度。它可以相等或更大，当向字符串添加新字符时，额外的空间允许对象优化其操作；（显示的是有效字符个数，不算"\0"）

接下来，我们看看在VS下是如何扩容的：

void TestPushBack()
{
	string s;
	size_t sz = s.capacity();
	cout << "first_capacity：" << sz << endl;
	cout << "making s grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		s.push_back('c');
		if (sz != s.capacity())
		{
			sz = s.capacity();
			cout << "capacity changed: " << sz << endl;
		}
	}
}

在VS中设计：当数据个数小于16时，会先存在内部的一个_buff里边 (VS防止小块内存在堆上)

微软工程师实现：

class string
{
private:
	char _buff[16];//n<16，这也是为什么第一次按2倍扩的原因
	char* str;//n>=16时，_buff就废弃了，全部开在了str指向的堆上
	size_t _size;
	size_t capacity;
};

但是在不同平台有着不同的实现方式：

g++下string的结构（标准的2倍扩容，没有_buff）

G++下，string是通过写时拷贝实现的，string对象总共占4个字节，内部只包含了一个指针，该指针将来指向一块堆空间，内部包含了如下字段：

空间总大小

字符串有效长度

引用计数

指向堆空间的指针，用来存储字符串

struct _Rep_base
{
size_type _M_length;
size_type _M_capacity;
_Atomic_word _M_refcount;
};

频繁的扩容是代价的，拷贝数据-释放空间，会降低效率，那我们如何避免扩容，减少扩容呢？

解决：reserve，resize

reserve：

请求将字符串容量调整为计划的大小更改，则该函数会导致容器将其容量增加到 n 个字符（或更大）；

在所有其他情况下，它被视为一个非约束性请求，以缩小字符串容量：容器实现可以自由地进行优化，并使大于 n；（节省空间，但一般不会缩容(根据不同平台：VS不缩容（其实_buff就可以看出来了），g++缩容)，因为缩容是要付出代价的，因为待会需要空间的话还要继续扩）

参考：典型的缩容：shrink_to_fit ：capacity减到size

此函数对字符串容量没有影响，并且不能更改其内容；

reserve开的大小不包含\0，实际上最少要开n+1；

作用：提前开空间，避免扩容，提高效率

void TestPushBack()
{
	string s;
	s.reserve(100);
	size_t sz = s.capacity();
}

resize：

（扩容插入字符）

void resize (size_t n);void resize (size_t n, char c);

将字符串的大小调整为 n 个字符的长度；

如果 n 小于当前字符串长度，则当前值将缩短为其前 n 个字符，并删除第 n个字符之外的字符；

如果 n 大于当前字符串长度，则通过在末尾插入所需数量的字符来扩展当前内容，以达到 n 的大小。如果指定了 c，则新元素将初始化为 c 的副本，否则，它们是值初始化的字符（null 字符）；

size_t _sz = s.size();
s.resize(_sz + 2, '+');

clear：

void clear();

清除字符串

擦除字符串的内容，该字符串将变为空字符串（长度为 0 个字符）。

clear一般是只清理内容，不清除掉容量的(怕白干了)，但个别少数会连容量（空间）一起清除的

s.clear();

empty：

（判空）

bool empty() const;

测试字符串是否为空

返回字符串是否为空（即其长度是否为 0）；
此函数不会以任何方式修改字符串的值；

cout << s.empty() << endl;

注意：

1. size()与length()方法底层实现原理完全相同，引入size()的原因是为了与其他容器的接口保持一致，一般情况下基本都是用size()；

2. clear()只是将string中有效字符清空，不改变底层空间大小；

3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个，不同的是当字符个数增多时：resize(n)用0来填充多出的元素空间，resize(size_t n, charc)用字符c来填充多出的元素空间。注意：resize在改变元素个数时，如果是将元素个数增多，可能会改变底层容量的大小，如果是将元素个数减少，底层空间总大小不变；

4. reserve(size_t res_arg=0)：为string预留空间，不改变有效元素个数，当reserve的参数小于string的底层空间总大小时，reserver不会改变容量大小；

3. string类对象的访问及遍历操作

函数名称	功能说明
operator[ ] （重点）	返回 pos 位置的字符， const string 类对象调用
begin + end	begin 获取一个字符的迭代器 + end 获取最后一个字符下一个位置的迭代器
rbegin + rend	begin 获取一个字符的迭代器 + end 获取最后一个字符下一个位置的迭代器
范围 for	C++11 支持更简洁的范围 for 的新遍历方式

string::iterator（正向迭代器）(string::const_iterator)

begin:

返回一个迭代器，该迭代器指向字符串的第一个字符;

如果字符串对象是 const 限定的，则该函数返回const_iterator。否则，它将返回一个迭代器；
成员类型 iterator 和 const_iterator 是随机访问迭代器类型（分别指向字符和 const 字符）；

string::iterator it = s2.begin();

end：

返回一个迭代器，该迭代器指向字符串的末尾字符（"\0"）

string::iterator it = s2.end();

string::reverse_iterator（反向迭代器） (string::const_reverse_iterator)

rbegin：

返回反向迭代器以反向开始

返回一个反向迭代器，指向字符串的最后一个字符（即其反向开头）(有效字符)；
反向迭代器向后迭代：增加迭代器会使它们朝向字符串的开头；（++倒着走）
rbegin 指向 member end 将指向的字符之前的字符；

string::iterator it = s2.rbegin();

rend；

将反向迭代器返回到反向端

返回一个反向迭代器，指向字符串的第一个字符（被视为其反面端）之前的理论元素；（也就是第一个字符的前一个位置）;

string：：rbegin 和 string：：rend 之间的范围包字符串的所有字符（顺序相反）（左(rbegin)闭右(rend)开）;

operator[ ]

获取字符串的字符

返回字符串中位置 pos 处的字符的引用

1.pos是size_t类型；

2.pos在字符串中是从0开始，即：第一个字符位置用0表示；

3.如果字符串对象是 const 限定的，则该函数返回 const char&，否则，它将返回 char&；

因此，我们可以去访问字符串中的字符：（适用于数组）

s2[0] = 'x';

//下标+[]
for (size_t i = 0; i < s2.size(); i++)
{
	cout << s2[i] << " ";
}

string是支持迭代器的方式进行遍历，迭代器是STL的六大组件之一，迭代器是用来遍历访问容器的；（所有的容器都可以用迭代器访问）

//迭代器
string::iterator it = s2.begin();
while (it != s2.end())
{
	cout << *it << " ";
	it++;
}

//范围for：所有容器都支持
//从s2中取字符给ch
//本质是迭代器
for (auto ch : s2)
{
	ch += 2;
	cout << ch << " ";
}

反向迭代器：（反向访问）

4.string提供的库---Function

库（点击进入详情页）

stoi：

int stoi (const string&  str, size_t* idx = 0, int base = 10);
int stoi (const wstring& str, size_t* idx = 0, int base = 10);

将字符串转换为整数

解析 str，将其内容解释为指定基数的整数，该整数作为 int 值返回；
如果 idx 不是 null 指针，则该函数还会将 idx 的值设置为 str 中第一个字符在数字之后的位置；

str：

表示整数的 String 对象

idx：

指向 size_t 类型的对象的指针，该对象的值由函数设置为 str 中下一个字符在数值之后的位置；
此参数也可以是 null 指针，在这种情况下，不会使用它；

base：

确定有效字符及其解释的数字基数（基数）；
如果此值为 0，则使用的基数由序列中的格式确定；

请注意，默认情况下，此参数为 10，而不是 0

类似的：

long long x=stoll(num1);

to_string：

string to_string (int val);
string to_string (long val);
string to_string (long long val);
string to_string (unsigned val);
string to_string (unsigned long val);
string to_string (unsigned long long val);
string to_string (float val);
string to_string (double val);
string to_string (long double val);

将数值转换为字符串

返回一个表示为 val 的字符串

类似：

5. string类对象的修改操作

函数名称	功能说明
push_back	在字符串后尾插字符 c
append	在字符串后追加一个字符串
operator+= ( 重点)	在字符串后追加字符串 str
c_str ( 重点 )	返回 C 格式字符串（兼容C）
find + npos ( 重点)	从字符串 pos 位置开始往后找字符 c ，返回该字符在字符串中的位置
rfind	从字符串 pos 位置开始往前找字符 c ，返回该字符在字符串中的位置
substr	在 str 中从 pos 位置开始，截取 n 个字符，然后将其返回（比copy好点，还要开buffer）

push_back：

将字符追加到字符串

将字符 c 追加到字符串的末尾，使其长度增加 1

append：

追加到字符串

通过在字符串的当前值末尾追加其他字符来扩展字符串

operator+=：

就是push_back和append的结合，很香的，可以丢掉前俩个（底层是按扩容的逻辑走的）

以后尾插用+=就对了

void test_string5()
{
	string s("hello world");
	s.push_back(' ');
	cout << s << endl;
	s.append("!!!");
	cout << s << endl;
	s += "1314";
	cout << s << endl;
	s += '!';
	cout << s << endl;
}

补充：

insert

说到尾插，还有头插，实际string没有头插，但是可以用insert接口实现头插：

s.insert(0, "hello everyone");

但头部，中间插入应该谨慎使用，有效率的流失

还有：

//插入一个
s.insert(0, "h");
s.insert(0, 1, 'h');//区别（小细节）
s.insert(0, 'h');//报错

由于历史的原因，整个string设计比较冗余，但是我们要尊重历史

语言都是向前兼容的，但python比较大胆~~~👍

erase

erase就比较好（指定位置删除字符）

从字符串中删除字符

擦除字符串的一部分，减小其长度：（头删就不用提供其他的接口）

void test_string6()
{
	string s("hello aaworld");
	s.erase(6, 2);//想要全删，默认给缺省值就行
	cout << s << endl;
}

其迭代器（接口）也支持头，尾删除（pop_back也有尾删功能）：

//头删
s.erase(s.begin());
//还可以
s.erase(0, 1);
//尾删
s.erase(--s.end());
//还可以
s.erase(s.size() - 1, 1);
//都是间接实现

replace：

如果想把字符串的某一个位置替换成另外一个字符/字符串，可以用replace（本质：插入删除）（效率也不高）

string s("hello world");
s.replace(5, 1, "%%");//换一个就行，换两个就把1换成2

find and npos：

查找字符：(返回类型：size_t)（找到返回下标，没找到返回npos（npos是静态成员变量，要制定类域））

（将所有空格转换成'!'）:

void test_string7()
{
	string s("hello world hello everyone nice to meet you   ");
	size_t pos = s.find(' ');
	while (pos != string::npos)
	{
		s.replace(pos, 1, "!");
		pos = s.find(' ', pos + 1);//防止对空格的从头开始查找
	}
	cout << s << endl;
}

但是面对大量数据是效率极低的，不可行的

void test_string7()
{
	string s("hello                       world ");
	size_t pos = s.find(' ');
	while (pos != string::npos)
	{
		s.replace(pos, 1, "!");
		cout << s << endl;
		pos = s.find(' ', pos + 1);//防止对空格的从头开始查找
	}
	cout << s << endl;
}

那该如何解决呢，我们可以拿空间换时间，又简单又高效：

void test_string7()
{
	string s("hello                       world ");
	string tmp;//牺牲空间
	tmp.reserve(s.size());//减少/避免 扩容
	for (auto ch : s)
	{
		if (ch == ' ')
		{
			tmp += "!";
		}
		else
		{
			tmp += ch;
		}
	}
	swap(s, tmp);//swap更高效
	cout << s << endl;
}

5. string类非成员函数

函数名称	功能说明
operator+	尽量少用，因为传值返回，导致深拷贝效率低c
operator>> （重点）	输入运算符重载
operator<< （重点）	输出运算符重载
getline （重点）	获取一行字符串
relational operators （重点）	大小比较

operator+

string+字符串：

string s1("hello ");
string s2 = s1 + "world";

字符串+string：（这样就不能重载为成员函数了，左操作数被string牢牢占用了）（只能重载为全局的，跟流插入一样）

string s1("hello ");
string s2 = "world" + s1;

getline：

在做一些题目的时候，我们时时需要输入空格，但是cin会将空格/换行默认为输入分割的标志，因此，getline很好的为我们解决了这个问题

getline：遇到空格不终止，还是从缓冲区拿数据，默认是换行才是分割的标志

string str;
getline(cin,str);

也可以遇到自定的符号作为结束的标志：(现在不默认了)

string str;
getline(cin,str,'*');