目录
1. 什么是STL
2. STL的版本
3. STL的六大组件
4. STL的缺陷
5. 引出string类
6. 标准库中的string类
6.1 string类简介
6.2 string类对象的构造
6.3. string类对象的容量
6.4. string类对象的遍历
6.5. string类对象的修改
6.6. string类非成员函数
6.7. vs和g++下string结构的说明
1. 什么是STL
- STL(standard template libaray-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架。
- STL是C++标准库的一部分。
2. STL的版本
◆ 原始版本
Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使用。 HP 版本--所有STL实现版本的始祖。◆ P. J. 版本
由P. J. Plauger开发,继承自HP版本,被Windows Visual C++采用,不能公开或修改,缺陷:可读性比较低,符号命名比较怪异。◆ RW版本
由Rouge Wage公司开发,继承自HP版本,被C++ Builder采用,不能公开或修改,可读性一般。◆ SGI版本
由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版本。被GCC(Linux)采用,可移植性好,可公开、修改甚至贩卖,从命名风格和编程风格上看,阅读性非常高。我们后面学习STL要阅读部分源代码,主要参考的就是这个版本。
3. STL的六大组件
4. STL的缺陷
- STL库的更新太慢了。这个得严重吐槽,上一版靠谱是C++98,中间的C++03基本一些修订。C++11出来已经相隔了13年,STL才进一步更新。
- STL现在都没有支持线程安全。并发环境下需要我们自己加锁。且锁的粒度是比较大的。
- STL极度的追求效率,导致内部比较复杂。比如类型萃取,迭代器萃取。
- STL的使用会有代码膨胀的问题,比如使用vector/vector/vector这样会生成多份代码,当然这是模板语法本身导致的。
5. 引出string类
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
6. 标准库中的string类
6.1 string类简介
string类的文档介绍:
1. 字符串是表示字符序列的类。
2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作,单字节字符字符串的设计特性。
3. string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。
4. string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
5. 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
总结:
1. string是表示字符串的字符串类。
2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
3. string在底层实际是:basic_string模板类的别名,typedef basic_string<char, char_traits, allocator> string;
4. 不能操作多字节或者变长字符的序列。
在使用string类时,必须包含#include头文件以及using namespace std;
6.2 string类对象的构造
(constructor)函数名称 | 功能说明 |
string() | 构造空的string类对象,即空字符串 |
string(const char* s) | 用字符串来构造string类对象 |
string(const string &s) | 拷贝构造函数 |
string (const string& s, size_t pos, size_t len = npos); | 从第pos个位置拷贝npos个 |
string(size_t n, char c) | string类对象中包含n个字符c |
void Teststring()
{
string s1; //构造空的string类对象s1
string s2("hello word"); //用字符串构造string类对象s2
string s3(s2); //拷贝构造s3
string s4(s2,5,3); //拷贝构造s2,从第5个位置开始(从0开始)取3个字符
string s5(s2,5,10); //拷贝构造s2,从第5个位置开始,取10个字符,不够,有多少取多少
string s6(s2,5); //拷贝构造s2,从第5个位置开始,取余下的
cout << s1 << endl;
cout << s2 << endl;
cout << s3 << endl;
cout << s4 << endl;
cout << s5 << endl;
cout << s6 << endl;
}
int main()
{
Teststring();
return 0;
}
6.3. string类对象的容量
函数名称 | 功能说明 |
size (重点) | 返回字符串有效字符长度 |
length | 返回字符串有效字符长度 |
capacity | 返回空间总大小 |
empty (重点) | 检测字符串释放为空串,是返回true,否则返回false |
clear (重点) | 清空有效字符 |
reserve (重点) | 为字符串预留空间 |
resize (重点) | 将有效字符的个数该成n个,多出的空间用字符c填充 |
void Teststring2()
{
string s1("hello word");
for(size_t i=0;i<s1.size();i++)
{
cout << s1[i] << " "; //这里的[]实际是调用的运算符重载
cout << s1.operator[](i) << " "; //[]运算符重载
}
cout << endl;
cout << s1.size() << endl;
cout << s1.capacity() << endl;
}
int main()
{
Teststring2();
return 0;
}
查看扩容机制:
void Teststring5()
{
//查看扩容机制
string s;
size_t sz = s.capacity();
for(int i=0;i<100;i++)
{
s.push_back('c');
if(sz != s.capacity())
{
sz = s.capacity();
cout << "capacity changed: " << sz << endl;
}
}
}
注意:
- size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一 致,一般情况下基本都是用size()。
- clear()只是将string中有效字符清空,不改变底层空间大小。
- resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。
- reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于 string的底层空间总大小时, reserver不会改变容量大小。
6.4. string类对象的遍历
函数名称 | 功能说明 |
operator[ ] | 返回pos位置的字符, const string类对象调用 |
begin+ end | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 |
rbegin + rend | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 |
范围for | C++11支持更简洁的范围for的新遍历方式 |
用迭代器遍历
void Teststring3()
{
string s1("hello word");
const string s2("hello word");
string::iterator it1 = s1.begin(); //begin为开始位置
while(it1 != s1.end()) //end为最后的下一个位置
{
cout << *it1 << " ";
++it1;
}
string::const_iterator it2 = s2.begin(); //const迭代器,只读,不可以修改
while(it1 != s2.end())
{
cout << *it2 << " ";
++it2;
}
}
void Teststring4()
{
string s1("hello word");
string::reverse_iterator rit = s1.rbegin(); //反向迭代器
while(rit != s1.rend())
{
cout << *rit << " ";
++rit;
}
}
6.5. string类对象的修改
函数名称 | 功能说明 |
push_back | 在字符串后尾插字符 |
append | 在字符串后追加一个字符串 |
operator+= (重点) | 在字符串后追加字符串 |
c_str(重点) | 返回C格式字符串 |
find + npos(重点) | 从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置 |
rfind | 从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置 |
substr | 在str中从pos位置开始,截取n个字符,然后将其返回 |
void Teststring4()
{
string s1("hello word");
s1.push_back('!');
cout << s1 << endl;
s1.append("hello bit");
cout << s1 << endl;
s1.append(10,'x');
cout << s1 << endl;
}
find 和 substr的用法举例:
void Teststring6()
{
string s1("test.c");
size_t pos1 = s1.find('.');
if(pos1 != s1.npos)
{
string suffix = s1.substr(pos1);
cout << suffix << endl;
}
else
{
cout << "找不见" << endl;
}
}
注意:
- 在string尾部追加字符时, s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般 情况下string类的+=操作用的比较多, +=操作不仅可以连接单个字符,还可以连接字符串。
- 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好。
6.6. string类非成员函数
函数 | 功能说明 |
operator+ | 尽量少用,因为传值返回,导致深拷贝效率低 |
operator>> (重点) | 输入运算符重载 |
operator (重点) | 输出运算符重载 |
getline (重点) | 获取一行字符串 |
relational operators (重点) | 大小比较 |
6.7. vs和g++下string结构的说明
注意:下述结构是在32位平台下进行验证, 32位平台下指针占4个字节。
vs下string的结构:
string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:
◆ 当字符串长度小于16时,使用内部固定的字符数组来存放。
◆ 当字符串长度大于等于16时,从堆上开辟空间。
union _Bxty
{ // storage for small buffer or pointer to larger one
value_type _Buf[_BUF_SIZE];
pointer _Ptr;
char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;
◆ 这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string对象创建好之后,内部已经有了16个字符数组的固定空间,不需要通过堆创建,效率高。
◆ 其次:还有一个size_t字段保存字符串长度,一个size_t字段保存从堆上开辟空间总的容量
◆ 最后:还有一个指针做一些其他事情。
◆ 故总共占16+4+4+4=28个字节。
g++下string的结构
G++下, string是通过写时拷贝实现的, string对象总共占4个字节,内部只包含了一个指针,该指 针将来指向一块堆空间,内部包含了如下字段:
◆ 空间总大小
◆ 字符串有效长度
◆ 引用计数
◆ 指向堆空间的指针,用来存储字符串。
struct _Rep_base
{
size_type _M_length;
size_type _M_capacity;
_Atomic_word _M_refcount;
};
本章完。