深度搜索list
list是双向链表:底部实现是环状双向链表
list内部除了存data之外,还要存一个前向指针prev和一个后向指针next
list的iterator,当迭代器++的时候,是从一个节点走到下一个节点,是通过访问next指针实现的
主要有两部分:一部分是一堆typedef,另一部分是操作符的重载
前置(prefix)++iter和后置(postfix)iter++,后置重载时有int参数。
左下角,为了向int ++看齐,前置可以两次++,所以重载返回引用,后置不允许两次++,所以不返回引用
GC++2.9中iterator需要传三个模板参数<T, T&, T*>,而GC++4.9中仅需要传一个模板参数
4.9继承关系更复杂
迭代器的设计原则和Iterator Traits的作用与设计
iterator_category()是看++,–,能不能跳来跳去,随机访问;
iterator_difference_type:两个迭代器区间距离的表示类型;(unsigned int)
value_type:元素类型
另外两种reference和pointer没有在C++标准库中使用过,但要写出来
指针也被看作是一种退化的iterator,但指针不是一个类,无法在类中定义5种associated types,因此需要一个萃取机,作为中间层,加以判断
利用偏特化分离出类和指针
vector深度搜索
Vector是动态数组,它会进行扩充,但不是原地扩充,而是当数组空间用完时,它会在某个地方重新分配内存空间(原来的两倍大小),再把先前的内容搬过去
底层通常包含三个指针成员:start(第一个元素的指针,起始位置)、finish(最后一个元素的下一个位置的指针,存储元素结束范围)和 end_of_storage(内存空间的末尾的下一个位置的指针)
vector是连续的,用指针就能当作iterator。然后借助前面介绍的iterator_traits的偏特化(范围的偏特化,从接收T变成接收指针T ),会把associated types里面的 value_type直接指定为T,而不是基于类的迭代器的I::value_type
GC++4.9版本的vector的iterator不再是GC++2.9版本的指针T,而是vector::iterator,里面的成员变量_M_current实际上就是_Tp*
array、forward list深度搜索
TR1标准array
array没有构造函数ctor,析构函数dtor。需要指定array的大小。
将本来的数组变为容器array是因为要提供迭代器,迭代器就要提供相应的5种类型,以便于连接算法与容器
forward list和双向链表list类似,只不过是单向
deque、queue和stack深度搜索
首先有一个map(暂且称为控制中心),里面存储指针,指针指向各个缓冲区buffer,缓冲区是数组,具体存储数据。缓冲区是连续的,但是不同的缓冲区之间不是连续的,所以称为分段连续
前后扩充时,map增加指针指向新的内存快。控制中心map是内存不够时是2倍增长
看起来好像连续,实际上是分段的,每个buffer有一定长度
迭代器中的cur,first,last,node四个元素,first和last分别是一个buffer的起始和结束,node是控制中心中哪个buffer的指针,cur指向的是具体的元素值。,每次++,–走到边界时,通过node回到控制中心,跳到下一个缓冲区
GC++2.9
class deque创建出来的对象本身大小有40B(32位机器上),至于deque里面存储的数据占用的空间大小,是动态分配获得的,和对象本身大小无关
iterator16b, map_point(T**,本身是一个指针)4b, map_size(控制中心这个vector的大小)4b
指定迭代器的类型是随机存取的类型,可以跳跃的,这就是deque对外表现的假象(虽然deque底层不连续,是分段连续的,但提供了++,+8的操作体现出连续的假象):提供随机访问迭代器,可以在常数时间内对其元素进行随机访问
中间插入时,判断哪端元素少,决定元素向前移动还是向后移动
reference front()
{
return *start;
}
reference back()
{
iterator tmp = finish; // 迭代器tmp赋值为finish,finish指向最后一个元素的下一个位置
--tmp;// 迭代器--,往前移动一格
return *tmp; // 此时返回的是最后一个元素
}
size_type size() const
{
return finish - start; // -操作符重载,看两者之间多少个buffer,buffer*大小,然后在分别加上finish本身和start本身的元素;是尾巴迭代器-头迭代器;
//
}
// 两个迭代器之间的距离:指的是多少个元素在两个迭代器之间
difference_type operator-(const _Self& __x) const {
return difference_type(buffer_size()) * (node - x.node - 1) + //-1减去起点的buffer
(cur - first) /*末尾(当前)buffer的元素量*/ + (x.last - x.cur)/*起始buffer的元素量*/ ;
}
deque模拟连续
self& operator++() {
++cur;
if (cur == last) { // 到达一个buffer的边界
// node是控制中心的节点
set_node(node + 1); // 跳转到下一个buffer的起点
cur = first;
}
return *this;
}
self operator++(int) {
self tmp = *this;
++*this;
return tmp;
}
self& operator--() {
if (cur == first) {
set_node(node - 1);
cur = last;
}
--cur;
return *this;
}
self operator--(int) {
self tmp = *this;
--*this;
return tmp;
}
// 从一个buffer跳转到另一个buffer
void set_node(map_pointer new_node) {
node = new_node;
first = *new_node; // 指向新buffer的start
last = first + difference_type(buffer_size()); //指向新buffer的last
}
deque里面有四个成员变量:控制中心,控制中心大小,指向所有元素的头,指向所有元素尾
当控制中心vector空间满时,自动两倍扩充空间。把旧的元素拷贝进新vector的中间部分
queue默认内部有一个deque作为底层容器。不直接提供存储元素的能力,而是通过封装底层容器来实现队列的行为(先进先出(FIFO))
stack同理,实现先进后出(LIFO)
stack和queue可以选择list或者deque作为底层结构,都不允许遍历,不提供iterator,否则会干扰先进先出/先进后出规则
queue不可选择vector,stack可选择vector
stack和queue都不能选择set或map做底层结构
RB tree深度搜索
红黑树是一种自平衡的二叉搜索树,保持树的平衡
Key:表示红黑树节点的键(key)的类型。这是用来比较和排序节点的关键信息
Value:表示红黑树节点存储的值(value,这里value表示key和data的整体)的类型。每个节点包含一个键和一个值(data)
KeyOfValue:一个函数对象,用于从节点值中提取键。在红黑树中,节点的键是用来进行比较和排序的。通过 KeyOfValue,可以从节点的值中提取键,以确保正确的比较和排序
Compare:一个比较函数对象,用于定义节点之间的顺序关系。它用来比较节点的键值,从而实现红黑树的有序性。
allocate:一个分配器类型,用于管理红黑树节点的内存分配和释放
GC++4.9的实现,handle/body,可以参考effective c++条款31的知识点
set、multiset深度搜索
以rb_tree为底层,因此有元素自动排序特性,提供遍历操作iterators。提供了++操作
无法使用iterators改变元素值,因为key有严谨排列规则,底部是RB_tree的const iterator
map、multimap深度搜索
和set类似。但虽然无法使用iterators改变元素的key,但可以改变元素的data。因此map/multimap内部自动将user指定的key type设定为const,以便静止user对元素key赋值
map中的[] 操作符里面先调用lower_bound进行查找,然后再insert元素。比之间insert要慢
hashtable深度搜索
假设一个物体可能的变化有
2
32
2^{32}
232,理想情况则需要sizeof(T)*
2
32
2^{32}
232的空间存放
空间不足时,用编号%空间大小,放在余数的位置。两个元素折射的编号可能发生碰撞
如果发生碰撞,则变成一个链表。
但这样可能导致一个链表很长,搜寻很慢
因此当链表太长时,需要打散(如果元素的个数比篮子的个数多时,把篮子增大(选取2倍大附近的素数,已经写死)。元素落在的位置要重新计算)
Bucket篮子就是一个vector
Value:表示哈希表中存储的值的类型
Key:表示哈希表中存储的键的类型
HashFun:表示哈希函数的类型,定了计算键的哈希值的方法,它是一个函数对象(函数或函数指针),用于将键转换为哈希值
ExtractKey:表示从键值对中提取键的方法的类型,是一个函数对象,用于从键值对中提取键,它定义了哈希表如何获取键值对中的键。
EqualKey:表示键的相等比较方法的类型,是一个函数对象,用于判断两个键是否相等,它定义了哈希表中键的相等性比较。
数值本身当成编号
没有数学,不统一,目的是为了设计出一个够乱,即够散列的数字
unordered容器概念
使用时不保证元素的顺序,而是通过哈希表提供快速的查找性能。每个元素被映射到哈希表的一个桶中,这使得查找操作的时间复杂度较低