MicroPython字典和映射使用称为开放寻址和线性探测的技术,本文详细介绍了这两种方法。
开放寻址
开放寻址用于解决碰撞问题,碰撞是非常常见的现象,当两个条目恰好散列到同一个槽或位置时就会发生碰撞。例如,散列设置如下:
如果有一个请求要将70
填入0
号槽位,由于0
号槽位不是空的,因此开放寻址会在字典中查找下一个可用的槽位来满足该请求。这种顺序搜索备用位置的方法称为探测。有几种顺序探测算法,但 MicroPython 使用的是线性探测。
线性探测
线性探测是在字典中查找可用地址或槽位的方法之一,在MicroPython中,它与开放寻址一起使用。在处理上述请求时,与其他探测算法不同的是,线性探测假定两次探测之间的间隔固定为1,因此,该请求通过将条目放入下一个空闲的槽位(在示例中是插槽位4)来实现:
同样的方法,即开放寻址和线性探测,也可用于搜索字典中的条目。假设要搜索数据项33
。计算出的哈希值将是2
。在槽位2
中可以找到33
,此时返回True
。搜索70
则完全不同,因为在插入时发生了碰撞。因此,计算出的哈希值为0
,当前为44
,这里不会简单地返回False
,而是从位置1
开始执行顺序搜索,直到找到条目70
或遇到空闲的插槽,这就是在哈希值中执行查找的一般方法:
// 仍然没有找到, 继续在表中查找
pos = (pos + 1) % set->alloc;
if (pos == start_pos) {
// 查找返回到起始位置,说明索引没有在表中
if (lookup_kind & MP_MAP_LOOKUP_ADD_IF_NOT_FOUND) {
if (avail_slot != NULL) {
//找到一个可用的插槽,就用它了
set->used++;
*avail_slot = index;
return index;
} else {
//在表中没有足够的空间,重新哈希
mp_set_rehash(set);
//重新开始查找新的元素
start_pos = pos = hash % set->alloc;
}
}
} else {
return MP_OBJ_NULL;
}