【OpenGauss源码学习 —— 执行算子(Nest Loop 算子)】

news2024/11/20 10:38:51

执行算子(Nest Loop 算子)

  • 概述
  • Nest Loop 算子
    • ExecInitNestLoop 函数
    • ExecNestLoop 函数
    • ExecEndNestLoop 函数
    • ExecReScanNestLoop 函数
  • 总结

声明:本文的部分内容参考了他人的文章。在编写过程中,我们尊重他人的知识产权和学术成果,力求遵循合理使用原则,并在适用的情况下注明引用来源。
本文主要参考了 OpenGauss5.1.0 的开源代码和《OpenGauss数据库源码解析》一书以及一些参考资料:多表连接的三种方式详解 hash join、merge join、 nested loop

概述

  连接算子用于处理表关联,openGauss支持 12 种连接类型(inner join、left join、right join、full join、semi join、anti join等),提供了 3 种连接算子:hash join、Merge join、nested loop join 算子;其中,在先前的学习中,【OpenGauss源码学习 —— 执行算子(hash join 算子)】一文中详细介绍了 hash join 算子的执行过程。【OpenGauss源码学习 —— 执行算子(Merge Join 算子)】一文中学习了 Merge Join 算子的执行过程。本文则来继续学习另一个扫描算子Nest Loop 算子。

Nest Loop 算子

  Nest Loop嵌套循环)算子是数据库执行计划中的一种基本算法,用于实现两个数据集的连接操作它的工作原理是,对于参与连接的两个数据集,算子先遍历第一个数据集中的每一条记录,然后对于每一条记录,再遍历第二个数据集,寻找满足连接条件的匹配记录。这种算法的特点是简单直观,但在处理大数据量时可能效率较低,因为它需要对第二个数据集进行多次完整的遍历。因此,Nest Loop 算子更适合于至少有一个参与连接的数据集较小的情况。尽管它的基本原理简单,现代数据库系统会通过各种优化,比如使用索引来减少对第二个数据集的遍历次数,来提高 Nest Loop 连接的效率。
  NestLoop 节点实现了嵌套循环连接方法,能够进行 Inner JoinLeft Outer JoinSemi JoinAnti Join 四种连接方式。图 6-53 展示了 NestLoop 节点及对应的状态节点 NestLoopState 的定义。NestLoop 节点并未对 Join 节点进行扩展,NestLoop 节点的初始化过程会将节点中连接条件(joinqual 字段)进行处理,转化为对应的状态节点 JoinState 中的 joinqual 链表。

在这里插入图片描述
  在嵌套循环连接(Nest Loop Join)的过程中,算子遍历外部数据集 S 中的每一个元组 s,并对每一个内部数据集 R 中的元组 r 进行遍历。如果 rs 满足连接条件,即可以连接成一个新的元组 t,那么输出 t。如下图所示:(内容来自《PostgresSQL数据库内核分析》329 页)
在这里插入图片描述

  当存在需要检查是否需要从外部数据集中获取新的元组时,NestLoopState 中有两个关键的字段:nl_NeedNewOuternl_MatchedOuter

  • nl_NeedNewOuter:当这个字段为 true 时,意味着需要从外部数据集中获取新的元组
  • nl_MatchedOuter:当这个字段为 false 时,意味着当前的外部元组没有找到匹配的内部元组,这在执行 Left Outer JoinAnti Join 时特别重要。

  如果在执行 Left Outer JoinAnti Join 时,没有找到匹配的内部元组(即 nl_MatchedOuterfalse),那么需要生成一个包含外部元组和空的内部元组的新元组
  NestLoop 算子的执行逻辑在处理 Left Outer JoinAnti Join 时有特殊的处理逻辑,主要通过更新 NestLoopStatenl_NullInnerTupleSlot 字段来实现,这个字段用于存储一个空的内部元组槽。执行逻辑如下:

  • 如果 nl_NeedNewOutertrue,算子将获取外部数据集的新元组。
  • 如果 nl_MatchedOuterfalse,算子将生成一个包含外部元组和空内部元组的新元组。

  以下代码是定义了一个用于实现嵌套循环连接(Nest Loop Join)的结构体和相关组件,在数据库查询执行计划的实现中使用。(路径:src\include\nodes\plannodes.h

// 嵌套循环连接节点结构定义
typedef struct NestLoop {
    Join join;            // 继承自Join结构,包含了连接操作的基本信息,如连接类型等
    List* nestParams;     // 一个包含NestLoopParam节点的列表,用于指定在执行内部子计划时必须传递的执行器参数,这些参数携带来自外部子计划当前行的值
    bool materialAll;     // 一个标志位,指示是否需要物化(即存储到内存中)所有的结果
} NestLoop;

// VecNestLoop是NestLoop的向量化版本,继承自NestLoop,用于处理向量化的数据处理,以提高性能
typedef struct VecNestLoop : public NestLoop {
} VecNestLoop;

// 定义NestLoopParam结构,用于描述如何将外部关系的变量值传递给内部执行计划
typedef struct NestLoopParam {
    NodeTag type;    // 节点类型标记,用于辨识结构体的类型
    int paramno;     // PARAM_EXEC类型的参数编号,指定要设置的参数
    Var* paramval;   // 指向外部关系变量的指针,该变量的值将被赋给参数
} NestLoopParam;

  以上码段定义了实现嵌套循环连接的数据结构,它是数据库执行计划中的一部分,用于执行两个数据集的连接操作。NestLoop 结构体包含了执行连接所需的基本信息,包括连接的类型参数以及是否需要物化所有结果的标志NestLoopParam 结构体用于详细说明如何将外部数据集的当前行值传递到内部查询计划中,以便执行连接条件的匹配。这样的设计允许数据库执行引擎在执行嵌套循环连接时,能够有效地传递和使用来自外部数据集的数据,为查询优化提供了灵活性和高效性。

  算子对应的主要函数如下表所示。

主要函数说 明
ExecInitNestLoop初始化 Nest Loop 状态节点
ExecNestLoop执行 Nest Loop 的主要函数
ExecEndNestLoop清理 Nest Loop 状态节点
ExecReScanNestLoop重置 Nest Loop 状态节点

ExecInitNestLoop 函数

  ExecInitNestLoop 函数是用来初始化一个嵌套循环连接(Nest Loop Join)的执行状态。这个函数创建并设置一个 NestLoopState 结构体,这个结构体将用于在查询执行期间跟踪嵌套循环连接的状态。函数源码如下所示:(路径:src\gausskernel\runtime\executor\nodeNestloop.cpp

/*
 * ExecInitNestLoop函数用于初始化NestLoop节点的执行状态结构NestLoopState。
 * 该函数对NestLoop节点进行初始化,包括创建状态结构、初始化表达式上下文、
 * 初始化子节点等操作,以及对连接类型的处理和结果元组的初始化。
 * 参数:
 *   - node: NestLoop节点
 *   - estate: 执行状态信息
 *   - eflags: 执行标志
 * 返回值:
 *   - 初始化后的NestLoopState结构
 */
NestLoopState* ExecInitNestLoop(NestLoop* node, EState* estate, int eflags)
{
    /* 检查不支持的标志 */
    Assert(!(eflags & (EXEC_FLAG_BACKWARD | EXEC_FLAG_MARK)));

    NL1_printf("ExecInitNestLoop: %s\n", "初始化节点");

    /*
     * 创建状态结构
     */
    NestLoopState* nlstate = makeNode(NestLoopState);
    nlstate->js.ps.plan = (Plan*)node;
    nlstate->js.ps.state = estate;
    nlstate->nl_MaterialAll = node->materialAll;
    nlstate->js.ps.ExecProcNode = ExecNestLoop;

    /*
     * 杂项初始化
     *
     * 创建节点的表达式上下文
     */
    ExecAssignExprContext(estate, &nlstate->js.ps);

    /*
     * 初始化子表达式
     */
    if (estate->es_is_flt_frame) {
        nlstate->js.ps.qual = (List*)ExecInitQualByFlatten(node->join.plan.qual, (PlanState*)nlstate);
        nlstate->js.jointype = node->join.jointype;
        nlstate->js.joinqual = (List*)ExecInitQualByFlatten(node->join.joinqual, (PlanState*)nlstate);
        Assert(node->join.nulleqqual == NIL);
    } else {
        nlstate->js.ps.targetlist = (List*)ExecInitExprByRecursion((Expr*)node->join.plan.targetlist, (PlanState*)nlstate);
        nlstate->js.ps.qual = (List*)ExecInitExprByRecursion((Expr*)node->join.plan.qual, (PlanState*)nlstate);
        nlstate->js.jointype = node->join.jointype;
        nlstate->js.joinqual = (List*)ExecInitExprByRecursion((Expr*)node->join.joinqual, (PlanState*)nlstate);
    }
    Assert(node->join.nulleqqual == NIL);

    /*
     * 初始化子节点
     *
     * 如果从外部传递给内部关系的参数为空,则告知内部子节点可以进行廉价的重新扫描。
     * 如果有这样的参数,则内部子节点根本不需要REWIND支持,因为它将始终使用新的参数值重新扫描。
     */
    outerPlanState(nlstate) = ExecInitNode(outerPlan(node), estate, eflags);
    if (node->nestParams == NIL)
        eflags |= EXEC_FLAG_REWIND;
    else
        eflags &= ~EXEC_FLAG_REWIND;
    innerPlanState(nlstate) = ExecInitNode(innerPlan(node), estate, eflags);

    /*
     * 元组表初始化
     */
    ExecInitResultTupleSlot(estate, &nlstate->js.ps);

    nlstate->js.single_match = (node->join.inner_unique || node->join.jointype == JOIN_SEMI);

    switch (node->join.jointype) {
        case JOIN_INNER:
        case JOIN_SEMI:
            break;
        case JOIN_LEFT:
        case JOIN_ANTI:
        case JOIN_LEFT_ANTI_FULL:
            nlstate->nl_NullInnerTupleSlot = ExecInitNullTupleSlot(estate, ExecGetResultType(innerPlanState(nlstate)));
            break;
        default:
            ereport(ERROR,
                (errcode(ERRCODE_UNRECOGNIZED_NODE_TYPE),
                    errmodule(MOD_EXECUTOR),
                    errmsg("在初始化nestLoop时出现无法识别的连接类型: %d", (int)node->join.jointype)));
    }

    /*
     * 初始化元组类型和投影信息
     * 在这种情况下,结果将仅包含虚拟数据。
     */
    ExecAssignResultTypeFromTL(&nlstate->js.ps, TableAmHeap);
    ExecAssignProjectionInfo(&nlstate->js.ps, NULL);

    /*
     * 最后,清除当前外部元组的数据。
     */
    nlstate->js.ps.ps_vec_TupFromTlist = false;
    nlstate->nl_NeedNewOuter = true;
    nlstate->nl_MatchedOuter = false;

    NL1_printf("ExecInitNestLoop: %s\n", "节点已初始化");

    return nlstate;
}

  此外,ExecInitNestLoop 函数中所涉及到的几种 JOIN 类型的含义如下:

JOIN 类型含 义
JOIN_INNER: 内连接返回两个表中匹配的行,不包括不匹配的行。
JOIN_SEMI: 半连接返回左表中有匹配行的行,不包括右表的列。
JOIN_LEFT: 左外连接返回左表中的所有行和右表中匹配的行。如果右表中没有匹配的行,返回 NULL 值。
JOIN_ANTI: 反向半连接返回左表中没有匹配行的行
JOIN_LEFT_ANTI_FULL: 左反向外连接返回左表中没有匹配行的行,同时包括右表中没有匹配的行

ExecNestLoop 函数

  ExecNestLoop 函数的作用是执行嵌套循环连接操作,它通过遍历外部关系表和内部关系表的所有可能组合,根据连接条件将满足条件的元组组合成连接元组,并输出结果。在执行过程中,它会检查是否需要重新获取外部关系表的新元组,并对满足特定条件的连接进行优化。ExecNestLoop 函数如下所示:(路径:src\gausskernel\runtime\executor\nodeNestloop.cpp

/*
 * ExecNestLoop函数用于执行NestLoop节点的主循环,从外部和内部关系中获取元组,并进行连接操作。
 * 该函数根据连接条件将外部和内部元组进行连接,并对连接后的元组进行限定条件的判断,最终返回符合条件的元组。
 * 参数:
 *   - state: NestLoop节点的执行状态
 * 返回值:
 *   - 符合条件的元组槽
 */
static TupleTableSlot* ExecNestLoop(PlanState* state)
{
    NestLoopState* node = castNode(NestLoopState, state); //将给定的PlanState类型的指针转换为NestLoopState类型的指针
    TupleTableSlot* outer_tuple_slot = NULL;  // 用于存储外部关系中的元组
    TupleTableSlot* inner_tuple_slot = NULL;  // 用于存储内部关系中的元组
    ListCell* lc = NULL;  // 用于遍历列表的指针

    /*
     * 从节点中获取信息
     */
    ENL1_printf("从节点中获取信息");

    /* 从NestLoopState中获取相关信息 */
    NestLoop* nl = (NestLoop*)node->js.ps.plan;  // 获取NestLoop节点的计划信息
    List* joinqual = node->js.joinqual;          // 获取连接限定条件列表
    List* otherqual = node->js.ps.qual;          // 获取其他限定条件列表
    PlanState* outer_plan = outerPlanState(node);  // 获取外部计划节点状态
    PlanState* inner_plan = innerPlanState(node);  // 获取内部计划节点状态
    ExprContext* econtext = node->js.ps.ps_ExprContext;  // 获取表达式上下文

    CHECK_FOR_INTERRUPTS();
    
    /*
     * 检查是否还在从先前连接的元组中投影出元组(因为投影表达式中存在返回集的函数)。
     * 如果是这样,则尝试投影另一个元组。
     */
    if (node->js.ps.ps_vec_TupFromTlist) {
        ExprDoneCond is_done;

        TupleTableSlot* result = ExecProject(node->js.ps.ps_ProjInfo, &is_done);
        if (is_done == ExprMultipleResult)
            return result;
        /* 完成这个源元组... */
        node->js.ps.ps_vec_TupFromTlist = false;
    }

    /*
     * 重置每个元组的内存上下文,以释放上一个元组周期中分配的任何表达式评估存储空间。
     * 注意,这不能发生,直到我们完成从连接元组中投影出元组的操作。
     */
    ResetExprContext(econtext);

    /*
     * 现在,一切都准备就绪,可以循环,直到返回符合条件的连接元组。
     */
    ENL1_printf("进入主循环");

    /* 如果需要在内部关系上执行物化操作,则执行 */
    if (node->nl_MaterialAll) {
        MaterialAll(inner_plan);          // 在内部计划上执行物化操作
        node->nl_MaterialAll = false;     // 将标志位设置为false,表示物化操作已完成
    }

    for (;;) {
        /*
         * 如果没有外部元组,获取下一个并重置内部扫描。
         */
        if (node->nl_NeedNewOuter) {
            ENL1_printf("获取新的外部元组");
            outer_tuple_slot = ExecProcNode(outer_plan);
            /*
             * 如果没有更多的外部元组,则连接完成。
             */
            if (TupIsNull(outer_tuple_slot)) {
                ExecEarlyFree(inner_plan);
                ExecEarlyFree(outer_plan);

                EARLY_FREE_LOG(elog(LOG,
                    "Early Free: NestLoop is done "
                    "at node %d, memory used %d MB.",
                    (node->js.ps.plan)->plan_node_id,
                    getSessionMemoryUsageMB()));

                ENL1_printf("没有外部元组,结束连接");

                return NULL;
            }

            ENL1_printf("保存新的外部元组信息");
            econtext->ecxt_outertuple = outer_tuple_slot;
            node->nl_NeedNewOuter = false;
            node->nl_MatchedOuter = false;

            /*
             * 获取必须传递给内部扫描的任何外部Var的值,并将其存储在相应的PARAM_EXEC插槽中。
             */
            /* 遍历内部关系参数列表,设置参数执行数据 */
            foreach (lc, nl->nestParams) {
                NestLoopParam* nlp = (NestLoopParam*)lfirst(lc);  // 获取参数信息
                int paramno = nlp->paramno;  // 获取参数编号
                ParamExecData* prm = NULL;   // 参数执行数据指针

                prm = &(econtext->ecxt_param_exec_vals[paramno]);  // 获取参数执行数据的指针
                /* 确保参数是OUTER_VAR类型 */
                Assert(IsA(nlp->paramval, Var));
                Assert(nlp->paramval->varno == OUTER_VAR);
                Assert(nlp->paramval->varattno > 0);
                Assert(outer_tuple_slot != NULL && outer_tuple_slot->tts_tupleDescriptor != NULL);
                /* 获取外部元组中的属性值 */
                prm->value = tableam_tslot_getattr(outer_tuple_slot, nlp->paramval->varattno, &(prm->isnull));
                prm->valueType = outer_tuple_slot->tts_tupleDescriptor->tdtypeid;  // 设置参数值的类型
                prm->isChanged = true;  // 将参数值标记为已更改
                /* 将参数编号添加到内部计划的参数更改集合中 */
                inner_plan->chgParam = bms_add_member(inner_plan->chgParam, paramno);
            }

            /*
             * 现在重新扫描内部计划
             */
            ENL1_printf("重新扫描内部计划");
            ExecReScan(inner_plan);
        }

        /*
         * 我们有一个外部元组,尝试获取下一个内部元组。
         */
        ENL1_printf("获取新的内部元组");

        /*
         * 如果内部计划是mergejoin,它不缓存数据,
         * 但会提前释放左右树的缓存内存。
         * 当重新扫描左树时,可能失败。
         */
        bool orig_value = inner_plan->state->es_skip_early_free;
        if (!IsA(inner_plan, MaterialState))
            inner_plan->state->es_skip_early_free = true;

        inner_tuple_slot = ExecProcNode(inner_plan);

        inner_plan->state->es_skip_early_free = orig_value;
        econtext->ecxt_innertuple = inner_tuple_slot;

        if (TupIsNull(inner_tuple_slot)) {
            ENL1_printf("没有内部元组,需要新的外部元组");

            node->nl_NeedNewOuter = true;

            if (!node->nl_MatchedOuter && (node->js.jointype == JOIN_LEFT || node->js.jointype == JOIN_ANTI ||
                                              node->js.jointype == JOIN_LEFT_ANTI_FULL)) {
                /*
                 * 我们正在执行外连接,并且此外部元组没有连接匹配项。
                 * 生成一个带有内部元组的虚假连接元组,并且如果通过非连接限定符,则返回它。
                 */
                econtext->ecxt_innertuple = node->nl_NullInnerTupleSlot;

                ENL1_printf("测试外连接元组的限定条件");

                if (otherqual == NIL || ExecQual(otherqual, econtext, false)) {
                    /*
                     * 限定条件满足,因此我们投影并返回包含结果元组的槽,使用ExecProject函数。
                     */
                    ExprDoneCond is_done;

                    ENL1_printf("限定条件满足,投影元组");

                    TupleTableSlot* result = ExecProject(node->js.ps.ps_ProjInfo, &is_done);

                    if (is_done != ExprEndResult) {
                        node->js.ps.ps_vec_TupFromTlist = (is_done == ExprMultipleResult);
                        return result;
                    }
                } else
                    InstrCountFiltered2(node, 1);
            }

            /*
             * 否则,只需返回循环顶部获取新的外部元组。
             */
            continue;
        }

        /*
         * 在这一点上,我们有一对新的内部和外部元组,因此我们测试内部和外部元组是否满足节点的限定条件。
         *
         * 只有连接条件决定了MatchedOuter的状态,但所有限定条件必须通过才能实际返回元组。
         */
        ENL1_printf("测试限定条件");

        if (ExecQual(joinqual, econtext, false)) {
            node->nl_MatchedOuter = true;

            /* 在反连接中,我们永远不会返回匹配的元组 */
            if (node->js.jointype == JOIN_ANTI || node->js.jointype == JOIN_LEFT_ANTI_FULL) {
                node->nl_NeedNewOuter = true;
                continue; /* 返回到循环顶部 */
            }

            if (node->js.single_match) {
                node->nl_NeedNewOuter = true;
            }

            if (otherqual == NIL || ExecQual(otherqual, econtext, false)) {
                /*
                 * 限定条件满足,因此我们投影并返回包含结果元组的槽,使用ExecProject函数。
                 */
                ExprDoneCond is_done;

                ENL1_printf("限定条件满足,投影元组");

                TupleTableSlot* result = ExecProject(node->js.ps.ps_ProjInfo, &is_done);

                if (is_done != ExprEndResult) {
                    node->js.ps.ps_vec_TupFromTlist = (is_done == ExprMultipleResult);
                    /*
                     * 通过信息约束优化计划。
                     */
                    if (((NestLoop*)(node->js.ps.plan))->join.optimizable) {
                        node->nl_NeedNewOuter = true;
                    }

                    return result;
                }
            } else
                InstrCountFiltered2(node, 1);
        } else
            InstrCountFiltered1(node, 1);

        /*
         * 元组不符合限定条件,因此释放每个元组的内存并重试。
         */
        ResetExprContext(econtext);

        ENL1_printf("限定条件不满足,继续循环");
    }
}

  ExecNestLoop 函数的执行流程总结如下:

  1. 从输入参数 state 中获取 NestLoopState 结构体指针 node,以及与连接相关的一些信息,如连接条件外部计划内部计划等。
  2. 检查是否需要从前一个连接元组中投影出新的元组,如果需要,则执行投影操作。
  3. 重置每个元组内存上下文,以释放之前元组周期中分配的表达式评估存储空间。
  4. 如果需要在内部关系上执行物化操作,则执行物化操作。
  5. 进入主循环直到返回一个符合连接条件的连接元组或者结束连接操作
  6. 在主循环中,首先检查是否需要获取新的外部元组,如果需要,则获取新的外部元组,并在必要时重置内部扫描。如果没有更多的外部元组可用,则结束连接操作。
  7. 在获取新的外部元组后,获取任何必须传递给内部扫描的外部变量的值,并将其存储在适当的 PARAM_EXEC 槽中。然后,重新扫描内部计划
  8. 获取外部元组和内部元组后,测试它们是否满足连接条件和其他限定条件
  9. 如果连接元组满足条件,则进行投影操作,并返回结果元组;否则,继续主循环获取下一个内部元组
  10. 如果内部元组耗尽,则需要获取新的外部元组,然后继续主循环。

  以下是 Nest Loop 算子的伪代码:

for each tuple outer_tuple in outer_relation:
    for each tuple inner_tuple in inner_relation:
        if join_condition(outer_tuple, inner_tuple) is true:
            combine_tuples(outer_tuple, inner_tuple) as result_tuple
            output result_tuple

-- outer_relation 是外部关系表。
-- inner_relation 是内部关系表。
-- join_condition 是连接条件的函数,用于判断外部关系和内部关系的元组是否满足连接条件。
-- combine_tuples 是将外部关系和内部关系的元组组合成一个连接元组的函数。
-- output 是输出连接结果的操作。

ExecEndNestLoop 函数

  ExecEndNestLoop 函数的作用是关闭嵌套循环连接节点的扫描并释放分配的存储空间。具体功能包括释放表达式上下文清空元组表以及关闭子计划节点ExecEndNestLoop 函数源码如下所示:(路径:src\gausskernel\runtime\executor\nodeNestloop.cpp

/* ----------------------------------------------------------------
 *		ExecEndNestLoop
 *
 *		关闭扫描并释放分配的存储空间
 * ----------------------------------------------------------------
 */
void ExecEndNestLoop(NestLoopState* node)
{
    NL1_printf("ExecEndNestLoop: %s\n", "ending node processing"); // 输出节点处理结束信息

    /*
     * 释放表达式上下文
     */
    ExecFreeExprContext(&node->js.ps);

    /*
     * 清空元组表
     */
    (void)ExecClearTuple(node->js.ps.ps_ResultTupleSlot);

    /*
     * 关闭子计划
     */
    ExecEndNode(outerPlanState(node));
    ExecEndNode(innerPlanState(node));

    NL1_printf("ExecEndNestLoop: %s\n", "node processing ended"); // 输出节点处理结束信息
}

ExecReScanNestLoop 函数

  ExecReScanNestLoop 函数用于重新扫描 Nest Loop 运算符的状态,根据需要重新扫描外部和内部子计划节点,并设置相应的状态标志以准备下一次迭代的处理。如果外部子计划节点的参数未更改,则在第一个执行步骤时会自动重新扫描。在递归流模式下,需要重新扫描外部和内部计划节点。最后,函数还会设置状态标志,以指示下一个迭代周期需要获取新的外部元组,并确保内部计划节点不会在此处重新扫描。ExecReScanNestLoop 函数源码如下所示:(路径:src\gausskernel\runtime\executor\nodeNestloop.cpp

/* ----------------------------------------------------------------
 *		ExecReScanNestLoop
 * ----------------------------------------------------------------
 */
void ExecReScanNestLoop(NestLoopState* node)
{
    // 获取外部计划节点和内部计划节点
    PlanState* outer_plan = outerPlanState(node);
    PlanState* inner_plan = innerPlanState(node);
    PlanState ps = node->js.ps;

    /*
     * 如果外部计划节点的参数已经改变,则外部计划节点会在第一个 ExecProcNode 函数调用时自动重新扫描
     */
    if (outer_plan->chgParam == NULL)
        ExecReScan(outer_plan);

    /*
     * 在递归流条件下,需要重新扫描外部计划节点和内部计划节点
     */
    if (IS_PGXC_DATANODE && EXEC_IN_RECURSIVE_MODE(ps.plan) && ((ps.state)->es_recursive_next_iteration)) {
        ExecReScan(inner_plan);
        node->nl_MaterialAll = ((NestLoop*)ps.plan)->materialAll;
    }

    /*
     * 内部计划节点在每个新的外部元组中都会重新扫描,不应该从此处重新扫描,
     * 否则在使用外部变量作为运行时键时,会出现内部索引扫描的问题
     */
    node->js.ps.ps_vec_TupFromTlist = false;
    node->nl_NeedNewOuter = true;
    node->nl_MatchedOuter = false;
}

总结

  Nest Loop 算子的优势在于:

  1. 灵活性: 可以处理各种连接类型,包括内连接左连接右连接全连接
  2. 适用性: 对于小型数据集或者没有合适索引的情况下Nest Loop 可能是最有效的连接策略。
  3. 适用于复杂条件: 可以处理连接条件复杂无法使用索引的情况,因为它可以逐一检查每一对可能的连接。

  然而,Nest Loop 算子也有一些限制:

  1. 性能受限:大型数据集连接条件较复杂时Nest Loop 的性能可能会受到影响,因为它需要执行多次内部循环扫描
  2. 内存占用较高: 需要维护内部和外部循环的状态,可能导致内存占用较高
  3. 不适用于大型数据集:数据集较大时Nest Loop 的性能通常不佳,因为它需要在每次外部循环迭代中扫描整个内部数据集。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1478396.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

git忽略某些文件(夹)更改说明

概述 在项目中,常有需要忽略的文件、文件夹提交到代码仓库中,在此做个笔录。 一、在项目根目录内新建文本文件,并重命名为.gitignore,该文件语法如下 # 以#开始的行,被视为注释. # 忽略掉所有文件名是 a.txt的文件. a.txt # 忽略所有生成的 java文件, *.java # a.j…

Spring八股 常见面试题

什么是Spring Bean 简单来说,Bean 代指的就是那些被 IoC 容器所管理的对象。我们需要告诉 IoC 容器帮助我们管理哪些对象,这个是通过配置元数据来定义的。配置元数据可以是 XML 文件、注解或者 Java 配置类。 将一个类声明为 Bean 的注解有哪些? Com…

代码异常处理

一、异常格式 错误堆栈信息的格式大致如下: 第一行包含了错误类型(Exception或Error)和错误描述。 从第二行开始,每一行都表示一个调用栈帧(Stack Frame),包含了类名、方法名和代码行号。二、…

c++阶梯之模板初阶

1. 泛型编程 void Swap(int& x, int& y) {int tmp x;x y;y tmp; }void Swap(double& x, double& y) {double tmp x;x y;y tmp; }void Swap(char& x, char& y) {char tmp x;x y;y tmp; } int main() {int a 10, b 20;double c 1.1, d 2.2…

【Intel oneAPI实战】使用英特尔套件解决杂草-农作物检测分类的视觉问题

目录 一、简介:计算机视觉挑战——检测并清除杂草二、基于YOLO的杂草-农作物检测分类2.1、YOLO简介2.2、基于YOLO的杂草-农作物检测分类解决方案 三、基于YOLO的杂草-农作物检测分类系统设计3.1、基于flask框架的demo应用程序后端3.2、基于Vue框架的demo应用程序前端…

MySQL学习Day23——索引优化与查询优化

SQL查询优化的技术有很多,大方向可分为物理查询优化和逻辑查询优化 物理查询优化:通过索引和表连接方式等技术来进行优化; 逻辑查询优化:通过SQL等价变换提升查询效率 一、索引失效案例: 是否使用索引是由优化器决定,优化器基于cost开销而不是规则和…

网络编程:基于TCP和UDP的服务器、客户端

1.基于TCP通信服务器 程序代码&#xff1a; 1 #include<myhead.h>2 #define SER_IP "192.168.126.121"//服务器IP3 #define SER_PORT 8888//服务器端口号4 int main(int argc, const char *argv[])5 {6 //1.创建用于监听的套接字7 int sfd-1;8 sf…

Scaled Dot-Product Attention

Scaled Dot-Product Attention flyfish Attention ( Q , K , V ) softmax ( Q K T d k ) V {\text{Attention}}(Q, K, V) \text{softmax}\left(\frac{QK^{T}}{\sqrt{d_k}}\right)V Attention(Q,K,V)softmax(dk​ ​QKT​)V import torch import torch.nn as nn import torc…

源码框架-​1.Spring底层核心原理解析

目录 Spring中核心知识点: Bean的创建过程 推断构造方法 AOP大致流程 Spring事务 Spring中核心知识点: Bean的生命周期底层原理依赖注入底层原理初始化底层原理推断构造方法底层原理AOP底层原理Spring事务底层原理 ps:这篇文章中都只是大致流程&#xff0c;后续会针对每…

【vuex之五大核心概念】

vuex:五大核心概念 一、state状态1.state的含义2.如何访问以及使用仓库的数据&#xff08;1&#xff09;通过store直接访问获取store对象 &#xff08;2&#xff09;通过辅助函数MapState 二、mutations1.作用2.严格模式3.操作流程定义 mutations 对象&#xff0c;对象中存放修…

IEEE Transactions on Industrial Electronics工业电子TIE修改稿注意事项及提交须知

一、背景 兔年末投了一篇TIE&#xff0c;手稿初次提交的注意事项也整理成了博客IEEE Transactions on Industrial Electronics工业电子TIE论文投稿须知&#xff0c;获得了许多点赞和收藏。最近也收到了审稿结果&#xff0c;给的意见是大修major revision&#xff0c;总之只要不…

FinalShell连接Linux

远程连接linux 我们使用VMware可以得到Linux虚拟机&#xff0c;但是在/Mware中操作Linux的命令行页面不太方便&#xff0c;主要是: 内容的复制、粘贴跨越VMware不方便 文件的上传、下载跨越VMware不方便 不方便也就是和Linux系统的各类交互&#xff0c;跨越VMwar 到Linux操作系…

vue a-table 实现指定字段相同数据合并行

vue a-table 实现相同数据合并行 实现效果代码实现cloums数据格式数据源格式合并代码 实现效果 代码实现 cloums数据格式 const getColumns function () {return [{title: "分类",dataIndex: "checked",width: "150px",customRender: (text, …

外贸贸易术语FCA是什么?

在国际贸易实践中&#xff0c;FOB是最早应用于国际贸易的术语之一&#xff0c;一直以来都是使用比例最高的贸易术语。但近年来又一匹“黑马”脱颖而出——“FCA”术语。 01 概念和应用 《Incoterms2020》将11个贸易术语分为适用于任何运输方式或多种运输方式和适用于海运和内…

k8s部署 多master节点负载均衡以及集群高可用

一、k8s 添加多master节点实验 1、master02节点初始化操作 2、在master01节点基础上&#xff0c;完成master02节点部署 ①从master01节点复制所需要的文件 需要从master01节点复制etcd数据库所需要的ssl证书、kubernetes安装目录&#xff08;二进制文件、组件与apiserver通信…

面试官:谈一谈Cookie和Session的区别?

我先解释一下Cookie&#xff0c;它是客户端浏览器用来保存服务端数据的一种机制&#xff0c;当我们通过浏览器去进行网页访问的时候&#xff0c;服务器可以把一些状态数据以key-value的形式写入到Cookie里面&#xff0c;存储到客户端浏览器。下一次这个浏览器再访问服务器的时候…

DPU是什么?

问题描述&#xff1a; DPU是什么&#xff1f; 解答&#xff1a; DPU&#xff08;Data Processing Unit&#xff09;是以数据为中心构造的专用处理器&#xff0c;采用软件 定义技术路线支撑基础设施层资源虚拟化&#xff0c;支持存储、安全、服务质量管理等 基础设施层服务。…

【vmware安装群晖】

vmware安装群晖 vmware安装群辉&#xff1a; vmware版本&#xff1a;17pro 下载链接&#xff0c; https://customerconnect.vmware.com/cn/downloads/details?downloadGroupWKST-1751-WIN&productId1376&rPId116859 激活码可自行搜索 教程&#xff1a; https://b…

云时代【4】—— 资源隔离与控制技术

云时代【4】—— 资源隔离与控制技术 二、资源隔离与控制技术&#xff08;一&#xff09;NameSpace1. 基本介绍2. 相关 Linux 指令实战1&#xff1a;隔离进程实战2&#xff1a;隔离文件系统 &#xff08;二&#xff09;CGroups1. 基本介绍2. 相关 Linux 指令实战1&#xff1a;c…

sora技术报告阅读

sora是一个在可变持续时间、分辨率和宽高比的视频和图像上联合训练文本条件扩散模型。 需要将所有类型的视觉数据转化为统一表示的方法&#xff0c;使得能够对生成模型进行大规模训练。 Sora是一个通用的视觉数据模型&#xff0c;它可以生成不同持续时间、宽高比和分辨率的视…