干爆源码系列之Step by step lldb/gdb调试多线程

news2025/1/11 10:05:40

Step by step lldb/gdb调试多线程


0.叙谈1.断点分析2.多线程切换    2.1 并发队列        2.1.1 两次入队    2.2 线程调度        2.2.1 执行build端子MetaPipeline            2.2.1.1 Thread6调度第一个PipelineInitializeTask            2.2.1.2 Thread7调度第二个PipelineInitializeTask            2.2.1.3 Thread8调度build端PipelineEvent        2.2.2 执行下一个Metapipeline

书接上回,我们分析了InitializeInternal的ScheduleEvents函数,了解了如何从MetaPipeline构建各种Event事件,上一节中还提到在最终会进行调度,对无依赖节点发起Schedule(),那么本节就继续这一内容,详细从多线程角度看看这些Event对应的Task如何被调度的呢?

本节将会从lldb/gdb角度Step by step断点调试分析多线程如何玩转task执行。

cad3dc12681c1078b6b26bacbe23a11c.png

7fa4db8985a6e9473ef84de5ecbf1764.png

0.叙谈

下面展示了一段无依赖的事件调度,初始化阶段会循环所有events,找到无依赖的event,并发起Schedule(),这里的event是PipelineInitializeEvent,两个MetaPipline各自一个,按照顺序入并发队列,接下来详细聊聊如何调试以及具体怎么调度多任务的呢?

for (auto &event : events) {
  if (!event->HasDependencies()) {
    event->Schedule();
  }
}

1.断点分析

下面是本次调试的断点list,每个都break一下便可以快速学习了。

  • Enqueue函数

Task入队的函数。

b task_scheduler.cpp:47

  • ExecuteForever函数

线程从队列中获取Task的函数。

b task_scheduler.cpp:135

打上这两个断点后,就可以调试多线程了。

  • Event::CompleteDependency函数

处理事件依赖关系,能够定位当前线程处理了哪些event。

  • Event::Finish函数

能够知道当前事件的依赖有哪些,下一步处理哪一个,这个跟上面的函数一起用。

2.多线程切换

2.1 并发队列

初始化时,当调用Schedule()后,会把PipelineInitializeTask放入并发队列中,见下图的queue(蓝色部分)。

089b673c4ec85cce4755312f4d3a9be3.png

2.1.1 两次入队

1)入队第一个PipelineInitializeTask

* thread #1, queue = 'com.apple.main-thread', stop reason = breakpoint 9.1
    frame #0: 0x00000001160be794 duckdb`duckdb::ConcurrentQueue::Enqueue(this=0x0000616000000680, token=0x00006070000414e0, task=std::__1::shared_ptr<duckdb::Task>::element_type @ 0x000060600007cb20 strong=1 weak=2) at task_scheduler.cpp:47:8
   44   
   45   void ConcurrentQueue::Enqueue(ProducerToken &token, shared_ptr<Task> task) {
   46    lock_guard<mutex> producer_lock(token.producer_lock);
-> 47    if (q.enqueue(token.token->queue_token, std::move(task))) {
   48     semaphore.signal();
   49    } else {
   50     throw InternalException("Could not schedule task!");
(lldb) p task.get()
(duckdb::PipelineInitializeTask *) $126 = 0x000060600007cb20
(lldb) p ((duckdb::PipelineInitializeTask *)task.get())->event->PrintPipeline()

此时在sql终端输出的pipeline为:

┌───────────────────────────┐
│      RESULT_COLLECTOR     │
└─────────────┬─────────────┘                             
┌─────────────┴─────────────┐
│         PROJECTION        │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│            name           │
│           score           │
└─────────────┬─────────────┘                             
┌─────────────┴─────────────┐
│         HASH_JOIN         │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           INNER           │
│        stu_id = id        │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           EC: 4           │
│          Cost: 4          │
└─────────────┬─────────────┘                             
┌─────────────┴─────────────┐
│         SEQ_SCAN          │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           score           │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           stu_id          │
│           score           │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           EC: 4           │
└───────────────────────────┘

2)入队第二个PipelineInitializeTask

(lldb) c
Process 23807 resuming
Process 23807 stopped
* thread #1, queue = 'com.apple.main-thread', stop reason = breakpoint 9.1
    frame #0: 0x00000001160be794 duckdb`duckdb::ConcurrentQueue::Enqueue(this=0x0000616000000680, token=0x00006070000414e0, task=std::__1::shared_ptr<duckdb::Task>::element_type @ 0x000060600007d300 strong=1 weak=2) at task_scheduler.cpp:47:8
   44   
   45   void ConcurrentQueue::Enqueue(ProducerToken &token, shared_ptr<Task> task) {
   46    lock_guard<mutex> producer_lock(token.producer_lock);
-> 47    if (q.enqueue(token.token->queue_token, std::move(task))) {
   48     semaphore.signal();
   49    } else {
   50     throw InternalException("Could not schedule task!");
(lldb) p task.get()
(duckdb::PipelineInitializeTask *) $127 = 0x000060600007d300
(lldb) p ((duckdb::PipelineInitializeTask *)task.get())->event->PrintPipeline()

此时的pipeline为:

┌───────────────────────────┐
│         HASH_JOIN         │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           INNER           │
│        stu_id = id        │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           EC: 4           │
│          Cost: 4          │
└─────────────┬─────────────┘                             
┌─────────────┴─────────────┐
│         SEQ_SCAN          │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│          student          │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│             id            │
│            name           │
│   ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           EC: 3           │
└───────────────────────────┘

2.2 线程调度

2.2.1 执行build端子MetaPipeline

2.2.1 Thread6调度第一个PipelineInitializeTask

继续c之后,可以看到出队,第一个PipelineInitializeTask出来了,会发现被thread 6调度。

* thread #6, stop reason = breakpoint 8.1
    frame #0: 0x00000001160c19cc duckdb`duckdb::TaskScheduler::ExecuteForever(this=0x000060c000000280, marker=0x0000602000003fb0) at task_scheduler.cpp:135:26
   132    // wait for a signal with a timeout
   133    queue->semaphore.wait();
   134    if (queue->q.try_dequeue(task)) {
-> 135     auto execute_result = task->Execute(TaskExecutionMode::PROCESS_ALL);
   136  
   137     switch (execute_result) {
   138     case TaskExecutionResult::TASK_FINISHED:
(lldb) p task.get()
(duckdb::PipelineInitializeTask *) $128 = 0x000060600007cb20

此时会调用ExecuteTask,里面会FinishTask()。

event->FinishTask();

而FinishTask表示我完成了当前event的事情,接着处理父节点,由于由两个依赖,所以不会进行Schedule()。

(lldb) p total_dependencies
(duckdb::idx_t) $129 = 2

只有当满足下面条件时才会Schedule(),所以这个线程任务完成了,只处理了PipelineInitializeTask。

if (current_finished == total_dependencies) {
  // all dependencies have been completed: schedule the event
  D_ASSERT(total_tasks == 0);
  Schedule();
  if (total_tasks == 0) {
    Finish();
  }
}
2.2.2 Thread7调度第二个PipelineInitializeTask

随后切到另外一个线程,此时处理的是右侧build端的pipeline,可以看到获取到的是队列当中的第二个PipelineInitializeTask,此时线程是7号线程。

* thread #7, stop reason = breakpoint 17.1
(lldb) f 2
frame #2: 0x00000001161d8910 duckdb`duckdb::PipelineInitializeTask::ExecuteTask(this=0x000060600007d300, mode=PROCESS_ALL) at pipeline_initialize_event.cpp:23:10
   20   public:
   21    TaskExecutionResult ExecuteTask(TaskExecutionMode mode) override {
   22     pipeline.ResetSink();
-> 23     event->FinishTask();
   24     return TaskExecutionResult::TASK_FINISHED;
   25    }
   26   };
(lldb) p this
(duckdb::PipelineInitializeTask *) $130 = 0x000060600007d300

此时取PipelineInitializeTask的父亲,也就是右侧build端PipelineEvent,由于只有一个依赖,直接调度了,此时会放入队列中,当前线程完成任务,继续等待。

* thread #7, stop reason = breakpoint 9.1
    frame #0: 0x00000001160be794 duckdb`duckdb::ConcurrentQueue::Enqueue(this=0x0000616000000680, token=0x00006070000414e0, task=std::__1::shared_ptr<duckdb::Task>::element_type @ 0x00006060000462e0 strong=1 weak=2) at task_scheduler.cpp:47:8
   44   
   45   void ConcurrentQueue::Enqueue(ProducerToken &token, shared_ptr<Task> task) {
   46    lock_guard<mutex> producer_lock(token.producer_lock);
-> 47    if (q.enqueue(token.token->queue_token, std::move(task))) {
   48     semaphore.signal();
   49    } else {
   50     throw InternalException("Could not schedule task!");
2.2.3 Thread8调度build端PipelineEvent

c之后,可以看到又切到了另一个线程,此时出队,拿到上一个入队的PipelineEvent。

* thread #8, stop reason = breakpoint 8.1
    frame #0: 0x00000001160c19cc duckdb`duckdb::TaskScheduler::ExecuteForever(this=0x000060c000000280, marker=0x00006020000040b0) at task_scheduler.cpp:135:26
   132    // wait for a signal with a timeout
   133    queue->semaphore.wait();
   134    if (queue->q.try_dequeue(task)) {
-> 135     auto execute_result = task->Execute(TaskExecutionMode::PROCESS_ALL);
   136  
   137     switch (execute_result) {
   138     case TaskExecutionResult::TASK_FINISHED:
(lldb) p task.get()
(duckdb::PipelineTask *) $132 = 0x00006060000462e0

可以对比这个地址与上述的线程7号放入的task地址一样。

那么接着调度,我们可以看到依次处理了PipelineFinishEvent->PipelineCompleteEvent->PipelineEvent(HashJoin对应event)。

(lldb) p this
(duckdb::PipelineFinishEvent *) $134 = 0x000060e00002fb58
(lldb) p this
(duckdb::PipelineCompleteEvent *) $135 = 0x000060d0000028f8
(lldb) p this
(duckdb::PipelineEvent *) $137 = 0x000060e00002f6f8

这两个Event的Schedule()时空实现,没有入队操作,所以直接调度即可,而PipelineEvent实现了Schedule(),所以会放入队列,可以看到进入了入队断点:

* thread #8, stop reason = breakpoint 9.1
    frame #0: 0x00000001160be794 duckdb`duckdb::ConcurrentQueue::Enqueue(this=0x0000616000000680, token=0x00006070000414e0, task=std::__1::shared_ptr<duckdb::Task>::element_type @ 0x0000606000080660 strong=1 weak=2) at task_scheduler.cpp:47:8
   44   
   45   void ConcurrentQueue::Enqueue(ProducerToken &token, shared_ptr<Task> task) {
   46    lock_guard<mutex> producer_lock(token.producer_lock);
-> 47    if (q.enqueue(token.token->queue_token, std::move(task))) {
   48     semaphore.signal();
   49    } else {
   50     throw InternalException("Could not schedule task!");

2.2.2 执行下一个Metapipeline

此时切回主线程thread 1,执行下一个MetaPipeline,可以看到Executor::ExecuteTask()的completed_pipelines已经为1,说明前面的ChildMetaPipeline已经finish了,并且从队列中拿到了上面的PipelineTask。

PendingExecutionResult Executor::ExecuteTask() {
 while (completed_pipelines < total_pipelines) {
  // there are! if we don't already have a task, fetch one
  if (!task) {
   scheduler.GetTaskFromProducer(*producer, task);  // 队列中获取任务
  }
  if (task) {
   auto result = task->Execute(TaskExecutionMode::PROCESS_PARTIAL);
  }
 }
 return execution_result;
}

debug信息:

(lldb) p completed_pipelines
(std::atomic<unsigned long long>) $142 = {
  Value = 1
}
(lldb) p total_pipelines
(duckdb::idx_t) $143 = 2
(lldb) p task
(std::shared_ptr<duckdb::Task>) $147 = std::__1::shared_ptr<duckdb::Task>::element_type @ 0x0000606000080660 strong=1 weak=3 {
  __ptr_ = 0x0000606000080660
}

接下来要做的就是调度另外一个MetaPipeline,依次分别是:PipelieEvent(probe端)->PipelineFinishEvent->PipelineCompleteEvent->PipelieEvent(hashjoin->project->result的event)。

* thread #1, queue = 'com.apple.main-thread', stop reason = breakpoint 9.1
    frame #0: 0x00000001160be794 duckdb`duckdb::ConcurrentQueue::Enqueue(this=0x0000616000000680, token=0x00006070000414e0, task=std::__1::shared_ptr<duckdb::Task>::element_type @ 0x000060600007e320 strong=1 weak=2) at task_scheduler.cpp:47:8
   44   
   45   void ConcurrentQueue::Enqueue(ProducerToken &token, shared_ptr<Task> task) {
   46    lock_guard<mutex> producer_lock(token.producer_lock);
-> 47    if (q.enqueue(token.token->queue_token, std::move(task))) {
   48     semaphore.signal();
   49    } else {
   50     throw InternalException("Could not schedule task!");

随后另一个线程继续出队列调度任务,依次在该线程上经历PipelieEvent->PipelineFinishEvent->PipelineCompleteEvent。

* thread #9, stop reason = breakpoint 8.1
    frame #0: 0x00000001160c19cc duckdb`duckdb::TaskScheduler::ExecuteForever(this=0x000060c000000280, marker=0x0000602000004130) at task_scheduler.cpp:135:26
   132    // wait for a signal with a timeout
   133    queue->semaphore.wait();
   134    if (queue->q.try_dequeue(task)) {
-> 135     auto execute_result = task->Execute(TaskExecutionMode::PROCESS_ALL);
   136  
   137     switch (execute_result) {
   138     case TaskExecutionResult::TASK_FINISHED:

最后这个线程完成继续等待信号。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/673601.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TypeScript 数据联合类型的解读

概念&#xff1a; 联合类型&#xff08;Union Types&#xff09;表示取值可以为多种类型中的一种&#xff0c;或者也可以理解将多个类型合并为一个类型对变量进行注解。 语法结构&#xff1a; 联合类型使用 | 分隔每个类型。 let 变量&#xff1a;类型1 | 类型2 | 类型3… 案列…

基于Java校园代购服务订单系统设计实现(源码+lw+部署文档+讲解等)

博主介绍&#xff1a; ✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战 ✌ &#x1f345; 文末获取源码联系 &#x1f345; &#x1f447;&#x1f3fb; 精…

你的前端技术是否能通过这些高频面试题?

文章目录 1.储存了某个数据到 localStorage&#xff0c;立即进行 localStorage.getItem&#xff0c;能否取到值&#xff1f;2.实现异步的方式有几种3.异步不阻塞4.选择 div 的第二个子元素5.display: none 和 visibility: hidden 的区别6.如果想要让一个元素的宽高包含元素的 b…

【初识C语言】选择语句+循环语句+函数+数组

文章目录 前言1. 选择语句2. 循环语句3. 函数4. 数组 前言 C语言是一门结构化的程序设计语言 顺序结构&#xff1b; 选择结构&#xff1b; 循环结构。 1. 选择语句 生活中处处面临着选择&#xff0c;如果你好好学习&#xff0c;校招时拿一个好offer&#xff0c;走上人生巅峰。…

关于程序员的工作总结

程序员工作总结篇1 从我x月x日进入公司到现在已经过去一年了&#xff0c;从一名刚刚结束实习的学生到一名独立的开发人员&#xff0c;角色改变了&#xff0c;职责也改变了。虽然已经预计了工作之中会有很多困难&#xff0c;可是在实际的项目开发中&#xff0c;自己所遇到远远不…

(超级详细)如何在Mac OS上的VScode中配置OpenGL环境并编译

文章目录 安装环境下载GLAD与GLFW一、下载GLAD二、下载GLFW 项目结构配置测试程序与项目的编译测试可执行文件HelloGL 安装环境 机器&#xff1a;macbook air 芯片&#xff1a; M1芯片&#xff08;arm64&#xff09; macOS&#xff1a;macOS Ventura 13.4 VScode version&#…

Pytorch数据类型Tensor张量操作(操作比较全)

文章目录 Pytorch数据类型Tensor张量操作一.创建张量的方式1.创建无初始化张量2.创建随机张量3.创建初值为指定数值的张量4.从数据创建张量5.生成等差数列张量 二.改变张量形状三.索引四.维度变换1.维度增加unsqueeze2.维度扩展expand3.维度减少squeeze4.维度扩展repeat 五.维度…

SpringCloud Alibaba入门5之使用OpenFegin调用服务

我们继续在上一章的基础上进行开发 SpringCloud Alibaba入门4之nacos注册中心管理_qinxun2008081的博客-CSDN博客 Feign是一种声明式、模板化的HTTP客户端。使用Feign&#xff0c;可以做到声明式调用。Feign是在RestTemplate和Ribbon的基础上进一步封装&#xff0c;使用RestT…

SAP从入门到放弃系列之BOM行项目-虚拟装配-Part4

文章目录 虚拟组件&#xff08;Phantom assemblies&#xff09;&#xff1a;作用&#xff1a;BOM中虚拟件维护的方式&#xff1a; 物料主数据维度BOM组件维度&#xff08;数据优先级最高&#xff09; BOM组件的展开类型&#xff1a;BOM组件的特殊采购类数据测试示例&#xff1…

基于open62541库的OPC UA协议节点信息查询及多节点数值读写案例实践

目录 一、OPC UA协议简介 二、open62541库简介 三、 opcua协议的多点查询、多点读写案例服务端opcua_server 3.1 opcua_server工程目录 3.2 程序源码 3.3 工程组织文件 3.4 编译及启动 四、opcua协议的多点查询、多点读写案例客户端opcua_client 4.1 opcua_client工程目录 4…

医院管理系统源码PACS超声科室源码DICOM影像工作站

一、医学影像系统&#xff08;PACS&#xff09;是一种应用于医院影像科室的系统&#xff0c;主要任务是将日常产生的各种医学影像&#xff08;如核磁、CT、超声、X光机、红外仪、显微仪等设备产生的图像&#xff09;通过各种接口&#xff08;模拟、DICOM、网络&#xff09;以数…

社区活动 | OpenVINO™ DevCon 中国系列工作坊第二期 | 使用 OpenVINO™ 加速生成式 AI...

生成式 AI 领域一直在快速发展&#xff0c;许多潜在应用随之而来&#xff0c;这些应用可以从根本上改变人机交互与协作的未来。这一最新进展的一个例子是 GPT 模型的发布&#xff0c;它具有解决复杂问题的能力&#xff0c;比如通过医学和法律考试这种类似于人类的能力。然而&am…

Android Studio实现推箱子小游戏

项目目录 一、项目概述二、开发环境三、详细设计四、运行演示五、项目总结 一、项目概述 推箱子是一款非常受欢迎的益智游戏&#xff0c;游戏的玩法简单&#xff0c;但是需要玩家具备一定的逻辑思维能力和空间感知能力&#xff0c;因此深受广大玩家的喜爱。在游戏中&#xff0…

正点原子F4HAL库串口中断再解读

七步走&#xff0c;参考usart.c文件 void HAL_UART_MspInit(UART_HandleTypeDef *huart) 这个函数进行了&#xff08;1&#xff09;、&#xff08;2&#xff09;、&#xff08;3&#xff09;、&#xff08;5&#xff09;中的使能中断 void uart_init(u32 bound)函数进行了&…

『手撕 Mybatis 源码』07 - Proxy 对象创建

Proxy 对象创建 问题 sqlSession.getMapper(UserMapper.class) 是如何生成的代理对象&#xff1f; Mapper 代理方式初始化完成后&#xff0c;下一步进行获取代理对象来执行 public class MybatisTest {/*** 问题2&#xff1a;sqlSession.getMapper(UserMapper.class); 是如…

EMC学习笔记(五)传输线模型及反射、串扰

1.概述 在高速数字电路PCB设计中&#xff0c;当布线长度大于20分之一波长或信号延时超过6分之一信号上升沿时&#xff0c;PCB布线可被视为传输线。传输线有两种类型:微带线和带状线。与EMC设计有关的传输线特性包括:特征阻抗、传输延迟、固有电容和固有电感。反射与串扰会影响…

2023年第1季社区Task挑战赛贡献者榜单

基于数字身份凭证的业务逻辑设计&#xff0c;贡献了发放数字身份凭证的参考实现&#xff1b;提供企业碳排放、慈善公益等智能合约库业务场景案例&#xff1b;体验最新发布的WeCross-BCOS3-Stub&#xff0c;跟社区核心开发者碰撞想法并给出自己的见解……这些精彩贡献展现出社区…

<C++项目>高并发内存池

项目介绍&#xff1a; 原型是goole的开源项目tcmalloc(全称:Thread-Caching Malloc),用于替代系统的内存分配相关的函数(malloc, free).知名度非常高。 项目要求知识储备和难度&#xff1a; 会用到C/C、数据结构(链表、哈希桶)、操作系统内存管理、单例模式、多线程、互斥锁等等…

设计模式—“行为变化”

在组件构建过程中,组件行为的变化经常导致组件本身剧烈的变化。“行为变化”模式将组件的行为和组件本身进行解耦,从而支持组件行为的变化,实现两者之间的松耦合。 典型模式有:Command、Visitor 一、Command 动机 在软件构建过程中,"行为请求者"与“行为实现…

看完这篇,立马看懂理想首款纯电MEGA

作者 | 马波编辑 | 德新 6月17日&#xff0c;理想召开了首届家庭科技日活动。 这场打着家庭幌子的科技发布会&#xff0c;信息密度高到有些超出预期。但是看完这场发布会&#xff0c;理想超级旗舰车型 W01&#xff0c;也就是同时在本场发布会公布名称的理想MEGA&#xff0c;它…