spark ui 指南

news2025/1/23 13:59:29

spark ui 指南

  • 1.sparkUI 基本介绍
  • 2.jobs页面
  • 3.stages 页面
  • 4.storage 页面
  • 5.environment 页面
  • 6.ececutor 页面
  • 7 sql 页面 

spark  ui 是反应一个spark 作业执行情况的页面,通过查看作业的执行情况,分析作业运行的状态.

1.sparkUI 基本介绍

进入运行主页面如下,主要有6各部分   任务实例: http://10.71.190.31:18081/history/application_1638893170232_266874/jobs/

    

 

标签页

描述

1

jobs

spark作业执行的job

2

stages

所有stage信息

The Stages tab displays a summary page that shows the current state of all stages of all jobs in the Spark application.

3

storage

rdd存储信息

RDDs and DataFrame持久化

4

environment

作业配置参数

JVM, Spark, and system 属性

5

executors

展示作业executors信息

任务executor创建信息, 包括 内存 ,磁盘使用 ,task ,shuffle信息)

6

sql

解析sql 的信息

2.jobs页面

本次任务有14个job

2.1 event_time 

按照时间顺序executor 的开始和结束时间点(added, removed)

2.2 job tab页面

   每个job的信息包括 job id, description描述 ,  提交时间, 耗时, stages数量, task 运行情况

   

2.3 job详情页面

点击job 描述可以进入对应的job详情页面

  • Status: SUCCEEDED                                 (running, succeeded, failed)
  • Submitted: 2021/12/14 11:48:06
  • Duration: 1.5 min
  • Associated SQL Query: 2                        job 的sql tab 连接
  • Completed Stages: 1                               每个状态的stage 数量 (active, pending, completed, skipped, failed)
  • Skipped Stages: 8 

 Event Timeline
 DAG Visualization   :     job 的有向无环图, 点表示:  RDDs or DataFrames   边表示: rdd上的操作

stage根据active, pending, completed, skipped, and failed状态分类的列表

input : 从storage 读取字节数

output: 写入storage 字节数

shuffle read : shuffle 和 记录读取的字节数, 包括 本地数据读取和其他executor 节点读取字节数

shuffle write : 写入磁盘的字节和记录数,在下一个stage的shuffle 阶段读取.

注意看到stage 19-24 是 跳过了, 原因是spark shuffle 的数据会写到磁盘固化,当上游当上游stage(19-24)和之前执行过的stage 相同时,可以直接用之前的结果.

问题 :从图可以看出job之间是否可以并行?

3.stages 页面

3.1  stages 页面会显示作业所有的stage信息,   同样根据状态分组(active, pending, completed, skipped, and failed)

3.2 Stage detail

   所有task 的总时间,  统计矩阵, shuffle 信息, 所属的job id 

dag图上 展示一些操作名称:  BatchScan, WholeStageCodegen, Exchange, etc

task 之间是否可以并行?

4.storage 页面

作业执行过程中缓存信息,包含 rdd 的大小和分部信息

运行时显示,但是B站的spark ui 点了没反应

5.environment 页面

作业运行环境和参数

查看 driver 和 executor 实际配置的大小

driver=6g executor=9g

6.ececutor 页面

作业包含的executor统计指标

正在运行中的任务有 thread dump ,跟踪task 的执行过程,  目前只能点开 driver 的节点, executor 节点 点击不开.

7 sql 页面 

spark SQL 的执行情况, 一条sql 在spark 中如何执行. 但是B站的spark ui 点了没反应,需要从另外的入口进去, associated sql query 点击

detail 展示sql 在sqprk 中解析和优化的,B站的这一模块只展示了 3和4 部分

1.analysis   2.logical  optimization   3. physical planing 4. code generation

问题

1.job driver executor  task  关系

   物理划分: client 提交→ appmaster  申请资源启动 → driver 启动→ executor启动 → code 执行 → 资源回收释放

   逻辑划分 action → job → stage → task

2.判断任务倾斜

运行时间长? 

参考链接:

1.官网:  https://spark.apache.org/docs/3.2.0/web-ui.html#stages-tab

2. spark 入门  https://www.cnblogs.com/xing901022/p/6445254.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1054313.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

毛玻璃跟随鼠标移动

效果展示 页面结构组成 从上述的效果图可以看出&#xff0c;此页面的布局比较简单&#xff0c;采用常规的布局就可以实现 CSS / JavaScript 知识点 backdrop-filter 属性回顾mousemove 事件 实现页面布局 <section><h2>Frosted Glass</h2><div class…

【STL】用一棵红黑树封装map和set

⭐博客主页&#xff1a;️CS semi主页 ⭐欢迎关注&#xff1a;点赞收藏留言 ⭐系列专栏&#xff1a;C进阶 ⭐代码仓库&#xff1a;C进阶 家人们更新不易&#xff0c;你们的点赞和关注对我而言十分重要&#xff0c;友友们麻烦多多点赞&#xff0b;关注&#xff0c;你们的支持是我…

独立按键控制LED亮灭、独立按键控制LED状态、独立按键控制LED显示二进制、独立按键控制LED移位——“51单片机”

各位CSDN的uu们你们好呀&#xff0c;今天依旧是小雅兰的51单片机的内容&#xff0c;内容主要是&#xff1a;独立按键控制LED亮灭、独立按键控制LED状态、独立按键控制LED显示二进制、独立按键控制LED移位&#xff0c;下面&#xff0c;让我们进入51单片机的世界吧&#xff01;&a…

【探索排序算法的魅力:优化、性能与实用技巧】

本章重点 排序的概念及其运用 常见排序算法的实现 排序算法复杂度及稳定性分析 1.排序的概念及其运用 1.1排序的概念 排序&#xff1a;所谓排序&#xff0c;就是使一串记录&#xff0c;按照其中的某个或某些关键字的大小&#xff0c;递增或递减的排列起来的操作。 稳定性…

Edge扩展插件推荐专业视频下载器

专业视频下载器&#xff0c;这款扩展插件非常好用&#xff0c;强烈推荐。只要能打开的视频&#xff0c;都能下载。 安装完成是这样的&#xff1a; 有用记得点赞。

编程前置:怎么知道一句话的重点?

怎么知道一句话的重点&#xff1f; <small> 之所以要这个问题&#xff0c;是因为① 对标题进行分词 ② 找到标题中的重点词 ③ 然后找到主题中唯一的词语 ④ 然后对这个词语进行绘图说和看&#x1f440;来看&#x1f440;去&#xff0c;也就是文字成图的步骤啦&#xff…

Linux作业2

Linux中的 stdin 、stderr、stdout分别是什么意思 在 Linux 中&#xff0c;stdin、stdout 和 stderr 是标准的输入、标准的输出和标准的错误的缩写&#xff0c;它们是与终端相关联的默认文件描述符&#xff0c;用于处理输入和输出。以下是它们的详细含义&#xff1a; stdin&am…

日期范围搜索

1.日期范围选择界面 <?xml version"1.0" encoding"utf-8"?> <ScrollViewandroid:layout_width"fill_parent"android:layout_height"fill_parent"xmlns:android"http://schemas.android.com/apk/res/android">…

构建一个TypeScript环境的node项目

本文 我们用一种不太一样的方式来创建项目 这里 我们事先创建了一个文件夹作为项目目录 然后打开项目终端 输入 npm init然后 在新弹出的对话框中 大体就是 名字随便写一个 然后 后面的回车&#xff0c;到最后一个输入 yes 然后回车 这样 我们就有一个基础的 node项目结构了…

Alibaba Cloud Linux 3安装Docker

出现以上报错&#xff0c;进行以下操作&#xff1a; cd /etc/yum.repos.d/ rm -rf docker-ce.repo 然后进行docker安装&#xff08;以社区版为例&#xff09; 1.添加docker-ce的dnf源 dnf config-manager --add-repohttps://mirrors.aliyun.com/docker-ce/linux/centos/do…

CCC数字钥匙设计【NFC】 --车主配对流程介绍

1、车主配对流程介绍 车主配对流程可以通过车内NFC进行&#xff0c;若支持UWB测距&#xff0c;也可以通过蓝牙/UWB进行&#xff0c;本文主要介绍通过NFC进行车主配对的流程。 整个配对流程相对较为复杂&#xff0c;本文主要梳理整体的步骤流程&#xff0c;其中的每个细节流程未…

Linux——补充点(进程切换及页表映射)

目录 补充点1&#xff1a;进程地址空间堆区管理 补充点2&#xff1a;Linux内核进程上下文切换 补充点3&#xff1a;页表映射 补充点4&#xff1a;两级页表 补充点1&#xff1a;进程地址空间堆区管理 Linux内核通过一个被称为进程描述符的task_struct结构体来管理进程&#…

fashion_mnist.load_data()出现[winError 10054] 远程主机强迫关闭了一个现有的连接解决方法

我已经解决完了&#xff0c;之前错误大概是下载超时失败&#xff0c;国外资源嘛&#xff0c;懂得读懂&#xff0c;一般这种情况&#xff0c;两种解决思路&#xff1a;第一种搭个梯子&#xff0c;这种治根&#xff1b;第二种就是像我一样找一个免费资源下载过来即可&#xff0c;…

面试题:线程池灵魂8连问,你挡的住吗?

文章目录 1. 面试官&#xff1a;日常工作中有用到线程池吗&#xff1f;什么是线程池&#xff1f;为什么要使用线程池&#xff1f;2. 面试官&#xff1a;ThreadPoolExecutor 都有哪些核心参数&#xff1f;3. 面试官&#xff1a;什么是阻塞队列&#xff1f;说说常用的阻塞队列有哪…

SVN相关-比较差异的时候哪边是最新的

SVN相关-比较差异的时候哪边是最新的 SVN相关-比较差异的时候哪边是最新的 SVN相关-比较差异的时候哪边是最新的

毛玻璃时钟特效

效果展示 页面结构组成 从上述的效果展示可以看到&#xff0c;我们的背景图片是有三个色块组成&#xff0c;为了能够掌握linear-gradient属性&#xff0c;所以我们背景的三个色块可以采用此属性来实现。 而时钟的数字我们采用背景图片实现&#xff0c;而三个指针我们是用元素…

【夏虫语冰】测试服务器端口是否打开(命令行、Python)

文章目录 1、简介2、命令行2.1 telnet2.1.1 工具简介2.1.2 工具配置2.1.3 工具使用 2.2 curl2.2.1 工具简介2.2.1 工具下载2.2.1 工具使用 2.3 wget2.3.1 工具简介2.3.2 工具下载2.3.2 工具使用 2.4 nc2.4.1 工具简介2.4.2 工具安装2.4.3 工具使用 2.5 ssh2.5.1 工具简介2.5.2 …

【OpenMV】AprilTag标记跟踪 NCC模板匹配 测距与测量物体大小

目录 AprilTag标记跟踪 NCC模板匹配 测距以及测量物体大小 识别乒乓球的距离与大小 红色矩形与蓝色矩形同时识别 AprilTag标记跟踪 Tag36h11&#xff0c;Tag25h9&#xff0c;Tag16h5 Tag36h11信息量更大&#xff0c;更准确 # AprilTags Example # # This example show…

STM32晶振的选择与计算

目录 1、石英晶体特性和型号2、振荡器理论2.1负电阻2.2跨导2.3负阻振荡器原理 3、皮尔斯振荡器设计3.1 皮尔斯振荡器简介3.2反馈电阻器3.3负载电容3.4振荡器跨导3.5驱动电平和外部电阻计算3.5.1计算驱动电平3.5.2另一种驱动电平测量方法3.5.3计算外部电阻 3.6启动时间3.7晶体拉…

Python_面向对象

面向对象编程&#xff08;Object-Oriented Programming&#xff0c;OOP&#xff09;是一种编程范式&#xff0c;它将数据和操作数据的方法组合在一起&#xff0c;以便将数据和行为视为一个整体。这种编程范式的历程可以追溯到20世纪60年代&#xff0c;但直到80年代才开始流行。…