Spark-Yarn模式如何配置历史服务器

news2026/2/15 13:54:34

在Spark程序结束之后我们也想看到运行过程怎么办？

Yarn模式下，通过以下步骤配置历史服务器即可:

mv spark-defaults.conf.template spark-defaults.conf
修改spark-default.conf 文件，配置日志存储路径

spark.eventLog.enabled true
spark.eventLog.dir hdfs://master:9000/directory

注意:需要启动hadoop集群;如果directory不存在,先用如下命令创建
hdfs dfs -mkdir /directory或hadoop dfs -mkdir /directory或hadoop fs -mkdir directory
这里的端口号和Hadoop的core-site.xml中fs.defaultFS的路径保持一致
3. 修改spark-env.sh文件,配置日志

export SPARK_HISTORY_OPTS="
-Dspark.history.ui.port=18080 
-Dspark.history.fs.logDirectory=hdfs://master:9000/directory 
-Dspark.history.retainedApplications=30"

WEB UI访问的端口号
指定历史服务器日志存储路径
指定Application历史纪录的保存个数,这个是内存中的应用数,不是页面上显示的应用数

修改 spark-defaults.conf

spark.yarn.historyServer.address=master:18080
spark.history.ui.port=18080

启动历史服务

sbin/start-history-server.sh

用spark-submit提交任务
Web页面查看日志:http://master:8088

在这里插入图片描述

点击history之后:

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2099928.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Spark-Yarn模式如何配置历史服务器

在Spark程序结束之后我们也想看到运行过程怎么办？

相关文章

pg小版本升级

24 - 第三方库的使用支持

vue2中用到了 vuex 实现一个留言板效果

折叠屏、曲面屏始终都是少数派，凭啥挑战iPhone16？

直接计算法计算CRC-32/MPEG-2

引领八亿人的“发现感”，深度旅游时代正式到来

计算机毕业设计Spark+PyTorch股票推荐系统股票预测系统股票可视化股票数据分析量化交易系统股票爬虫股票K线图大数据毕业设计 AI

ceph中pg与pool关系

牧野机床采集数据

sqli-labs靶场通关攻略（六十一关到六十五关）

【K8s】专题十三：Kubernetes 容器运行时之 Docker 与 Containerd 详解

记忆化搜索【上】

搭建核心架构网络项目（局域网）

[Algorithm][综合训练][kotori和n皇后][取金币][矩阵转置]详细讲解

Yapi部署文档

嵌入式硬件-ARM处理器架构，CPU，SOC片上系统处理器

day-47 组合

【数据结构】顺序表和链表——顺序表（包含丰富算法题）

vivado 定义时间约束

HarmonyOS--后台代理提醒