Spark的容错机制

Spark的容错机制

news2026/2/15 1:42:35

1，Spark如何保障数据的安全

1、RDD容错机制：persist持久化机制

1）cache算子

- 功能：将RDD缓存在内存中
- 语法：cache()
- 本质：底层调用的还是persist（StorageLevel.MEMORY_ONLY），但是只缓存在内存，如果内存不够，缓存会失败
- 场景：资源充足，需要将RDD仅缓存在内存中

2）persist算子

- 功能：将**RDD**【包含这个RDD的依赖关系】进行缓存，可以**自己指定缓存的级别**【和cache区别】
- 语法：`persist(StorageLevel)`
- 级别：StorageLevel决定了缓存位置和缓存几份

StorageLevel 有哪些级别：

Spark的StorageLevel共有9个缓存级别：

DISK_ONLY：缓存入硬盘。这个级别主要是讲那些庞大的Rdd，之后仍需使用但暂时不用的，放进磁盘，腾出Executor内存。
DISK_ONLY_2：多一个缓存副本。
MEMORY_ONLY：只使用内存进行缓存。这个级别最为常用，对于马上用到的高频rdd，推荐使用。
MEMORY_ONLY_2：多一个缓存副本。
MEMORY_AND_DISK：先使用内存，多出来的溢出到磁盘，对于高频的大rdd可以使用。
MEMORY_AND_DISK_2：多一个缓存副本。
OFF_HEAP：除了内存、磁盘，还可以存储在OFF_HEAP

场景：根据资源情况，将RDD缓存在不同的地方或者缓存多份

3）unpersist 算子 --释放缓存

- 功能：将缓存的RDD进行释放
- 语法：`unpersist`
- unpersist(blocking=True)：等释放完再继续下一步
- 场景：明确RDD已经不再使用，后续还有很多的代码需要执行，将RDD的数据从缓存中释放，避免占用资源
- 注意：如果不释放，这个Spark程序结束，也会释放这个程序中的所有内存

2、RDD容错机制：checkpoint检查点机制

问题：为了避免重复构建RDD，可以将RDD进行persist缓存，但是如果缓存丢失，还是会重新构建RDD，怎么解决？

checkpoint：检查点

功能：将RDD的数据【不包含RDD依赖关系】存储在可靠的存储系统中：HDFS上

这个检查点有点类似于：虚拟机中的快照，像里程碑。

# 设置一个检查点目录
sc.setCheckpointDir("../datas/chk/chk1")
# 将RDD的数据持久化存储在HDFS
rs_rdd.checkpoint()

一定要在触发算子之前，调用checkpoint() 否则，检查点中没有数据

面试：RDD的cache、persist持久化机制和checkpoint检查点机制有什么区别？

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2234324.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Web3对社交媒体的影响：重新定义用户互动方式

Web3对社交媒体的影响：重新定义用户互动方式

随着互联网的发展和人们对隐私、安全、所有权的需求不断提高，Web3 的概念逐渐深入人心。Web3 的出现标志着一个去中心化、用户主导的网络时代的到来，这也将对社交媒体产生深远的影响。Web3 不仅推动社交媒体从中心化模式向用户主导的去中心化模式转变&am…

阅读更多...

高通Quick板上安装编译Ros1 noetic,LeGO_LOAM,FAR_Planner和rslidar_sdk

高通Quick板上安装编译Ros1 noetic,LeGO_LOAM,FAR_Planner和rslidar_sdk

环境要求： 这里quick板上安装的是Ubuntu20.04版本 Ros Noeti安装： 1.设置软件源： 官方提供的软件源： sudo sh -c echo "deb http://packages.ros.org/ros/ubuntu $(lsb_release -sc) main" > /etc/apt/sources.list.…

阅读更多...

解决Knife4j 接口界面UI中文乱码问题

解决Knife4j 接口界面UI中文乱码问题

1、查看乱码情况 2、修改编码设置 3、删除 target 文件项目重新启动被坑死了

阅读更多...

HTML 标签属性——＜a＞、＜img＞、＜form＞、＜input＞、＜table＞标签属性详解

HTML 标签属性——＜a＞、＜img＞、＜form＞、＜input＞、＜table＞标签属性详解

文章目录 1. `<a>`元素属性hreftargetname2. `<img>`元素属性srcaltwidth 和 height3. `<form>`元素属性actionmethodenctype4. `<input>`元素属性typevaluenamereadonly5. `<table>`元素属性cellpaddingcellspacing小结HTML元素除了可以使用全局…

阅读更多...

仿真APP助力汽车零部件厂商打造核心竞争力

仿真APP助力汽车零部件厂商打造核心竞争力

汽车零部件是汽车工业的基石，是构成车辆的基础元素。一辆汽车通常由上万件零部件组成，包括发动机系统、传动系统、制动系统、电子控制系统等，它们共同确保了汽车的安全、可靠性及高效运行。在汽车产业快速发展的今天，汽车零部件…

阅读更多...

.NET周刊【11月第1期 2024-11-03】

.NET周刊【11月第1期 2024-11-03】

国内文章 .NET 9 AOT的突破 - 支持老旧Win7与XP环境 https://www.cnblogs.com/lsq6/p/18519287 .NET 9 引入了 AOT 支持，使得应用程序能够在编译时优化，以在老旧 Windows 系统上运行。这项技术通过静态编译，消除运行时的 JIT 编译&#xf…

阅读更多...

江协科技STM32学习- P36 SPI通信外设

江协科技STM32学习- P36 SPI通信外设

🚀write in front🚀 🔎大家好，我是黄桃罐头，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流 🎁欢迎各位→点赞👍 收藏⭐️ 留言📝…

阅读更多...

Type-C接口 PD 受电端（sink）快充协议芯片，XSP08Q应用小家电领域的方案

Type-C接口 PD 受电端（sink）快充协议芯片，XSP08Q应用小家电领域的方案

前言在智能家居浪潮的推动下，小家电作为日常生活中不可或缺的一部分，其供电方式的创新与优化正逐步成为行业关注的焦点。随着快充技术的普及，特别是Power Delivery（PD）协议的广泛应用，一种新型供电模式—…

阅读更多...

Memento 备忘录模式

Memento 备忘录模式

备忘录模式意图结构适用性实例Java Web开发中的简单示例Originator 类Memento 类Caretaker 类文本编辑器示例1. Originator (发起人) - TextEditor2. Memento (备忘录) - TextMemento3. Caretaker (负责人) - History4. 使用示例输出备忘录模式（Memento Pattern&…

阅读更多...

网络应用技术实验二：交换机VLAN 应用（华为ensp）

网络应用技术实验二：交换机VLAN 应用（华为ensp）

目录一、实验简介二、实验目的三、实验需求四、实验拓扑五、实验任务及要求 1、任务 1：在交换机上创建VLAN 并测试通信 2、任务 2：路由交换机实现VLAN 之间通信六、实验步骤 1、完成任务 1 2、完成任务 2 一、实验简介在交换机上配置 VLAN&#x…

阅读更多...

大模型应用：新时代的多模态交互

大模型应用：新时代的多模态交互

引言如果把大模型接入到终端设备，会怎么样？ （1）智能交互回顾历史文章《[智能交互复兴：ChatGPT 终端（奔驰/Siri） ？]》中提到：大模型遍布多个应用场景其中有智能对话…

阅读更多...

一周内从0到1开发一款 AR眼镜相机应用？

一周内从0到1开发一款 AR眼镜相机应用？

目录 1. 📂 前言 2. 💠 任务拆分 2.1 产品需求拆分 2.2 开发工作拆分 3. 🔱 开发实现 3.1 代码目录截图 3.2 app 模块 3.3 middleware 模块 3.4 portal 模块 4. ⚛️ 拍照与录像 4.1 前滑后滑统一处理 4.2 初始化 View 以及 Came…

阅读更多...

信息安全工程师（76）网络安全应急响应技术原理与应用

信息安全工程师（76）网络安全应急响应技术原理与应用

前言网络安全应急响应（Network Security Incident Response）是针对潜在或已发生的网络安全事件而采取的网络安全措施，旨在降低网络安全事件所造成的损失并迅速恢复受影响的系统和服务。一、网络安全应急响应概述定义：网络安全应…

阅读更多...

用图说明 CPU、MCU、MPU、SoC 的区别

用图说明 CPU、MCU、MPU、SoC 的区别

CPU CPU 负责执行构成计算机程序的指令，执行这些指令所指定的算术、逻辑、控制和输入/输出（I/O）操作。 MCU (microcontroller unit) 不同的 MCU 架构如下，注意这里的 MPU 表示 memory protection unit MPU (microprocessor un…

阅读更多...

vue3动态监听div高度案例

vue3动态监听div高度案例

案例场景场景描述：现在左边的线条长度需要根据右边盒子的高度进行动态变化实践代码案例 HTML部分 <div v-for"(device, index) in devices" :key"index"><div class"left-bar"…

阅读更多...

【Docker系列】指定系统平台拉取 openjdk:8 镜像

【Docker系列】指定系统平台拉取 openjdk:8 镜像

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…

阅读更多...

【含文档+源码】基于SpringBoot+Vue的新型吃住玩一体化旅游管理系统的设计与实现

【含文档+源码】基于SpringBoot+Vue的新型吃住玩一体化旅游管理系统的设计与实现

开题报告本文旨在探讨新型吃住玩一体化旅游管理系统的设计与实现。该系统融合了用户注册与登录、旅游景点管理、旅游攻略发帖、特色旅游路线推荐、附近美食推荐以及酒店客房推荐与预定等多项功能，旨在为游客提供全方位、一体化的旅游服务体验。在系统设计中&#…

阅读更多...

B3735 [信息与未来 2018] 圣诞树

B3735 [信息与未来 2018] 圣诞树

题目描述圣诞树共有 nn 层，从上向下数第 11 层有 11 个星星、第 22 层有 22 个星星、以此类推，排列成下图所示的形状。星星和星星之间用绳子连接。第 1,2,\cdots, n - 11,2,⋯,n−1 层的每个星星都向下一层最近的两个星星连一段绳子，最后一…

阅读更多...

解决 Hypack 安装不能正常运行的引导及微软 VC++ 运行库 VCRedist

解决 Hypack 安装不能正常运行的引导及微软 VC++ 运行库 VCRedist

解决 Hypack 安装不能正常运行的引导及微软 VC 运行库 VCRedist 前言1、常见 Hypack 安装不能正常运行的错误1.1、无法打开大地测量参数1.2、无法运行硬件设置和组合 2、从 Hypack 2013 开始，程序安装后，在程序目标目录，有支持目录 Support &…

阅读更多...

给大模型研究生一些救命建议

给大模型研究生一些救命建议

这篇写给大模型方向的研一新生，我呆证看完以后能救你们大命首先我知道大模型算法工程师这个 title 十分诱人，你们现在也被导师说得一腔热血。但是，大模型它跟七八年前的 CV、NLP 都不太一样，最不一样的点在哪里呢? 就是LLM …

阅读更多...

推荐文章

最新文章