尚硅谷大数据技术Spark教程-笔记07【Spark内核源码(环境准备、通信环境、应用程序执行、shuffle、内存管理)】

news2024/10/6 22:27:59
  • 尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】
  • 视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili
  1. 尚硅谷大数据技术Spark教程-笔记01【SparkCore(概述、快速上手、运行环境、运行架构)】
  2. 尚硅谷大数据技术Spark教程-笔记02【SparkCore(核心编程,RDD-核心属性-执行原理-基础编程-并行度与分区-转换算子)】
  3. 尚硅谷大数据技术Spark教程-笔记03【SparkCore(核心编程,RDD-转换算子-案例实操)】
  4. 尚硅谷大数据技术Spark教程-笔记04【SparkCore(核心编程,RDD-行动算子-序列化-依赖关系-持久化-分区器-文件读取与保存)】
  5. 尚硅谷大数据技术Spark教程-笔记05【SparkCore(核心编程,累加器、广播变量)】
  6. 尚硅谷大数据技术Spark教程-笔记06【SparkCore(案例实操,电商网站)】
  7. 尚硅谷大数据技术Spark教程-笔记07【Spark内核&源码(环境准备、通信环境、应用程序执行、shuffle、内存管理)】
  8. 尚硅谷大数据技术Spark教程-笔记08【SparkSQL(介绍、特点、数据模型、核心编程、案例实操、总结)】
  9. 尚硅谷大数据技术Spark教程-笔记09【SparkStreaming(概念、入门、DStream入门、案例实操、总结)】

目录

尚硅谷大数据技术Spark教程-笔记07【Spark内核&源码()】

00【总体介绍】

P128【128.尚硅谷_Spark内核 & 源码 - 总体介绍】05:38

01【环境准备】

P129【129.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 起点】06:30

P130【130.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 向Yarn提交应用】13:28

P131【131.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 启动ApplicationMaster】14:20

P132【132.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Driver线程】10:21

P133【133.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Executor进程】15:23

P134【134.尚硅谷_Spark内核 & 源码 - 环境准备 - ExecutorBackend - 创建Executor计算对象】17:30

P135【135.尚硅谷_Spark内核 & 源码 - 环境准备 - 流程梳理】10:30

02【通信环境】

P136【136.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信原理】07:56

P137【137.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信组件】12:44

P138【138.尚硅谷_Spark内核 & 源码 - 通信环境 - 课件梳理】04:22

03【应用程序的执行】

P139【139.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 上下文对象SparkContext】07:23

P140【140.尚硅谷_Spark内核 & 源码 - 应用程序执行 - RDD依赖关系】07:27

P141【141.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 阶段的划分】13:45

P142【142.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的切分】06:13

P143【143.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的调度】16:52

P144【144.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的执行】05:07

P145【145.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 课件梳理】06:22

04【shuffle】

P146【146.尚硅谷_Spark内核 & 源码 - shuffle - 原理回顾】07:04

P147【147.尚硅谷_Spark内核 & 源码 - shuffle - 图解】12:19

P148【148.尚硅谷_Spark内核 & 源码 - shuffle - 实现过程】08:16

P149【149.尚硅谷_Spark内核 & 源码 - shuffle - 写流程源码解读】15:47

P150【150.尚硅谷_Spark内核 & 源码 - shuffle - 归并排序和读流程】16:20

P151【151.尚硅谷_Spark内核 & 源码 - shuffle - 课件梳理】05:56

05【内存的管理】

P152【152.尚硅谷_Spark内核 & 源码 - 内存管理】18:51


尚硅谷大数据技术Spark教程-笔记07【Spark内核&源码()】

00【总体介绍】

P128【128.尚硅谷_Spark内核 & 源码 - 总体介绍】05:38

  1. 环境准备(Yarn集群)
    1. Driver,Executor
  2. 组件通信
    1. Driver => Executor
    2. Executor => Driver
    3. Executor => Executor
  3. 应用程序的执行
    1. RDD依赖
    2. 阶段的划分
    3. 任务的切分
    4. 任务的调度
  4. Shuffle
    1. Shuffle的原理和执行过程
    2. Shuffle写磁盘
    3. Shuffle读取磁盘
  5. 内存的管理
    1. 内存的分类
    2. 内存的配置

01【环境准备】

P129【129.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 起点】06:30

spark-submit --class org.apache.spark.examples.SparkPi --master local[2] ../examples/jars/spark-examples_2.12-3.0.0.jar 10

java org.apache.spark.deploy.SparkSubmit

java HelloWorld

JVM=>Process (SparkSubmit)

SparkSubmit.main

jps

P130【130.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 向Yarn提交应用】13:28

//准备提交环境
(childArgs, childClasspath, sparkConf, childMainClass) = prepareSubmitEnvironment(args)
childMainClass = org.apache.spark.deploy.yarn.YarnClusterApplication

P131【131.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 启动ApplicationMaster】14:20

P132【132.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Driver线程】10:21

P133【133.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Executor进程】15:23

P134【134.尚硅谷_Spark内核 & 源码 - 环境准备 - ExecutorBackend - 创建Executor计算对象】17:30

P135【135.尚硅谷_Spark内核 & 源码 - 环境准备 - 流程梳理】10:30

01_尚硅谷大数据技术之SparkCore.pdf

第1章  Spark概述

04_尚硅谷大数据技术之Spark内核.pdf

2.2 Standalone模式运行机制

02【通信环境】

P136【136.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信原理】07:56

组件通信

P137【137.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信组件】12:44

P138【138.尚硅谷_Spark内核 & 源码 - 通信环境 - 课件梳理】04:22

04_尚硅谷大数据技术之Spark内核.pdf

第 3 章 Spark 通讯架构

3.1 Spark 通信架构概述

03【应用程序的执行】

P139【139.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 上下文对象SparkContext】07:23

P140【140.尚硅谷_Spark内核 & 源码 - 应用程序执行 - RDD依赖关系】07:27

P141【141.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 阶段的划分】13:45

 

P142【142.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的切分】06:13

P143【143.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的调度】16:52

  1. 环境准备(Yarn集群)
    1. Driver,Executor
  2. 组件通信
    1. Driver => Executor
    2. Executor => Driver
    3. Executor => Executor
  3. 应用程序的执行
    1. RDD依赖
    2. 阶段的划分
    3. 任务的切分
    4. 任务的调度
  4. Shuffle
    1. Shuffle的原理和执行过程
    2. Shuffle写磁盘
    3. Shuffle读取磁盘
  5. 内存的管理
    1. 内存的分类
    2. 内存的配置

P144【144.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的执行】05:07

P145【145.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 课件梳理】06:22

04_尚硅谷大数据技术之Spark内核.pdf

第 4 章 Spark任务调度机制

04【shuffle】

P146【146.尚硅谷_Spark内核 & 源码 - shuffle - 原理回顾】07:04

P147【147.尚硅谷_Spark内核 & 源码 - shuffle - 图解】12:19

 

 

P148【148.尚硅谷_Spark内核 & 源码 - shuffle - 实现过程】08:16

P149【149.尚硅谷_Spark内核 & 源码 - shuffle - 写流程源码解读】15:47

P150【150.尚硅谷_Spark内核 & 源码 - shuffle - 归并排序和读流程】16:20

P151【151.尚硅谷_Spark内核 & 源码 - shuffle - 课件梳理】05:56

04_尚硅谷大数据技术之Spark内核.pdf

5.1.1 ShuffleMapStage与ResultStage

05【内存的管理】

P152【152.尚硅谷_Spark内核 & 源码 - 内存管理】18:51

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/543695.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

5th-Generation Mobile Communication Technology(五)

目录 一、5G/NR 1、 快速参考(Quick Reference) 2、5G Success 3、5G Challenges 4、Qualcomm Videos 二、PHY and Protocol 1、Frame Structure 2、Numerology 3、Waveform 4、Frequency Band 5、BWP 6、Synchronization 7、Beam Management 8、CSI Fra…

Gradle+组件化开发

Gradle组件化开发 Gradle一.什么是gradle?二.gradle优势三.project和module的关系三.project.gradle和module.gradle的区别 组件化开发一.背景二.项目结构三.组件开发代码配置四.BuildSrc组件化开发![在这里插入图片描述](https://img-blog.csdnimg.cn/bff8d7e91fd2…

RCNN网络原理详解

文章目录 一、前言二、R-CNN原理步骤2.1.Selective Search生成目标检测框2.2.对候选区域使用深度网络提取特征2.3.SVM分类2.4.使用回归器精细修正候选框位置 三、总结参考博客与学习视频 一、前言 学习目标检测当然要学习目标检测领域的开山之作R-CNN,本文为个人笔记。 二、…

Boost开发指南-1.1timer

timer timer类可以测量时间的流逝&#xff0c;是一个小型的计时器&#xff0c;提供毫秒级别的计时精度和操作函数&#xff0c;供程序员手工控制使用&#xff0c;就像是个方便的秒表。 timer位于名字空间boost,为了使用timer组件&#xff0c;需要包含头文件<boost/timer.hp…

代码随想录算法训练营第二十三天|理论基础 77. 组合

文章目录 理论基础77.组合思路代码总结 理论基础 回溯算法&#xff1a;一种暴力搜索方式 回溯是递归的副产品&#xff0c;只要有递归就会有回溯。 回溯法&#xff0c;一般可以解决如下几种问题&#xff1a; 组合问题&#xff1a;N个数里面按一定规则找出k个数的集合切割问题…

广告投放实战指南,让你的技术产品走向成功!

开篇词 作为深耕智能客服领域多年的云客服厂商&#xff0c;美洽在开拓市场、品牌运营、获线转化等方面积累了一定的经验&#xff0c;并打造出了在线客服、呼叫中心、客服机器人、工单系统、语音机器人等智能客服全域产品矩阵&#xff0c;不仅为企业与客户的沟通提供了便利&…

android (实现左滑删除)自定义控件+事件分发

左滑删除 背后的逻辑1布局的绘制onMeasureonLayout 2 事件的分发都不处理爸爸拦截不吃吃 事件分发的结论 完整代码的实现效果图代码 背后的逻辑 想要实现左滑删除&#xff0c;在现有控件不满足的情况下&#xff0c;肯定是要自定义View。 然后考虑需要实现的效果&#xff0c;里…

nginx(CVE-2022-41741)漏洞修复

大家好&#xff0c;我是早九晚十二&#xff0c;目前是做运维相关的工作。写博客是为了积累&#xff0c;希望大家一起进步&#xff01; 我的主页&#xff1a;早九晚十二 最近&#xff0c;nginx曝出了最新漏洞CVE-2022-41741&#xff0c;这个影响还是比较大的&#xff0c;因为这个…

你真的了解低代码吗?

&#x1f431; 个人主页&#xff1a;不叫猫先生&#xff0c;公众号&#xff1a;前端舵手 &#x1f64b;‍♂️ 作者简介&#xff1a;2022年度博客之星前端领域TOP 2&#xff0c;前端领域优质作者、阿里云专家博主&#xff0c;专注于前端各领域技术&#xff0c;共同学习共同进步…

在vue中上传图片

大纲&#xff1a; &#x1f335; 1、avue中如何上传图片 Avue官网 : Avue 在Avue官网中找到 Upload附件上传。本案例为了满足项目需求&#xff0c;我只用了上传后的方法 :upload-after"uploadAfter" &#x1f346; Avue上传图片案例代码 <template><div…

【axios】vue中axios的请求配置

注意&#xff1a;本文实例化为TS版 1、axios概念 axios 是一个基于 promise 封装的网络请求库&#xff0c;它是基于 原生XHR 进行二次封装&#xff0c;可以说是 XHR 的一个子集&#xff0c;而 XHR 又是 Ajax 的一个子集 特点 从浏览器中创建 XMLHttpRequests从 node.js 创建…

Maven——Maven工程

1.Maven工程类型 【1】POM工程 【2】JAR工程 【3】WAR工程 2.Maven的目录结构 3.POM模式-Maven工程关系 在Maven中它把每个项目都看成一个对象 3.1依赖 【1】依赖关系 【2】如何注入依赖 【3】依赖的好处&#xff1a; 省去了程序员手动添加jar包的操作&#xff01; 可以帮…

类与对象(中)(一)

1.类的6个默认成员函数 如果一个类中什么成员都没有&#xff0c;简称为空类。 空类中真的什么都没有吗&#xff1f;并不是&#xff0c;任何类在什么都不写时&#xff0c;编译器会自动生成以下6个默认成员 函数。 默认成员函数&#xff1a;用户没有显式实现&#xff0c;编译器…

【NoteExpress】解决缺少样式的问题

之前写过一篇关于在NoteExpress里面把参考文献输出样式改成Elsevier的教程 &#x1f449;【NoteExpress】统一Elsevier旗下期刊参考文献格式 今天打开 NoteExpress &#xff0c;准备换一个输出样式&#xff0c;发现样式数量变了&#xff0c;从原来几千多变成了7&#xff01; 我…

日撸 Java 三百行day51-53

文章目录 说明Day51-52 KNN 分类器1.KNN2.代码1.aff内容解读2.代码理解 Day53 knn补充1.加权思路2.加权代码3.leave-one-out 测试思路4.leave-one-out代码 说明 闵老师的文章链接&#xff1a; 日撸 Java 三百行&#xff08;总述&#xff09;_minfanphd的博客-CSDN博客 自己也把…

sonarqube主要功能概览

sonarqube质量标准 sonarqube通过可靠性、安全性、安全复审、可维护性、覆盖率、重复度等方面来评价代码质量。 分别使用bugs&#xff0c; 漏洞等指标。 如图&#xff0c;有项目状态为正常&#xff0c;有项目状态为错误。 点进项目可以看具体 可以对问题进行分配&#xff0c;…

7个既可学习又可玩游戏的CSS在线学习网站

学习编码并不容易&#xff0c;尤其是 CSS&#xff0c;所以&#xff0c;在本文中我将跟大家分享一些既能学习CSS知识技能有可以玩游戏的网站&#xff0c;以有趣好玩的方式来帮助你提高学习兴趣以及解决问题的能力。现在&#xff0c;就让我们进入一些在线学习CSS的游戏网站列表&a…

【JOSEF约瑟 JDZS-1202B 可调断电延时中间继电器 精度高、延时宽、】

品牌&#xff1a;JOSEF约瑟名称&#xff1a;可调断电延时中间继电器型号&#xff1a;JDZS-1202B系列额定电压&#xff1a;110、220VDC/AC触点容量&#xff1a;250V/5A功率消耗&#xff1a;2W返回系数&#xff1a;≥5%特点&#xff1a;高精度、延时宽、功耗低。 用途及特点 基本…

使用Rust构建一个kvm用户空间实例

最近在学习虚拟化相关的内容&#xff0c;想着使用Rust构建一个最小的kvm用户空间实例。也就是直接调用kvm的api&#xff0c;然后创建虚拟机。网络上关于kvm的内容大部分是使用libvirt的&#xff0c;然后kvm用户空间实例也是使用C编写的。因此想着使用Rust写一个简单的。 思路 …

Maven依赖管理

文章目录 1 依赖传递与冲突问题2 可选依赖和排除依赖方案一:可选依赖方案二:排除依赖 Masked5 / heima_maven_codes GitCode 我们现在已经能把项目拆分成一个个独立的模块&#xff0c;当在其他项目中想要使用独立出来的这些模块&#xff0c;只需要在其pom.xml使用<depende…