Spark的运行模式
本地模式(Local)
一般用做测试,测试代码的逻辑是否正确
本地模式,只启动一个Driver进程,没有Executor进程的,所有Task都运行在Driver进程中
集群模式 (Cluster)
一般用于生产环境
-
支持四种集群架构:Standalone、Yarn(常用)、Mesos和K8s
-
分布式模式,一定会有1个Driver进程和多个Executor进程
Driver进程:驱动进程,任何一个Spark程序在任何一种模式都肯定会有
- 功能:负责申请这个程序的资源,解析、调度分配、监控整个程序中所有Task的运行
Executor进程:执行进程,由Driver申请启动Executor运行在从节点上【Worker、NodeManager】
- 功能:负责运行Driver分配的所有Task任务