Flink集群部署总结

news2024/9/30 19:42:59

集群部署方式

Flink有两种部署方式,Standalone和Flink on Yarn集群部署方式。

Flink集群架构

Flink分布式架构是常见的主从结构,由JobManager和TaskManager组成。JobManager是大脑,负责接收、协调、分发Task到各个TaskManager,也负责触发Checkpoint(容错机制)以及失败恢复。TaskManager负责执行Task,TaskManager中有若干的Task Slot,Task跑在Task Slot中,Task Slot的数量也表示了程序的并行度。

 

集群运行模式


1.session mode

 session运行模式下,client会向一个已预先建立好的session集群提交一个个job,所有job共享集群资源,包括JobManager和TaskManager的资源。


该模式的优点:

不需要每次提交job都花费开销去建立资源,JobManager和TaskManager是长期运行的
多个job跑在相同的JobManager和TaskManager,因此资源利用率高

该模式的缺点:

资源隔离性差,如果其中一个job把某个TaskManager搞挂了,那么该TaskManager下的所有job都会受影响
资源都是预分配的,所以资源扩展性差
client负责生成JobGraph以及上传依赖包到集群,当job很多时client的负载和带宽消耗都比较大

session运行模式的缺点比较致命,因此只适用于测试环境,不适用生产环境。

2.per-job mode

 

per-job运行模式下,client向集群提交job后,集群资源管理器(如Yarn、K8s)会为每个job单独建立JobManager和TaskManager。


该模式的优点:

job之间的资源是隔离的,互不影响
资源伸缩性好,根据每个job不同的需求申请合适的资源

该模式的缺点:

每个job都会建立JobManager,资源利用率相对低些
client负责生成JobGraph以及上传依赖包到集群,当job很多时client的负载和带宽消耗都比较大

per-job运行模式在生产环境上用的比较多也比较成熟稳定。

3.application mode

 

application运行模式下,client向集群提交job时,不会执行Flink应用程序的main方法,而是直接提交给集群。每个应用程序对应一个JobManager,且同一个JobManager下可以运行多个job。


该模式的优点:

由于client不执行程序以及上传依赖包(通过HDFS统一管理依赖包),因此负载和带宽消耗都很低,解放了client
资源伸缩性好,根据每个job不同的需求申请合适的资源
TaskManager资源隔离,JobManager应用间也是隔离的

该模式没有明显的缺点,也是目前社区主推的运行模式,适用于生产环境。

Standalone集群部署

集群规划

192.168.10.153 master

192.168.10.159 node02

Standalone集群不需要使用外部的资源管理器(ResourceManager),部署简单,但仅支持session运行模式

下载Flink二进制包

官网下载Flink二进制包:https://dlcdn.apache.org/flink/
这里我选择的是Flink 1.14.5版本:https://dlcdn.apache.org/flink/flink-1.14.5/flink-1.14.5-bin-scala_2.11.tgz

国内下载:

wget https://archive.apache.org/dist/flink/flink-1.14.5/flink-1.14.5-bin-scala_2.11.tgz


解压

tar -zxvf flink-1.14.5-bin-scala_2.11.tgz

cd flink-1.15.4

修改conf/masters

添加主节点hostname:

master:8081

修改conf/workers

添加从节点hostname:

node02

修改conf/flink-conf.yaml

jobmanager.rpc.address: master
jobmanager.bind-host: 0.0.0.0
taskmanager.bind-host: 0.0.0.0
rest.bind-address: 0.0.0.0

同步配置

scp -r flink-1.15.4 root@node02:/root/flink-1.15.4

启动standalone集群

./bin/start-cluster.sh

查看集群状态

jps查看每个节点的服务是否正常启动:

主节点:

 从节点:

还可以访问master:8081查看集群的状态

从节点修改配置 

查看从接到状况:

 注意:看图可以指定从接到默认配置都是localhost,无法做区分,因此需要在从节点的

flink-conf.yaml中添加配置:

所有从节点此处位置应该是自己hostname。

taskmanager.host: node02

从节点中,单独重启从节点

./taskmanager.sh  stop
./taskmanager.sh  start

再次刷新监控页面

 

来源:

Flink教程(2)Flink部署(二)Standalone和Flink on Yarn - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/711125.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

靶场搭建——搭建pikachu靶场

搭建pikachu靶场 搭建pikachu靶场1、win11本机搭建步骤2、虚拟机win2012搭建步骤 我所碰见的问题以及解决方式: 搭建pikachu靶场 这里我所运用到的材料有:首先我最终是在虚拟机中环境为win2012和主机都搭建完成。 (一个即可) Ph…

在各数据库中使用 MERGE 实现插入避重 SQL

MERGE实现插入避重操作 前言 MERGE是一种在数据库管理系统中用于合并(插入、更新或删除)数据的SQL语句。它允许根据指定的条件将数据从一个表合并到另一个表中,同时避免重复插入或更新数据。 MERGE语句通常由以下几个关键字和子句组成&…

Spring Boot 中的服务消费

Spring Boot 中的服务消费 在分布式系统中,服务消费是一个很常见的场景。通过服务消费,可以将一个系统中的服务作为另一个系统中的组件来使用。Spring Boot 提供了很多工具来简化服务消费的过程,本文将深入探讨 Spring Boot 中的服务消费是什…

Java——《面试题——maven篇》

全文章节 Java——《面试题——基础篇》 Java——《面试题——JVM篇》 Java——《面试题——多线程&并发篇》 Java——《面试题——Spring篇》 Java——《面试题——SpringBoot篇》 Java——《面试题——MySQL篇》​​​​​​ Java——《面试题——SpringCloud》 Java——…

Redis数据库的简介、部署及常用命令

Redis数据库的简介、部署及常用命令 一、关系数据库与非关系型数据库概述1、关系型数据库2、非关系型数据库3、关系数据库与非关系型数据库区别4、非关系型数据库产生背景 二、Redis简介1、Redis服务器程序的单线程模型2、Redis的优点 三、Redis部署四、Redis 命令工具1、redis…

全概率公式和贝叶斯公式

人工智能和机器学习中经常听到一个著名公式:贝叶斯概率公式。早已忘记了,赶紧记一下笔记。 (一)全概率公式: 注意:全概率公式成立的前提是Bi是样本的划分 其证明过程如下: (二&…

C++笔记之互斥锁,原子变量,条件变量对比

C笔记之互斥锁,原子变量,条件变量对比 code review! 目的:避免多线程间共享数据的竞态条件。 文章目录 C笔记之互斥锁,原子变量,条件变量对比1.std::mutex——互斥锁2.std::lock_guard3.std::unique_lock4.std::ato…

C++之lambda函数应用(一百四十七)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…

如何看懂时序图(1):时序图基础知识

对于参考手册中经常出现的一些时序图,经常会让我摸不着头脑。比如对于Flash的时序图来说,要看懂的话,里面的每一个参数都得系统地学一遍,而且时序图中的一些符号也不太懂是什么意思。前一段时间调HyperRAM的时候,因为那…

冯·诺依曼架构哈佛架构(嵌入式学习)

冯诺依曼架构&哈佛架构 0. 前言1. 冯诺依曼架构(von Neumann architecture)关键组件限制&挑战 2. 哈佛架构关键组件限制&挑战 3. 冯诺依曼架构&哈佛架构的区别4. 知识扩展 0. 前言 冯诺依曼架构(von Neumann architecture&a…

Python 命令行参数

Python 命令行参数 1、sys 库 sys.argv 获取参数2、getopt 模块解析带-参数2.1 短参数shortopts2.1.1 无短参数2.1.2 短参数h无值2.1.3 短参数h有值2.1.4 多个短参数h:v 2.2 长参数longopts2.2.1 长参数无值2.2.2 长参数有值 2.3 有空格字符串值 1、sys 库 sys.argv 获取参数 s…

Kubernetes核心概念汇总—调度、抢占和驱逐(Pod 调度就绪态)

Pod 一旦创建就被认为准备好进行调度。 Kubernetes 调度程序尽职尽责地寻找节点来放置所有待处理的 Pod。 然而,在实际环境中,会有一些 Pod 可能会长时间处于"缺少必要资源"状态。 这些 Pod 实际上以一种不必要的方式扰乱了调度器(…

Vue3 如何去开发安卓 或者 ios

Vue3 有没有一款好用的开发原生的工具 1.uniapp 我个人认为uniapp 适合开发小程序之类的,用这个去开发原生应用会存在一些问题 性能限制:由于 Uniapp 是通过中间层实现跨平台,应用在访问底层功能时可能存在性能损失。与原生开发相比&#xf…

【Linux】调试工具gdb

目录 前言 一、前情了解 二、gdb常用命令 1.基本指令 2.断点 3.调试过程 4.查看内容 前言 gdb是Linux环境下了一个调试工具,在代码运行出现问题时,我们可以通过它来进行调试,找出问题的所在。本文来带大家来了解一下gdb的使用方法。 …

单片机第一季:零基础1

目录 1,第一章 2,第二章 1,第一章 单片机是全球用量最大的CPU,是物联网节点设备主控CPU,单片机是其他物联网编程技术的基础,通过学习单片机学习编程语言、调试技巧、工具使用等; 51单片机最简…

【前端笔记】indexDB使用简单介绍

什么是indexDB? IndexedDB 是一种底层 API,用于在客户端存储大量的结构化数据(也包括文件/二进制大型对象(blobs))。该 API 使用索引实现对数据的高性能搜索。虽然 Web Storage 在存储较少量的数据很有用&…

chatgpt赋能python:如何用Python计算圆面积

如何用Python计算圆面积 介绍 圆是几何学中基本的图形之一,圆面积的计算是数学中的基础知识。使用Python编程语言可以快速、简便地计算圆的面积。本文将介绍如何使用Python编写圆面积计算器,并演示计算圆面积的步骤。无需高深的数学知识,只…

IPv6地址分类

一. 前言 IPv6地址分为单播地址,组播地址和任播地址。它们的地址详细分类和地址的范围如下图所示。 二. IPv6地址分类 1. 全球单播地址 类似于IPv4的公网地址,由前缀,子网ID和接口标识组成。 2. 链路本地地址 只能在连接到同一个本地链路的节…

《空指针》Optional解决链式调用NPE问题

Optional解决链式调用NPE问题 1.map() public class Main {public static void main(String[] args) {Person person new Person();Info personInfo new Info();int result;// 1.PersonInfo 为空person.setPersonInfo(null);result Optional.ofNullable(person).map(Person…

cpp-httplib

安装 cpp-httplib gitee链接: https://gitee.com/yuanfeng1897/cpp-httplib?_fromgitee_searchv0.7.15版本链接: https://gitee.com/yuanfeng1897/cpp-httplib/tree/v0.7.15把httplib.h拷贝到我们的项目中即可 接入cpp-httplib:header-only&#xff…