【大数据工具】Flink集群搭建

news2024/11/22 14:51:38

Flink 集群安装

1. 单机版 Flink 安装与使用

1、下载 Flink 安装包并上传至服务器

  • 下载 flink-1.10.1-bin-scala_2.11.tgz 并上传至 Hadoop0 /software

2、解压

[root@hadoop0 software]# tar -zxvf flink-1.10.1-bin-scala_2.11.tgz

3、创建快捷方式

[root@hadoop0 software]# ln -s flink-1.10.1 flink

4、配置环境变量

vi /etc/profile
# 将下边两行配置信息添加到文件末尾
export FLINK_HOME=/software/flink-1.10.1
export PATH=$PATH:$FLINK_HOME/bin
# 然后 source 下使环境变量配置文件生效
source /etc/profile

5、启动

[root@hadoop0 ~]# cd /software/flink-1.10.1/bin/
[root@hadoop0 bin]# start-cluster.sh  # 停止用 stop-cluster.sh 
Starting cluster.
Starting standalonesession daemon on host hadoop0.
Starting taskexecutor daemon on host hadoop0.
[root@hadoop0 bin]# jps
8243 StandaloneSessionClusterEntrypoint
8568 TaskManagerRunner

6、页面查看:hadoop0:8081

2. Standalone 模式安装

1、集群规划

主机名JobManagerTaskManager
hadoop1
hadoop2

2、依赖

  • jdk1.8以上,配置 JAVA_HOME
  • 主机之间免密登录

3、安装步骤

  • 修改 conf/flink-conf.yaml
jobmanager.rpc.address:hadoop1
  • 修改conf/salves
hadoop1
hadoop2
  • 拷贝到其他节点
scp -rq /software/flink-1.10.1 hadoop2:/software/
  • 在hadoop1(JobManager)节点启动
[root@hadoop1 ~]# cd /software/flink-1.10.1/bin/
[root@hadoop1 bin]# start-cluster.sh 
Starting cluster.
Starting standalonesession daemon on host hadoop1.
Starting taskexecutor daemon on host hadoop1.
Starting taskexecutor daemon on host hadoop2.
[root@hadoop1 bin]# jps  #查看Flink相关进程
12897 TaskManagerRunner
12548 StandaloneSessionClusterEntrypoint
[root@hadoop2 conf]# jps  #查看Hadoop2上的进程
8278 TaskManagerRunner
  • 访问页面:http://hadoop1:8081

4、StandAlone模式需要考虑的参数

conf/flink-conf.yaml
参数含义
jobmanager.heap.mbjobmanager节点可用的内存大小
taskmanager.heap.mbtaskmanager节点可用的内存大小
taskmanager.numberOfTaskSlots每台机器可用的CPU数量
parallelism.default默认情况下任务的并行度
taskmanager.tmp.dirstaskmanager的临时数据存储目录

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/618519.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

100天精通Python(可视化篇)——第90天:Pyecharts可视化神器基础入门

文章目录 专栏导读一、pyecharts 介绍1. 简介2. 版本说明 二、pyecharts 特点三、pyecharts 安装四、基本步骤五、快速开始1. 数据准备1)类别数据2)时间数据3)颜色数据4)地理数据5)世界人口数据6)选择数据7…

Netty核心源码剖析(三)

1.Pipeline,Handler和HandlerContext创建源码剖析 1.1.三者的关系 1>.每当ServerSocket创建一个新的连接,就会创建一个Socket,对应的就是目标客户端; 2>.每一个新创建的Socket都将会分配一个全新的ChannelPipeline(以下简称pipeline); 3>.每一个ChannelPipeline内…

LKY_OfficeTools 一键优雅的安装并激活你的Office

何为优雅? 说到Office办公软件 相信都不陌生,一般包括Word、Excel、PowerPoint默认三件套,和Outlook、OneNote、Access。 几乎每台电脑都会配置的 但大多数的情况下 都是先去软件仓库下载 Office 然后使用激活工具去激活Office 这种操作听起…

国内首款医疗大语言模型MedGPT发布,专业医疗标注数据成关键

5月25日,国内互联网医院、慢病管理平台医联今日正式发布了自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT。 与通用型的大语言模型产品不同,MedGPT主要致力于在真实医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗…

机器学习 day14 ( 神经网络,计算机视觉中的引用:人脸识别和汽车识别)

神经网络的发展 最开始的动机:是通过构建软件来模拟大脑,但今天的神经网络几乎与大脑的学习方式无关 我们依据大脑中的神经网络,来构建人工神经网络模型。左图中:一个神经元可以看作一个处理单元,它有很多的输入/树突…

图论与算法(6)最小生成树

1. 带权图及实现 1.1 带全图概述 带权图是一种图形结构,其中图中的边具有权重或成本。每条边连接两个顶点,并且具有一个与之关联的权重值,表示了两个顶点之间的某种度量、距离或成本。 带权图可以用邻接矩阵或邻接表来表示。邻接矩阵是一个…

集成电路(芯片)中VCC、VDD、VSS、GND和AGND等概念

IC芯片 Integrated Circuit Chip 即集成电路芯片,是将大量的微电子元器件(晶体管、电阻、电容、二极管等) 形成的集成电路放在一块塑基上,做成一块芯片。目前几乎所有看到的芯片,都可以叫做 IC芯片 。 SOP与DIP SOP(Small Outline Package…

浅谈备考 系统架构师

这里写自定义目录标题 准备步骤考试形式考试内容学习考试内容训练考试内容其他觉得好的同类参考资料2023年度计算机技术与软件专业技术资格(水平)考试工作计划 第一次产生萌芽的时候三年前,当初备考没有想过要评职称或者成为什么人才&#xf…

antd3和dva-自定义组件初始化值的操作演示和自定义组件校验

前言 在antd3 (react)版和dva下,好像有的项目使用的是getFieldDecorator来获取表单的值的,现在就遇到了一个问题,getFieldDecorator针对antd自带的组件实现效果很好,除去一个form.item只能有一个getFieldDecorator的限制,其他都很好用,但是假如是自定义组件或者说在getFieldDec…

Linux内存管理7——深入理解 slab cache 内存分配全链路实现

1. slab cache 如何分配内存 当我们使用 fork() 系统调用创建进程的时候,内核需要为进程创建 task_struct 结构,struct task_struct 是内核中的核心数据结构,当然也会有专属的 slab cache 来进行管理,task_struct 专属的 slab cac…

iperf3使用

目录 写在前面:带宽和吞吐量安装使用测试TCP吞吐量测试UDP吞吐量测试上下行带宽(TCP双向传输)测试多线程TCP吞吐量测试上下行带宽(UDP双向传输)测试多线程UDP吞吐量 iperf3常用参数通用参数server端参数client端参数 i…

一种星载系统软件定义平台的设计与实现.v3

摘要 针对星载综合射频开放式系统架构,为了在软件综合层面上实现波形应用软件与具体平台的解耦,设计并实现了一种基于软件通信架构(Software Communication Architecture, SCA)的软件平台及其环境工具。通过解决星载平台软件的分…

linuxOPS基础_linux自有服务systemctl

自有服务概述 ​ 服务是一些特定的进程,自有服务就是系统开机后就自动运行的一些进程,一旦客户发出请求,这些进程就自动为他们提供服务,windows系统中,把这些自动运行的进程,称为"服务" ​ 举例…

总结888

学习目标: 月目标:6月(线性代数强化9讲2遍,背诵15篇短文,考研核心词过三遍) 周目标:线性代数强化1讲,英语背3篇文章并回诵,检测 每日必复习(5分钟&#xff…

Java 基础第八章: 接口、内部类、包装类

参考资料 :康师傅的视频课 方法 、 有继承的代码块的加载顺序:先执行父类的静态代码块、子类的静态代码块;然后,执行父类的普通代码块和构造器 子类的的普通代码块和构造器; 总结:由父到子,静…

【Web服务器】Nginx之Rewrite与location的用法

文章目录 前言一、正则表达式1. Nginx 的正则表达式2. 正则表达的优势3. Nginx 使用正则的作用 二、location 的概念1. location 和 rewrite 区别2. location 匹配的分类3. location 常用的匹配规则3.1 location 匹配优先级3.2 location 匹配的实例3.3 实际网站规则定义第一个必…

深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍

【深度学习入门到进阶】必看系列,含激活函数、优化策略、损失函数、模型调优、归一化算法、卷积模型、序列模型、预训练模型、对抗神经网络等 专栏详细介绍:【深度学习入门到进阶】必看系列,含激活函数、优化策略、损失函数、模型调优、归一化…

RabbitMQ - 发布确认

RabbitMQ - 发布确认 发布确认逻辑发布确认的策略单个确认发布批量确认发布异步确认发布 发布确认逻辑 生产者将信道设置成 confirm 模式,一旦信道进入 confirm 模式,所有在该信道上面发布的消息都将会被指派一个唯一的 ID(从 1 开始),一旦消…

什么时候 MySQL 查询会变慢?

前面几篇文章和小伙伴们聊的基本上都是从索引的角度去优化 MySQL 查询,然而,索引创建的好,并不意味着查询就一定快,影响查询效率的因素特别多,今天我们就来聊一聊这些可能影响到查询的因素。 1. 查询流程 开始今天的…

欢迎来到新世界

(1) 我去年对技术的发展是比较灰心的: 云原生:技术一直动荡,SOA->Servless、Docker->WASM、GitOpsCICDDevOps云计算:在中国从公有云走向了私有云,乃至金融云、国资云、政务云等等N种云Saa…