大数据下Flink on YarnSession 高可用集群环境部署开辟资源发布任务

news2025/1/23 4:49:26

前言:

搭建大数据环境集群环境算是比较麻烦的一个事情,并且对硬件要求也比较高其中搭建大数据环境需要准备jdk环境和zk环境,还有hdfs,还有ssh之间的免密操作,还有主机别名访问不通的问题 等。

必然会出现的问题:环境版本,配置问题,内存问题,节点端口通讯等。

最终效果图:

一 环境准备:

三台服务器:

jdk

jdk1.8

环境变量

hadoop

hadoop-3.1.3

版本

flink

flink-1.6.1

版本

192.168.192.150

免密登录

从1

192.168.192.151

免密登录

从2

192.168.192.152

免密登录

三台服务器设置免密登录,且配置当前主机的别名映射:

vim /etc/hosts

三台服务器的配置信息:

我这里电脑是16G运行内存,也可以看设备管理器(虚拟机设置太大运行内存虚拟机会报错,适量内存配置)

二 配置文件:

2.1 配置hadoop-env.sh文件

vim /opt/hadoop-3.1.3/etc/hadoop/hadoop-env.sh


export JAVA_HOME=/usr/local/jdk1.8.0_301

export HADOOP_HOME=/opt/hadoop-3.1.3

2.2 配置core-site.xml文件

vim /opt/hadoop-3.1.3/etc/hadoop/core-site.xml
<property>
  <name>fs.default.name</name>
  <value>hdfs://192.168.192.150:9000</value>
</property>

2.3 配置yarn-site.xml文件

vim /opt/hadoop-3.1.3/etc/hadoop/yarn-site.xml
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
  <value>192.168.192.150:8025</value>
</property>
<property>
  <name>yarn.resourcemanager.scheduler.address</name>
  <value>192.168.192.150:8030</value>
</property>
<property>
  <name>yarn.resourcemanager.address</name>
  <value>192.168.192.150:8050</value>
</property>
<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
</property>
<property>
        <name>yarn.nodemanager.pmem-check-enabled</name>
        <value>false</value>
</property>

2.4配置mapred-site.xml文件

vim /opt/hadoop-3.1.3/etc/hadoop/mapred-site.xml
<property>
  <name>mapred.job.tracker</name>
  <value>192.168.192.150:54311</value>
</property>
<property>
  <name>yarn.app.mapreduce.am.env</name>
  <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
  <name>mapreduce.map.env</name>
  <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
  <name>mapreduce.reduce.env</name>
  <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>

2.5 配置hdfs-site.xml文件

vim /opt/hadoop-3.1.3/etc/hadoop/hdfs-site.xml
<property>
  <name>dfs.replication</name>
  <value>2</value>
</property>
<property>
  <name>dfs.namenode.name.dir</name>
  <value>file:/data/hadoop/hadoop_data/hdfs/namenode</value>
</property>

2.6 配置workers文件

vim /opt/hadoop-3.1.3/etc/hadoop/workers

2.7 配置start-dfs.sh和stop-dfs.sh文件

vim /opt/hadoop-3.1.3/sbin/ start-dfs.sh
vim /opt/hadoop-3.1.3/sbin/stop-dfs.sh
HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

因为hdfs启动是root用户需要配置root配置,也可以加到/etc/profile 全局环境变量中

2.8 配置start-yarn.sh和stop-yarn.sh文件

vim /opt/hadoop-3.1.3/sbin/start-yarn.sh
vim /opt/hadoop-3.1.3/sbin/stop-yarn.sh
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

2.9 把配置好的配置复制到其他俩台节点服务器上面,直接复制/opt/hodoop3.1.3

scp -r /opt/hodoop3.1.3 slave1:/opt/

scp -r /opt/hodoop3.1.3 slave2:/opt/

三 启动集群:

3.1 初始化NameNode

/opt/hadoop-3.1.3/bin/hadoop namenode -format

(注意:这里如果jps没有namenode就需要手动启动了)

hadoop-daemon.sh start namenode

3.2 直接执行全部启动的脚本

start-all.sh

四,启动后状态

master->192.168.192.150

slave1-> 192.168.192.151

slaev2->192.168.192.152

QuorumPeerMain zookeeper的进程
ResourceManager flink进程
TaskManagerRunner flink进程
NodeManager yarn进程
NameNode HDFS进程
DataNode HDFS进程

web页面访问:

大数据地址:

http://192.168.192.150:8088

flink访问地址:

http://192.168.192.150:8081

五,采用yarn-session+ flink提交任务执行(这里有很多种任务提交,flink单服务提交,yarn-session提交)

./bin/flink run -m yarn-cluster -yn 2 -yjm 1024 -ytm 1024 -c com.xiaoyang.streaming.SocketDemoFullCount ../Flink-1.0-SNAPSHOT.jar

去hadoop界面查看任务执行情况

为啥要采用这种方式部署:

(开辟资源+提交任务)

没次创建新的flink集群任务之间互不影响,任务执行完成后对应集群也会消失。

先开辟资源再提交任务

这种会使用所以任务都会提交到一个资源,任务需要手动停止,不易于拓展和管理

六,问题记录排查和解决

6.1任务启动失败

这种问题一看就是脚本问题启动问题

错误脚本:

./bin/flink run -m yarn-cluster -yn 2 -yjm 1024 -ytm 1024 ../Flink-1.0-SNAPSHOT.jar -c com.xiaoyang.streaming.SocketDemoFullCount

正确脚本:

./bin/flink run -m yarn-cluster -yn 2 -yjm 1024 -ytm 1024 -c com.xiaoyang.streaming.SocketDemoFullCount ../Flink-1.0-SNAPSHOT.jar

6.2 集群配置问题别名

集群里面的配置最好使用ip配置,不要使用别名,这样在通讯的时候不会出现端口问题,这样启动任务的时候会有连接问题。

6.3 权限配置问题

权限配置问题需要配置要么配置到全局变量或者 指定配置里面,不然会报错。

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

6.4 hdfs 节点启动问题

主节点必须要有NameNode ,从节点要有DataNode 不然启动hdfs启动会报错。

6.5 环境变量配置问题,hadoop配置jdk环境,如果不配置启动也会报错。

6.6 配置问题 /opt/hadoop-3.1.3/etc/hadoop/目录下的配置文件

如果配置错误也会导致报错各种问题,所以配置需要仔细检查

6.7 其他问题,这里包括版本包的问题,依赖包的问题,不能太新也不能太旧

总结:

首先部署hadoop集群其实还是比较麻烦的,环境配置,各个配置的依赖,节点信息,当然部署过程难免也会遇到很多问题,但是我们在解决一个困扰很久的问题的时候你不仅在成长还会收获满满的成就感。

————没有与生俱来的天赋,都是后天的努力拼搏(我是小杨,谢谢你的关注和支持)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/346836.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

拆个微波炉,分析一下电路

微波炉是用2450MHz的超高频电磁波来加热食品&#xff0c;它能无损穿越塑料&#xff0c;陶瓷&#xff0c;不能穿越金属&#xff0c;碰到金属会反射&#xff0c;但穿过含水食物&#xff0c;食物内的分子会高速摩擦&#xff0c;产生热量&#xff0c;使食物变熟。在厨房电器中&…

自学180天,我从功能测试进阶到自动化测试了...

大家好&#xff0c;我是彭于晏&#xff0c;一个7年测试工作的老司机。因为我一直在分享自动化测试技术&#xff0c;所以时常会被问到这个问题&#xff1a;“靓仔&#xff0c;功能测试想转自动化测试&#xff0c;请问要怎么入手&#xff1f;” 那么&#xff0c;接下来我就结合自…

不愧是GitHub点赞飙升的Java10W字面经,面面俱到,太全了!

最新的喜报啊&#xff0c;话不多说&#xff0c;先看图&#xff01;&#xff08;为了保护朋友的隐私&#xff0c;同时还有我自己的隐私&#xff0c;楼主就都打码了~&#xff01;&#xff09; 朋友说到这儿时候我就跟他说&#xff0c;不要只看眼前&#xff0c;要看长远一些&#…

前端开发之防抖与节流

前端开发中我们经常会通过监听某些事件来完成项目需求 1.通过监听 scroll 事件&#xff0c;检测滚动位置&#xff0c;根据滚动位置显示返回顶部按钮 2.通过监听 resize 事件&#xff0c;对某些自适应页面调整DOM的渲染&#xff08;通过CSS实现的自适应不再此范围内&#xff09;…

动态库和静态库的区别

什么是库文件 一般来说&#xff0c;一个程序&#xff0c;通常都会包含目标文件和若干个库文件。经过汇编得到的目标文件再经过和库文件的链接&#xff0c;就能构成可执行文件。库文件像是一个代码仓库或代码组件的集合&#xff0c;为目标文件提供可直接使用的变量、函数、类等…

Hadoop3.3.0--Linux编译安装

Hadoop3.3.0–Linux编译安装 基础环境&#xff1a;Centos 7.7 编译环境软件安装目录 mkdir -p /export/server一、Hadoop编译安装&#xff08;选做&#xff09; 可以直接使用课程提供已经编译好的安装包。 安装编译相关的依赖 yum install gcc gcc-c make autoconf automake…

leaflet 上传CSV文件,导出geojson格式文件(064)

第064个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中加载CSV文件,将图形显示在地图上。点击导出geojson,下载成geojson文件。 直接复制下面的 vue+openlayers源代码,操作2分钟即可运行实现效果. 文章目录 示例效果配置方式示例源代码(共114行)安装插件…

如何判断是否ChatGPT回答出来的问题?解决方法详解

目录 前言 一、人工智能&#xff08;“ChatGPT”等&#xff09;能淘汰人类吗&#xff1f; 二、完全禁止或严格限制使用ChatGPT&#xff0c;是利大于弊还是&#xff1f; 1、ChatGPT与造纸术优点 2、人有悲欢离合&#xff0c;月有阴晴圆缺&#xff0c;此事古难全&#xff01…

Python基础-数据类型之序列

序列&#xff1a;一种数据结构&#xff0c;序列中的每个元素都会被分配到一个序号&#xff08;元素的位置&#xff09;。 常用的序列有&#xff1a;列表、元组、字符串。 一、序列的操作&#xff1a; 1&#xff1a;通过索引取值 nums_list [1,2,3,4] print(nums_list[0]) …

消息队列的特点

一、背景&#xff1a;在分布式系统中是如何处理高并发的由于在高并发的环境下&#xff0c;来不及同步处理用户发送的请求&#xff0c;则会导致请求发送阻塞。比如说&#xff0c;大量的insert、update之类的请求同时到达数据库MYSQL&#xff0c;直接导致无数的行锁表锁&#xff…

零基础机器学习做游戏辅助第十一课--原神自动钓鱼(一)

一、序言 前面我们已经学习了神经网络,卷积神经网络和强化学习等内容,也都做了对应的实例。但是我们的课是做游戏辅助,那么肯定要去游戏里实战一番。 今天就带领大家用我们所学的知识对近两年非常火爆的游戏《原神》进行实战。我们以自动钓鱼为例。 二、观察游戏玩法制定方案…

Seata源码学习(五)- Seata服务端(TC)源码解读

Seata源码分析- Seata服务端&#xff08;TC&#xff09;源码解读 上节课我们已经分析到了SQL语句最终的执行器&#xff0c;但是再往下分析之前&#xff0c;我们需要先来分析一下TM客户端与TC端通讯以后&#xff0c;TC端的具体操作 服务端表解释 我们的Seata服务端在应用的时…

RabbitMq及其他消息队列

消息队列中间价都有哪些 先进先出 Kafka、Pulsar、RocketMQ、RabbitMQ、NSQ、ActiveMQ 架构 消费推拉模式 客户端消费者获取消息的方式&#xff0c;Kafka和RocketMQ是通过长轮询Pull的方式拉取消息&#xff0c;RabbitMQ、Pulsar、NSQ都是通过Push的方式。 pull类型的消息队…

OpenCV制作Mask图像掩码

一、掩膜&#xff08;mask&#xff09; 在有些图像处理的函数中有的参数里面会有mask参数&#xff0c;即此函数支持掩膜操作&#xff0c;首先何为掩膜以及有什么用&#xff0c;如下&#xff1a; 数字图像处理中的掩膜的概念是借鉴于PCB制版的过程&#xff0c;在半导体制造中&am…

PowerShell Install VNC-Server VNC-Viewer

前言 VNCConnect是一款屏幕共享、远程控制电脑软件&#xff0c;可以让您连接到世界上任何地方的远程计算机&#xff0c;实时观看其屏幕&#xff0c;并像坐在它前面一样进行控制。RealVNC可以将人和设备连接到任何地方&#xff0c;实现控制、支持、管理、监控、培训、协作等等。…

Java——不同的子序列

题目链接 leetcode在线oj题——不同的子序列 题目描述 给定一个字符串 s 和一个字符串 t &#xff0c;计算在 s 的子序列中 t 出现的个数。 字符串的一个 子序列 是指&#xff0c;通过删除一些&#xff08;也可以不删除&#xff09;字符且不干扰剩余字符相对位置所组成的新…

【C语言学习笔记】:数组、指针相关面试题

无特殊说明情况下&#xff0c;下面所有题s目都是linux下的32位C程序。 「1、计算以下sizeof的值。」 char str1[] {a, b, c, d, e}; char str2[] "abcde";char *ptr "abcde";char book[][80]{"计算机应用基础","C语言","C程…

Apple Safari 16.3 - macOS 专属免费浏览器 (独立安装包免费下载)

Safari 浏览器 16 for macOS Montery, Big Sur 请访问原文链接&#xff1a;https://sysin.org/blog/apple-safari-16/&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&#xff1a;www.sysin.org 之前 Safari 浏览器伴随 macOS 更新一起发布&#xff…

python的opencv操作记录12——Canny算子使用

文章目录Canny算子非极大值抑制非极大值抑制中的插值滞后阈值实际应用直接使用Canny算子使用膨胀先阈值分割Canny算子 上一篇说到&#xff0c;我在一个小项目里需要在一幅图像中提取一根试管里的两种液体的截面。为了达到这个目的使用传统图像里的区域分割技术&#xff0c;实际…

脏话越多,代码越好!

你在读开源代码的时候有没有遇到过这种注释?What the fuck &#xff1f;Dude&#xff0c;WTFFuck this !我遇到过&#xff0c;每次都忍不住笑&#xff0c;心想老外可真是性情中人&#xff0c;遇到不爽的地方就开骂&#xff0c;还直接写到注释中&#xff0c;甚至代码中。Bob大叔…