VMware创建Linux虚拟机之(五)Spark完全分布式部署教程

news2024/11/18 16:46:53

 Hello,转眼间已到2022年底,学期末……

总体来说,今年经历了很多,真正的成长了许多,成熟了许多。

只能说,希望,明天依旧美好!!!


 🐒本篇博客使用到的工具有:VMware16 ,Xftp7

若不熟悉操作命令,推荐使用带GUI页面的CentOS7虚拟机

我将使用带GUI页面的虚拟机演示

虚拟机(Virtual Machine)

指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。在实体计算机中能够完成的工作在虚拟机中都能够实现。在计算机中创建虚拟机时,需要将实体机的部分硬盘和内存容量作为虚拟机的硬盘和内存容量。每个虚拟机都有独立的CMOS、硬盘和操作系统,可以像使用实体机一样对虚拟机进行操作。

【确保服务器集群安装和配置已经完成!】可参考我的博客:

VMware创建Linux虚拟机之(一)实现免密登录_Vim_飞鱼的博客-CSDN博客

VMware创建Linux虚拟机之(二)下载安装JDK与配置Java环境变量_Vim_飞鱼的博客-CSDN博客

VMware创建Linux虚拟机之(三)Hadoop安装与配置及搭建集群_Vim_飞鱼的博客-CSDN博客_利用vmware虚拟机安装hadoop

VMware创建Linux虚拟机之(四)ZooKeeper&HBase完全分布式安装_Vim_飞鱼的博客-CSDN博客_在vmware中hbase的安装和配置

前言


请根据读者的自身情况,进行相应随机应变。

我的三台CentOS7服务器:
主机:master(192.168.149.101)
从机:slave1(192.168.149.102)
从机:slave2(192.168.149.103)

每一个节点的安装与配置是相同的,在实际工作中,通常在master节点上完成安装和配置后,然后将安装目录通过 scp 命令复制到其他节点即可。

注意:所有操作都是root用户权限,需要我们登陆时选择root用户登录。


唯有热爱,可抵岁月漫长,唯有热爱,不畏世间无常!


继Mapreduce之后,作为新一代并且是主流的计算引擎,学好Spark是非常重要的,这一篇博客会专门介绍如何部署一个分布式的Spark计算框架,在之后的博客中,会继续讲到Spark的基本模块的介绍以及底层原理,好了,废话不多说,直接开始吧!

下载Spark安装包


 部署Spark时,我们使用的版本如下所示:

Apache Spark™ - Unified Engine for large-scale data analyticsicon-default.png?t=M85Bhttps://spark.apache.org/

 解压Spark安装包


        首先,需要确保 network 网络已经配置好,使用 Xftp 等类似工具进行上传,把 spark-3.1.2-bin-hadoop3.2.tgz 上传到 opt/ 目录内。(也可使用U盘等工具拖拽)
上传完成后,在 master 主机上执行以下代码: 解压Spark

cd /opt/

tar -zxvf spark-3.1.2-bin-hadoop3.2.tgz

执行成功后,系统在 opt 目录自动创建 spark-3.1.2 子目录。

  注意:可使用 ls 等命令查看文件解压是否无误。


 配置bashrc文件(等同于profile)


#Spark

export SPARK_HOME=/opt/spark-3.1.2

export PATH=$SPARK_HOME/bin:$PATH

三台虚拟机均进行此操作 


修改spark-env.sh文件


[root@master conf]# cp spark-env.sh.template spark-env.sh

[root@master conf]# vim spark-env.sh

[root@master conf]# 

 添加如下内容:

export JAVA_HOME=/opt/jdk1.8.0_261

export HADOOP_HOME=/opt/hadoop/hadoop

export SPARK_MASTER_IP=master

export SPARK_MASTER_PORT=7077

export SPARK_DIST_CLASSPATH=$(/opt/hadoop/hadoop/bin/hadoop classpath)

export HADOOP_CONF_DIR=/opt/hadoop/hadoop/etc/hadoop

export SPARK_YARN_USER_ENV="CLASSPATH=/opt/hadoop/hadoop/etc/hadoop"

export YARN_CONF_DIR=/opt/hadoop/hadoop/etc/hadoop

如下图所示:


 将spark拷贝到其他两个节点


[root@master conf]# scp -r /opt/spark-3.1.2/ slave1:/opt/

[root@master conf]# scp -r /opt/spark-3.1.2/ slave2:/opt/

启动spark集群并查看进程


  master:

[root@master opt]# /opt/spark-3.1.2/sbin/start-all.sh

starting org.apache.spark.deploy.master.Master, logging to /opt/spark-3.1.2/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out
slave1: starting org.apache.spark.deploy.worker.Worker, logging to /opt/spark-3.1.2/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave1.out
slave2: starting org.apache.spark.deploy.worker.Worker, logging to /opt/spark-3.1.2/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave2.out
master: starting org.apache.spark.deploy.worker.Worker, logging to /opt/spark-3.1.2/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-master.out

[root@master opt]# jps
3860 Worker
3677 Master
3886 Jps

slave1:

[root@slave1 ~]# jps
1749 Worker
1806 Jps

[root@slave1 ~]# 

 slave2:

[root@slave2 ~]# jps
3667 Jps
3590 Worker

[root@slave2 ~]# 

启动spark检测是否能正常启动

启动local模式:spark-shell --master local

[root@master hadoop]# cd /opt/spark-3.1.2/conf/

[root@master conf]# spark-shell --master local
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/opt/spark-3.1.2/jars/slf4j-log4j12-1.7.30.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/opt/hadoop/hadoop/share/hadoop/common/lib/slf4j-reload4j-1.7.36.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory]
2022-12-21 22:01:54,437 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
Spark context Web UI available at http://leader:4040
Spark context available as 'sc' (master = local, app id = local-1671631329749).
Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 3.1.2
      /_/
         
Using Scala version 2.12.10 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_261)
Type in expressions to have them evaluated.
Type :help for more information.

scala> 

结合实例,可以看到我们的 Spark 组件已经完美部署完成!

💪

请问,你学废了吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/107164.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

12 系统数据库和数据库工具

1. 系统数据库 Mysql数据库安装完成后会给我们初始化四个数据库: mysql:存储Mysql服务器正常运行所需要的各种信息(市区、主从、用户、权限)information_schema:提供了访问数据库元数据的各种表和视图,包…

SpringBoot之Redis整合

目录 在pom.xml中添加启动器 application.yml添加配置 API测试 存取字符串类型 存取哈希类型 等效操作redis 字符串类型 本人idea&#xff1a;2020.1.3 springboot&#xff1a;2.7.6 redis&#xff1a;5.0.14.1可用 在pom.xml中添加启动器 <dependency>…

北漂外卖小哥转行程序员,他说:想让家人过上更好的生活,扎心

前言&#xff1a; 对于程序员转行送外卖的新闻我们见得很多了&#xff0c;但是从一名外卖小哥转行做一名Python程序员的新闻&#xff0c;反倒见的很少&#xff0c;但是每年转行做程序员的人大有人在。 朋友16年本科毕业后就开始自己创业&#xff0c;1年后创业失败了&#xff…

SOT23-6 领夹麦克风PD OTG协议芯片

一、简介 目前主流的无线麦克风&#xff0c;或者主播麦克风等等产品&#xff0c;在无线端的技术&#xff0c;基本上就是围绕这三个方向 1、U段方案&#xff0c;这个是最古老&#xff0c;也是应用最多的方案&#xff0c;缺点就是功耗高&#xff0c;成本高 2、非标准的2.4G方案…

第3章 SQL语言

第3章 SQL语言 考试范围&#xff1a; 3.1-3.10 考试题型&#xff1a;计算题 考试内容&#xff1a; &#xff08;可按标准sql、mysql的语法格式来写SQL语句&#xff0c;考试时要求有无明显语法错误&#xff09; Select Insert Delete Update create table alter table …

vTESTstudio入门到精通 - vTESTstudio工具栏介绍_Tools

今天即将介绍一个非常有用的工具栏 - Tool&#xff0c;它可以可视化创建、编辑我们车载网络中常用的dbc、Autosar系统描述文件、LDF、FIBEX、CANdelaStudio、Car2x数据库等文件&#xff0c;基本涵盖了我们用到的所有&#xff0c;大家非常有必要详细的了解下&#xff0c;在有需要…

干扰管理学习日志9-------强化学习_联邦学习_功率分配

目录一、文章概述二、系统环境三、理论模型1.系统目标2.公式推导四、应用算法1.顶层设计2.强化学习(1)输入状态(2)输出动作(3)环境反馈3.联邦学习4.伪代码五、性能表征1.泛化性本文是对论文《Transmit Power Control for Indoor Small Cells: A Method Based on Federated Rein…

数据仓库环境准备完整使用 (第四章)

数据仓库环境准备完整使用一、IDEA 开发环境准备1、创建项目gmall-realtime2、删除当前项目的src目录并创建gmall-realtime模块3、创建子项目4、导入依赖5、创建相关的包6、在 resources 目录下创建 log4j.properties 文件&#xff0c;写入如下内容二、数据仓库运行环境(ODS)1、…

(野火征途 Altera EP4CE10)硬件说明

开发板买了好久了&#xff0c;但是一直都没有去学习。本着不浪费的想法&#xff0c;且通过记笔记来监督自己. FPGA FPGA是一种可以重构电路的芯片&#xff0c;是一种硬件可重构的体系结构。通过编程&#xff0c;用户可以随时改变它的应用场景&#xff0c;它可以模拟CPU、GPU等…

第13章 事务

第13章 事务 考试范围&#xff1a; 13.1-13.10 考试题型&#xff1a; 事务操作 考试内容&#xff1a; 1、事务的概念与特性(ACID) 概念 A transaction is a unitof program execution that accesses and possibly updates various data items事务是程序执行的单元&#xff…

云原生|kubernetes|CKA真题解析-------(11-17题)

第十一题&#xff1a; 创建多容器的pod 题目要求&#xff1a;解析&#xff1a; 多容器pod的创建&#xff0c;先创建一个单容器的pod&#xff0c;然后在此基础上修改即可 解答&#xff1a; 先创建单容器的pod kubectl run kucc1 --imagenginx --dry-runclient -oyaml >11…

css实现环形进度条

效果&#xff1a; 纯css实现进度条&#xff0c;这里用到的核心属性为box-show&#xff0c;box-show可以控制元素的阴影&#xff0c;通过控制元素阴影的移动位置来实现进度条效果。 .box{box-show : 0px 0px 0px 0px #ccc; }box-show有5个参数 第一个参数&#xff1a; 控制元…

第4章 中级SQL

第4章 中级SQL 考试范围&#xff1a; 4.1-4.7 考试题型&#xff1a; 计算题 考试内容&#xff1a; 连接类型&#xff08;与第3章合并考察&#xff09; 视图的定义与使用 事务&#xff08;与17-19章合并考察&#xff09; 完整性的概念 SQL中如何定义、修改各类完整性(Pr…

JVS低代码多账号统一登录介绍

登录操作演示 统一登录能力 JVS整个系统认证采用Oauth2 认证方案&#xff0c;目前支持目前登陆方式如下&#xff1a; 登录方式 说明 账号密码登录 基于JVS的用户名用户密码登录 手机动态验证码登录 基于JVS用户绑定的手机号动态验证码登录 微信扫码关注公众号登录 基于…

web前端-javascript-Math对象(说明和方法,它封装了数学运算相关的属性和方法)

文章目录Math 对象1. 说明2. 方法1) abs()2) Math.ceil()3) Math.floor()4) Math.round()5) Math.random()6) max 和 min7) Math.pow(x,y)8) Math.sqrt()Math 对象 1. 说明 Math 和其他的对象不同&#xff0c;它不是一个构造函数它属于一个工具类不用创建对象&#xff0c;它里…

仿真设计|基于51单片机的简易抢答器

目录 前言 具体实现功能 设计介绍 51单片机简介 设计方案 资料内容 仿真实现&#xff08;protues8.7&#xff09; 程序&#xff08;Keil5&#xff09; 全部资料&#xff08;压缩文件&#xff09; 前言 全部资料包括程序(Keil5)、protues仿真(protues8.7)、仿真视频、…

教育领域知识图谱

教育领域开源的知识图谱实体 在教育领域,有许多开源的知识图谱实体可供使用。下面列出了一些例子: DBpedia:这是一个知识图谱,由 Wikipedia 的内容构建而成。DBpedia 中包含了许多关于人、地方、事物和概念的实体,并且这些实体都具有相关的属性和关系。 Wikidata:这是一个…

LeetCode算法之--二叉树系列

点赞收藏&#xff0c;以防遗忘 本文【程序大视界】已收录&#xff0c;关注免费领取互联网大厂学习资料&#xff0c;添加博主好友进群学习交流&#xff0c;欢迎留言和评论&#xff0c;一起交流共同进步。 【一】前言 二叉树也是面试算法的常见题型&#xff0c;通常程序会自定义…

Go秒杀系统——RabbitMQ核心概念与工作模式

前言&#x1f4ac; Windows 上的 RabbitMQ 被我卸载了&#xff0c;在 macOS 上再安装一下&#xff0c;采用 brew install 还是挺方便的。 很好奇微软的程序员写代码用的是 Windows 操作系统吗&#xff1f;感觉有点不方便&#xff0c;但用 macOS 岂不是太丢撵了。 一、macOS 安装…

APS排程软件提升电子产品生产企业的服务效益

"3C产品"&#xff0c;就是计算机、通信和消费类电子产品三者结合&#xff0c;也称"信息家电"。由于3C产品的体积一般都不大&#xff0c;所以往往在中间加一个"小"字&#xff0c;故往往统称为"3C小家电"。 据报道&#xff0c;某一科技公…