spark 部署

news2025/1/20 13:27:10
  1. 下载spark 安装包
    spark官网下载
    在这里插入图片描述
    pre-built with user-provided 会支持更多的hadoop,已经安装了hadoop和java环境的选这个比较好
wget https://dlcdn.apache.org/spark/spark-3.3.2/spark-3.3.2-bin-hadoop3.tgz
  1. 安装
解压
tar -xvf spark-3.3.2-bin-hadoop3.tgz -C /usr/local
改名
mv spark-3.3.2-bin-hadoop3.tgz spark
修改配置使spark 能访问hadoop
cd spark
cp conf/spark-env.sh.template conf/spark-env.sh
vim conf/spark-env.sh

最后一行添加

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/hadoop/bin/hadoop classpath)
  1. 交互
    • 本地模式
      ./bin/spark-shell --master local 单线程
      ./bin/spark-shell --master local[*] 服务器线程数 等效 ./bin/spark-shell

    • 独立集群模式:hadoop 是伪分布式布置的,spark就只能是standAlone模式
      spark://HOST:PORT 默认7077
      spark://localhost:7077

    • yarn-client 模式 调试时用
      客户端可以获得查看信息
      在这里插入图片描述

    • yarn-cluster模式 生产模式使用
      Spark的Driver节点从集群中选择
      在这里插入图片描述

程序运行 sbt
https://dblab.xmu.edu.cn/blog/804/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/943408.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【java】【项目实战】[外卖八]产品展示、购物车、下单开发

目录 一、导入用户地址簿相关功能代码 1 需求分析 2 数据模型 3 导入功能代码 3.1 实体AddressBook 3.2 Mapper接口AddressBookMapper 3.3 业务接口层AddressBookService 3.4 业务接口实现类AddressBookServiceImpl 3.5 控制层AddressBookController 4 功能测试 二、…

读SQL学习指南(第3版)笔记06_连接和集合

1. 连接 1.1. 笛卡儿积 1.1.1. 交叉连接(cross join) 1.1.2. 查询并没有指定两个数据表应该如何连接,数据库服务器就生成了笛卡儿积 1.1.2.1. 两个数据表的所有排列组合 1.1.3. 很少会用到(至少不会特意用到) 1.…

NameNode 故障无法重新启动解决方法

文章目录 NameNode 进程挂掉NameNode 进程挂掉且数据丢失 NameNode 进程挂掉 如果只是单纯的进程挂掉了,可以直接使用下列命令进行重启: hdfs --daemon start namenode示例: NameNode 进程挂掉且数据丢失 这种情况就不可以直接通过重启解决…

com.mysql.jdbc.PacketTooBigException: Packet for query is too large(windows)

使用mysql查询数据的时候报错: Caused by: com.mysql.jdbc.PacketTooBigException: Packet for query is too large (1078 > 1024). You can change this value on the server by setting the max_allowed_packet variable. 这是因为mysql的server默认接受数据…

java项目mysql转postgresql

特殊函数 : mysql: find_in_set(?, ancestors) postgresql: ? ANY (string_to_array(ancestors,,)) mysql: date_format(t1.oper_time, %Y-%m-%d) postgresql: rksj::date to_char(inDate,YYYY-MM-DD) mysql&am…

基于北斗RTK+UWB矿山智能人车定位系统

露天矿山开采环境复杂,作业危险系数高,安全生产隐患多。智能人车定位技术在保障露天矿山安全生产方面具有重要作用。通过实时监测人员和车辆的位置和行动,可以有效防止事故发生、提高工作效率和管理水平。 华安联大以露天矿山安全生产为出发…

Ubuntu 下安装Qt5.12.12无法输入中文解决方法

Ubuntu 下安装Qt5.12.12无法输入中文解决方法 一,环境: (1)VMware Workstation 15 Pro (2)Ubuntu 20.04 (3)Qt 5.12.12 64bits (4)Qt Creator 5.0.2 &#…

基于 OV5640 摄像头理论知识讲解-成像和采样原理

基于OV2640/ OV5640 的图像采集显示系统系列文章目录: (1)基于 OV5640 摄像头理论知识讲解-成像和采样原理 (2)基于 OV5640 摄像头理论知识讲解-数字接口和控制接口 (3)基于 OV5640 摄像头理论知…

Qt应用开发(基础篇)——字体选择器 QFontDialog

一、前言 QFontDialog类继承于QDialog,是一个设计用来选择字体的对话框部件。 对话框窗口QDialog QFontDialog字体选择对话框,设计用来让用户选择某一种字体,一般用于文本编辑窗口、标签显示和一些需要文本输入的场景。你可以直接使用静态函数…

2、DVWA——命令注入

文章目录 一、命令注入1.1 概述1.2 判断命令注入流程 二、low2.1 通关思路2.2.源码分析 三、Medium3.1 通关思路3.2 源码分析 四、high4.1 通关思路4.2 源码分析 五、impossible六、总结 一、命令注入 1.1 概述 命令注入的目标是通过易受攻击的应用程序在主机操作系统上执行任…

『赠书活动 | 第十八期』《深入浅出SSD:固态存储核心技术、原理与实战》

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! 『赠书活动 | 第十八期』 本期书籍:《深入浅出SSD:固态存储核心技术、原理与实战》 赠书规则:评论区:点赞&…

【力扣每日一题】2023.8.29 带因子的二叉树

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 题目给我们一些元素,让我们用这些元素连接形成特定的二叉树,每种元素可以使用任意次数,形成的二叉树要…

【深度解析】朗逸与宝来汽车:哪款更适合你?

在汽车市场中,朗逸和宝来都是非常受欢迎的车型。它们各自都有独特的优点和缺点,那么,究竟哪款车更适合你呢?让我们一起来深度解析一下。 朗逸,作为大众的入门级车型,以其稳定的性能和较高的性价比赢得了消费…

深入详解ThreadLocal

本文已收录至GitHub,推荐阅读 👉 Java随想录 微信公众号:Java随想录 原创不易,注重版权。转载请注明原作者和原文链接 文章目录 什么是ThreadLocalThreadLocal 原理set方法get方法remove方法 ThreadLocal 的Hash算法ThreadLocal …

海川润泽气泡水位计 重磅上线

一、概述 以市场为导向,海川润泽推出新款气泡水位计(型号:HC-QPSW10-S)。气泡水位计具有测量精度高,免气瓶,免测井,免维护,抗振动,寿命长等特点,特别适用于流…

印刷行业MES系统解决方案

印刷行业存在许多问题,这些问题可能因地区、技术和市场变化而有所不同。以下是一些可能的印刷行业现存问题: 1.环保问题:印刷过程中使用的化学品和材料可能对环境造成污染。废墨、废纸、有毒化学品等的处理和处理成为一个重要的问题。 2.…

优思学院|六西格玛推行为什么会失败?应如何避免?

六西格玛项目可以为企业带来丰厚的经验和巨大的利益;然而,并非所有的项目都能达到预期的效果。根据一项在国外的调查发现,在184家受访公司中,80.6%的公司声称六西格玛工作未能成功实现他们的预期的价值,74.1%的公司说他…

UG\NX二次开发 代工分享的“单个体XY排料工具”源码

文章作者:代宇(Q:873058673) 简介: 单个体XY排料,昨天代工在开发群里分享了一个排料的视频,我觉得挺有意思,就私聊要来了源码,经过作者同意可以分享给大家。请欣赏: 效果: 代码: //单个体XY排料 代工QQ:873058673 //-------------------------------…

亥姆霍兹线圈的几个特点

亥姆霍兹线圈可以用于磁学、电子学和核物理学等领域的实验研究中,是一种常见的基础实验仪器。亥姆霍兹线圈有以下几个特点: 1、磁场均匀性好:由于该线圈的结构和定位方式,使得两个线圈的磁场强度和方向都非常均匀,可以…

R语言和Python用泊松过程扩展:霍克斯过程Hawkes Processes分析比特币交易数据订单到达自激过程时间序列...

全文下载链接:http://tecdat.cn/?p25880 本文描述了一个模型,该模型解释了交易的聚集到达,并展示了如何将其应用于比特币交易数据。这是很有趣的,原因很多。例如,对于交易来说,能够预测在短期内是否有更多…