ZEPPELIN部署接入华为云MRS

news2024/11/27 9:46:37

ZEPPELIN部署接入华为云MRS

    • 安装zeppelin
    • 配置Spark连接
    • 常见问题
      • 连接pg报错 Py4JJavaError: An error occurred while calling o779.load. : org.postgresql.util.PSQLException: The authentication type 5 is not supported. Check that you have configured the pg_hba.conf file to include the client's IP address or subnet, and that it is using an authentication scheme supported by the driver.
      • Zeppelin 无法正常运行本地Python环境

安装zeppelin

在网址https://zeppelin.apache.org/download.html下载安装包,
在这里插入图片描述
解压后,设置安装新的安装目录/opt/zeppelin

tar -zxvf zeppelin-0.10.1-bin-all.tgz
mv zeppelin-0.10.1-bin-all /opt/zeppelin

配置zeppelin环境变量,在profile文件中加入环境变量

vi /etc/profile
export ZEPPELIN_HOME=/opt/zeppelin
export PATH=$ZEPPELIN_HOME/bin:$PATH

source /etc/profile

编辑zeppelin-env.sh文件,加入JAVA_HOME,位置/opt/zeppelin/conf

cd /opt/zeppelin/conf/
cp zeppelin-env.sh.template zeppelin-env.sh
source /opt/client/bigdata_env
echo $JAVA_HOME
echo "export JAVA_HOME=/opt/client/JDK/jdk1.8.0_302">>zeppelin-env.sh

编辑zeppelin-site.xml文件,修改以下配置

cd /opt/zeppelin/conf
cp zeppelin-site.xml.template  zeppelin-site.xml
vi zeppelin-site.xml

<property>
  <name>zeppelin.server.addr</name>
  <value>192.168.22.157</value>
  <description>Server binding address</description>
</property>

<property>
  <name>zeppelin.server.port</name>
  <value>8081</value>
  <description>Server port.</description>
</property>

<property>
  <name>zeppelin.ssl</name>
  <value>true</value>
  <description>Should SSL be used by the servers?</description>
</property>

在conf目录下生成keystore文件

keytool -keystore keystore -alias zeppelin -genkey -keyalg RSA -sigalg SHA256withRSA -validity 365

编辑shiro.ini文件,位置/opt/zeppelin/conf/shiro.ini,增加用户developuser

cp shiro.ini.template shiro.ini
vi shiro.ini

[users]下增加用户developuser,密码Huawei@123,权限admin

developuser = Huawei@123, admin

运行zeppelin(并检查启动参数)

zeppelin-daemon.sh start
ps -elf | grep zeppelin

关闭防火墙,允许端口8443(此为测试环境,生产环境建议采取更安全措施) systtemctl stop firewalld
在浏览器中输入地址https://zeppelin_ip:8443,用developuser登陆。zeppelin_ip为安装zeppelin的HD客户端IP

配置Spark连接

对接Spark前,确认客户端工具spark-beeline能连接Spark

source /opt/client/bigdata_env
kinit -kt admin
spark-beeline

将/opt/client/Spark2x/spark/jars路径下所有的jar包拷贝至/opt/zeppelin/interpreter/spark

cp /opt/client/Spark2x/spark/jars/*.jar /opt/zeppelin/interpreter/spark/

编辑zeppelin-env.sh文件,位置/opt/zeppelin/conf,加入以下内容

export JAVA_HOME=/opt/client/JDK/jdk-8u201
export MASTER=yarn-client
export SPARK_HOME=/opt/client/Spark2x/spark
export HADOOP_CONF_DIR=/opt/client/HDFS/hadoop/etc/hadoop

关闭防火墙(提交spark任务时,能方便访问Spark Driver所在节点的端口)

  systemctl stop firewalld

登陆Zeppelin,选择右上角菜单中的 Interpreter
在这里插入图片描述
选择Spark,点击 edit 编辑,将 master 参数改为 yarn-client,并且检查zeppelin.spark.useHiveContext项,使其值为false,点击 save 保存

使用yarn-client模式,还需要将客户端的主机名与IP的映射关系添加到Yarn ResourceManager节点(本文即HD的3台主机节点)的hosts文件中。(另一种方式是在ZEPPELIN_INTP_JAVA_OPTS中添加-Dspark.driver.host=172.168.X.X)

echo "172.168.X.X 172-168-X-X">>/etc/hosts
  • 重启zeppelin。
source /opt/client/bigdata_env
kinit –kt developuser
zeppelin-daemon.sh restart

常见问题

连接pg报错 Py4JJavaError: An error occurred while calling o779.load. : org.postgresql.util.PSQLException: The authentication type 5 is not supported. Check that you have configured the pg_hba.conf file to include the client’s IP address or subnet, and that it is using an authentication scheme supported by the driver.

1、移除Spark中的“gsjdbc4-VXXXRXXXCXXSPCXXX.jar”,由于Spark运行不依赖该jar包,因此将该jar包移动到其他目录(例如,移动到“/tmp”目录,不建议直接删除)不会影响Spark正常运行。

  • 登录Spark服务端主机,移除“${BIGDATA_HOME}/FusionInsight_Spark2x_8.1.0.1/install/FusionInsight-Spark2x-*/spark/jars”路径下的“gsjdbc4-VXXXRXXXCXXSPCXXX.jar”。
  • 登录Spark客户端主机,移除“/opt/client/Spark2x/spark/jars”路径下的“gsjdbc4-VXXXRXXXCXXSPCXXX.jar”。

2、更新存储在HDFS中的“/user/spark2x/jars/8.1.0.1/spark-archive-2x.zip”压缩包。

说明:
此处版本号8.1.0.1为示例,具体以实际环境的版本号为准。
  • 使用客户端安装用户登录客户端所在节点。执行命令切换到客户端安装目录,例如“/opt/client”。
  • 执行以下命令配置环境变量。
source bigdata_env
  • 如果集群为安全模式,执行以下命令获得认证。
kinit 组件业务用户
  • 新建临时文件./tmp,并从HDFS获取“spark-archive-2x.zip”并解压到tmp目录,命令如下:
mkdir tmp

hdfs dfs -get /user/spark2x/jars/8.1.0.1/spark-archive-2x.zip ./

unzip spark-archive-2x.zip -d ./tmp
  • 切换到tmp目录,删除“gsjdbc4-VXXXRXXXCXXSPCXXX.jar”文件,并将MPPDB Driver文件“gsjdbc4.jar”上传到tmp目录中,然后执行以下命令重新打包。
zip -r spark-archive-2x.zip *.jar
  • 删除HDFS上的“spark-archive-2x.zip”,将步骤3.e中新生成的压缩包“spark-archive-2x.zip”更新至HDFS的“/user/spark2x/jars/8.1.0.1/”路径下。
hdfs dfs -rm /user/spark2x/jars/8.1.0.1/spark-archive-2x.zip

hdfs dfs -put ./spark-archive-2x.zip /user/spark2x/jars/8.1.0.1

Zeppelin 无法正常运行本地Python环境

在华为云客户端的目录下找到spark-defaults.conf加入指向运行主机IP的配置

vim /opt/client/Spark2x/spark/conf/spark-defaults.conf
spark.driver.host = 192.168.x.x    #客户端IP

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/627122.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenMMLab-AI实战营第二期——3-1.深度学习预训练与MMPretrain

文章目录 1. MMPreTrain算法库介绍1.1 算法库与任务组成1.2 框架概览 2. 经典主干网络2.1 ResNet2.2 Vision Transformer 3. 自监督学习3.1 SimCLR3.2 MAE3.3 iBOT 4. 多模态算法4.1 CLIP4.2 BLIP 视频链接&#xff1a;b站-深度学习预训练与MMPretrain 1. MMPreTrain算法库介绍…

高并发下如何保证接口幂等性?

文章目录 前言&#xff1a; 一、insert前先select 二、加悲观锁 三、加乐观锁 四、加唯一索引 五、建防重表 六、根据状态机 七、加分布式锁 八、获取token 前言&#xff1a; 接口幂等性问题&#xff0c;对于开发人员来说&#xff0c;是一个跟语言无关的公共问题。本文分…

粮油食品行业MES系统源码

MES系统可以提供全面的生产过程监控和数据分析&#xff0c;帮助企业实现智能化、数字化生产。同时&#xff0c;MES系统可以优化生产计划和物料配送&#xff0c;降低废品率和能耗&#xff0c;提高生产效率和质量&#xff0c;降低生产成本&#xff0c;增加利润。 一、粮油MES系统…

C#,彩票数学——彩票预测是玄学还是数学?什么是彩票分析?怎么实现彩票号码的预测?

彩票原理系列文章 彩票与数学——彩票预测是玄学还是数学&#xff1f;https://mp.csdn.net/mp_blog/creation/editor/122517043彩票与数学——常用彩票术语的统计学解释https://mp.csdn.net/mp_blog/creation/editor/122474853彩票与数学——彩票缩水的数学概念与原理https://…

小狐狸ChatGPT创作系统如何添加AI文本创作自定义模型,自定义模型方法

后台根据自己的定位选建好类别管理 具体模型文档参照如下对应修改或新增,格式 :模型标题+描述+模型内容+提示文字 模型标题描述模型内容提示文字写一篇文章用你喜欢的语言写一篇关于任何主题的文章用[TARGETLANGGE]写一篇关于[PROMPT]的文章输入文章的主题,然后按发送键按…

【微信小程序插件】下拉刷新、下拉加载

概述 今天在优化小程序的列表时候&#xff0c;想要把原生的 scroll-view 组件替换成一个下拉刷新的组件&#xff0c;然后就找了一下&#xff0c;果然有大神已经封装好。coolui-scroller 就是这样满足需求的一款插件&#xff0c;但是微信官网给出的描述以及安装引入的方式&…

Python读取CSV文件的几种方法

话不多说&#xff0c;开干&#xff01;&#xff01;&#xff01; 目录 1. 使用 csv 模块 2.使用 numpy 库 3.使用pandas库 4.使用标准库中的 csv 模块 5.注意事项 1. 使用 csv 模块 &#xff08;1&#xff09;项目目录如下图所示&#xff1a; &#xff08;2&#xff09;…

皕杰报表中的图表钻取

皕杰报表中图表的钻取是通过超链接实现的&#xff0c;其实质就是通过超链接打开了一张的新表&#xff0c;而把原表中的条件通过参数传递给新表&#xff0c;从而得到我们所需的明细数据。 超链接的地址在单元格的超链接地址属性里添加属性值&#xff0c;如果超链接字符串不需要动…

企业级微服务架构实战项目--xx优选1

一 项目概述 1.1 项目概述 xx优选项目&#xff1a;是依托社区和团长社交关系实现生鲜商品流通的新零售模式。 1.2 技术栈 1.3 功能架构图 第2部分 1.4 技术架构* 1.5 工程结构 ssyx-parent&#xff1a;父工程&#xff0c;根目录&#xff0c;管理子模块&#xff1a; ​ comm…

如何自动化的对PCAP数据包进行suricata/snort/zeek分析

在前一篇文章中&#xff0c;这里介绍了dalton的安装&#xff0c;以及使用dalton中的多种探针手动分析pcap数据包。在和其他程序联动的时候&#xff0c;手动分析无法满足要求&#xff0c;本篇文章将介绍如何通过使用dalton提供的API进行数据包的自动化分析。 在手动提交数据包分…

从零手写操作系统之RVOS系统调用实现-09

从零手写操作系统之RVOS系统调用实现-09 系统模式&#xff1a;用户态和内核态如何让任务运行在用户态下 系统模式的切换用户模式下访问特权指令测试系统调用系统调用执行流程系统调用传参规范系统调用封装 系统调用完整流程解析执行测试 本系列参考: 学习开发一个RISC-V上的操作…

基于html+mysql+Spring+mybatis+Springboot的Springboot宠物医院管理系统

运行环境: 最好是java jdk 1.8&#xff0c;我在这个平台上运行的。其他版本理论上也可以。 IDE环境&#xff1a; Eclipse,Myeclipse,IDEA或者Spring Tool Suite都可以&#xff0c;如果编译器的版本太低&#xff0c;需要升级下编译器&#xff0c;不要弄太低的版本 tomcat服务器环…

一般人不要轻易去自学网络安全(黑客)

笔者本人 17 年就读于一所普通的本科学校&#xff0c;20 年 6 月在三年经验的时候顺利通过校招实习面试进入大厂&#xff0c;现就职于某大厂安全联合实验室。 我为啥说自学黑客&#xff0c;一般人我还是劝你算了吧&#xff01;因为我就是那个不一般的人。 首先我谈下对黑客&a…

[游戏开发][Unity]Assetbundle下载篇(1)热更前准备与下载AB包清单

热更流程都不是固定的&#xff0c;每个人写的状态机也有所差别&#xff0c;但是一些必要步骤肯定不可能少&#xff0c;例如下载清单&#xff0c;对比版本&#xff0c;下载AB包&#xff0c;标记下载完成。我接下来的每一篇文章都是下载AB包的重要步骤&#xff0c;大概率是不能省…

Kibana:使用 Kibana 自带数据进行可视化(三)

在今天的练习中&#xff0c;我们将使用 Kibana 自带的数据来进行一些可视化的展示。希望对刚开始使用 Kibana 的用户有所帮助。这是这个系列的第三篇文章。这个是继上一篇文章 “Kibana&#xff1a;使用 Kibana 自带数据进行可视化&#xff08;二&#xff09;” 的续篇。 前提条…

学成在线----day5

1、媒资管理需求分析 2、为什么要用网关 当前要开发的是媒资管理服务&#xff0c;目前为止共三个微服务&#xff1a;内容管理、系统管理、媒资管理&#xff0c;如下图&#xff1a; 后期还会添加更多的微服务&#xff0c;当前这种由前端直接请求微服务的方式存在弊端&#xff…

微服务架构中的数据一致性:解决方案与实践| 得物技术

1 为什么要做服务之间的数据一致性 作为互联网公司的研发工程师&#xff0c;微服务的架构思想对于各位读者朋友来说&#xff0c;已经不是陌生东西。我们当中的大多数人&#xff0c;或多或少经历过从单体应用到微服务化的系统拆分和演进过程。我们按照庞大系统的业务功能和特征…

都说网络安全渗透工程师前景好,好在哪?

渗透工程师前景非常好&#xff0c;网络安全发展规模不断扩大&#xff0c;未来行业类的人才需求也会越来越多。就目前看来在网络安全方向上就业的薪资待遇也十分可观。 其就业方向有很广泛&#xff0c;如网络安全工程师&#xff0c;渗透测试工程师等。 渗透测试人员通常对网络…

keras搭建轻量级卷积神经网络CNN开发构建国家一级保护动物识别分析系统,集成开发GradCAM实现热力图分析可视化

动物识别相关的项目本质上属于图像识别&#xff0c;在我之前的博文中已经有过不少实践了&#xff0c;感兴趣的话可以自行移步阅读即可&#xff0c;这里不是说想要单纯地去做一个动物识别的项目&#xff0c;昨晚在玩手机的时候突然被小孩问到一个动物是不是国家保护动物&#xf…

SpringBoot 事件监听处理(五十一)

当死亡笼罩在脑海&#xff0c;请用生的信念打败它 上一章简单介绍了Retry重试机制(五十), 如果没有看过,请观看上一章 参考文章: https://blog.csdn.net/qq_37758497/article/details/118863308 一. Spring 事件监听 Spring的事件监听(也叫事件驱动)是观察者模式的一种实现&…